Banco Interamericano de Desenvolvimento
facebook
twitter
youtube
linkedin
instagram
Abierto al públicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoIndustrias CreativasLa Maleta AbiertaMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente¿Y si hablamos de igualdad?Inicial
Administração pública Água e saneamento Ciência, Tecnologia e Inovação Conhecimento Aberto Comércio e integração regional Desenvolvimento da primeira infância Desenvolvimento urbano e habitação Educação Efetividade no desenvolvimento Energia Gênero e diversidade Indústrias Criativas Meio ambiente, mudança climática e salvaguardas Política e gestão fiscal Saúde Segurança pública e Justiça Trabalho e pensões
  • Skip to main content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Ideação

Inovação em Gestão Pública

  • INÍCIO
    • Sobre o blog
    • Guia editorial
  • CATEGORIAS
    • Agricultura
    • Água e saneamento
    • Cidades
    • Ciência e tecnologia
    • Comércio
    • Educação
    • Empresas e negócios
    • Energia
    • Gênero
    • Gestão de projetos
    • Gestão pública
    • Ideação
    • Infraestrutura
    • Meio ambiente
    • Mercados financeiros
    • Saúde
    • Segurança
    • Trabalho
    • Turismo sustentável
  • Autores

3 dicas úteis para compartilhar com sucesso seus bancos de dados

09/09/2021 por Carolina Huart Deixe um comentário


Transforme seu conjunto de dados em informações relevantes para usuários em potencial

A qualidade dos dados é crucial para a disseminação científica. Cada usuário de dados pode consultar o mesmo conjunto de dados, mas ter uma pergunta de pesquisa diferente. A partir de sua pesquisa original, você pode transformar seus dados em informações úteis e valiosas para outros usuários. 

Os conjuntos de dados podem ser muito variados dependendo da ciência em estudo e para dar sentido a eles é necessário ter um plano e avaliar novas formas de pensar sobre o esquema inicial de dados. O DQA (Data Quality Assurance) é o processo de verificação da confiabilidade e eficácia que inclui atualizar dados, padronizá-los e controlá-los para criar uma visão única dos dados. Neste blog, damos algumas dicas iniciais para realizar esse processo.

1. Organize

Use técnicas para organizar e coletar seus dados de forma proativa. Para organizar nossos dados, cada conjunto de dados deve ter uma variável que identifique exclusivamente observações (identificadores únicos). Cada linha nos dá a observação particular de cada variável e cada coluna nos dá as informações sobre uma característica particular de toda a amostra do conjunto de dados.

Observe que um identificador único é uma variável que define claramente cada uma das unidades de observação no conjunto de dados. Por exemplo: números de série de dados sobre um determinado produto, números aleatórios gerados para identificar usuários que respondem a uma pesquisa, etc.

2. Limpe

Mantenha seus dados limpos para evitar duplicações e erros durante todo o ciclo de vida de sua pesquisa. Lembre-se que a falta de qualidade pode levar, entre outros problemas técnicos, a ineficiências operacionais.

Alguns exemplos de dados impuros são:

  • Títulos de categoria inconsistentes.
  • Valores numéricos no mesmo campo de observação que suporta apenas texto.
  • Valores textuais em um campo numérico, como CEP.
  • Dados duplicados.
  • Erros de codificação e formatação UTF-8, como caracteres especiais.
  • Valores sem referência.   

Algumas recomendações para agilizar esse processo:  

  • Certifique-se de que os dados estão alinhados em colunas apropriadas.
  • Verifique se não há dados perdidos ou valores anômalos. 
  • Procure por exceções, para identificar se houve uma possível contaminação de dados.
  • Remova campos que são desnecessários.
  • Verifique se os campos não contêm informações relevantes sobre as pessoas.

3. Formate seus dados

Comece com linhas tabulares de dados brutos para garantir que os dados coletados estejam em um formato utilizável para análise. Um conjunto de dados consiste em observações e variáveis individuais e geralmente é exibido em tabelas. Para fins de usabilidade geral, uma vez feito o formato, exporte-o para uma planilha na forma de um arquivo “.csv valores separados por vírgula”, que é um formato universal onde as diferentes colunas são separadas por vírgulas. Esses arquivos podem ser abertos e processados por programas como MS Excel ou Google Sheets, bem como por pacotes estatísticos mais avançados, incluindo Python, R, Pandas, SPSS ou STATA.

Caso seu conjunto de dados tenha um tamanho que não possa ser visualizado por programas de planilha mais tradicionais, você precisará de um sistema de gerenciamento de banco de dados (DBMS) que permita visualizar os dados de backend (quando dizemos backend queremos dizer as tabelas dentro do banco de dados). Nesse caso, será necessário garantir que os relatórios que os usuários executam, a partir dos dados, sejam precisos e considerando que geralmente existem vários bancos de dados, o objetivo não é apenas o que está nas tabelas, mas também como eles estão relacionados.

Seguindo um fluxo de trabalho semelhante, você pode garantir dados de qualidade a partir da coleta e organização, seguidos de decisões metodológicas e limpeza de dados, à visualização e análise; isso permitirá que você apresente um conjunto de dados significativo que seja fácil para outros usuários explorarem e analisarem. Após seguir essas três etapas, não se esqueça de documentar qual o significado das variáveis dentro de um dicionário de dados.


Arquivado em:Gestão de projetos Marcado com:bancos de dados, conhecimento aberto, pesquisa

Carolina Huart

Carolina Huart faz parte da equipe da Biblioteca Felipe Herrera e trabalha como bibliotecária especializada para o Setor de Integração e Comércio do BID. Trabalhou para a iniciativa Números para o Desenvolvimento (N4D), desde seu início no BID, em 2015, e seu trabalho nessa área se concentrou na supervisão de políticas institucionais para melhorar a gestão, preservação e intercâmbio de dados. Por meio de boas práticas de gerenciamento de dados de pesquisa (RDM) e curadoria digital (preservação e preservação), ela fornece aos pesquisadores os meios para estruturar dados e construir com eficácia a segurança, adequação, descoberta e reutilização futuras. Carolina apoia voluntariamente o trabalho de organizações que promovem a comunicação científica e a reprodutibilidade de dados de pesquisa, como "Fair Data" e "Data Citation Principles".

Reader Interactions

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Primary Sidebar

Receba nosso conteúdo exclusivo

ASSINE

Pesquisar

Ideação

Banco de inovação em gestão pública no Brasil

Categorias

Você pode se interessar por

  • Cinco dicas para construir consultas públicas significativas
  • Como criar um mapa de partes interessadas em seu projeto – parte #2
  • Quer aumentar o sucesso do seu projeto? Aprenda a gerenciar riscos

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube

    Blogs escritos por funcionários do BID:

    Copyright © Inter-American Development Bank ("IDB"). Este trabalho está sob a licença de Creative Commons IGO 3.0 Attribution-NonCommercial-NoDerivatives. (CC-IGO 3.0 BY-NC-ND) e pode ser reproduzido com atribuição ao BID para fins não comerciais. Trabalhos derivados não são permitidos. Qualquer disputa relacionada ao uso dos trabalhos do BID que não possam ser acordados de maneira amigável deve ser submetida à arbitragem de acordo com as regras da UNCITRAL. O uso do nome do BID para qualquer finalidade além de atribuição e o uso da logo do BID está sujeita a um acordo de licença separado entre o Banco e o usuário e não é parte da licença de CC- IGO. Note que o link proporcionado sobre a licença Creative Commons inclui termos e condições adicionais.


    Blogs escritos por autores externos:

    Para qualquer dúvida relacionada ao direito de copyright de artigos produzidos por autores que não são funcionários do BID, por favor preencher o formulário de contato para este blog.

    As opiniões expressadas neste blog são dos autores e não refletem necessariamente as opiniões do BID, seu Conselho Executivo, ou de seus países membros.

    Atribuição: além de atribuir o trabalho ao autor respectivo e ao dono do direito de copyright, conforme o caso, apreciamos se você pode incluir um link para o blog do BID.



    Política de privacidade

    Copyright © 2025 · Magazine Pro em Genesis Framework · WordPress · Log in

    Banco Interamericano de Desarrollo

    Aviso Legal

    Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

    facebook
    twitter
    youtube