Banco Interamericano de Desenvolvimento
facebook
twitter
youtube
linkedin
instagram
Abierto al públicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoIndustrias CreativasLa Maleta AbiertaMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente¿Y si hablamos de igualdad?Inicial
Administração pública Água e saneamento Ciência, Tecnologia e Inovação Conhecimento Aberto Comércio e integração regional Desenvolvimento da primeira infância Desenvolvimento urbano e habitação Educação Efetividade no desenvolvimento Energia Gênero e diversidade Indústrias Criativas Meio ambiente, mudança climática e salvaguardas Política e gestão fiscal Saúde Segurança pública e Justiça Trabalho e pensões
  • Skip to main content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Ideação

Inovação em gestão pública no Brasil

  • INÍCIO
    • Sobre o blog
    • Guia editorial
  • CATEGORIAS
    • Agricultura
    • Água e saneamento
    • Cidades
    • Ciência e tecnologia
    • Comércio
    • Educação
    • Empresas e negócios
    • Energia
    • Gênero
    • Gestão de projetos
    • Gestão pública
    • Ideação
    • Infraestrutura
    • Meio ambiente
    • Mercados financeiros
    • Saúde
    • Segurança
    • Trabalho
    • Turismo sustentável
  • Autores

3 dicas úteis para compartilhar com sucesso seus bancos de dados

09/09/2021 por Carolina Huart Deixe um comentário


Transforme seu conjunto de dados em informações relevantes para usuários em potencial

A qualidade dos dados é crucial para a disseminação científica. Cada usuário de dados pode consultar o mesmo conjunto de dados, mas ter uma pergunta de pesquisa diferente. A partir de sua pesquisa original, você pode transformar seus dados em informações úteis e valiosas para outros usuários. 

Os conjuntos de dados podem ser muito variados dependendo da ciência em estudo e para dar sentido a eles é necessário ter um plano e avaliar novas formas de pensar sobre o esquema inicial de dados. O DQA (Data Quality Assurance) é o processo de verificação da confiabilidade e eficácia que inclui atualizar dados, padronizá-los e controlá-los para criar uma visão única dos dados. Neste blog, damos algumas dicas iniciais para realizar esse processo.

1. Organize

Use técnicas para organizar e coletar seus dados de forma proativa. Para organizar nossos dados, cada conjunto de dados deve ter uma variável que identifique exclusivamente observações (identificadores únicos). Cada linha nos dá a observação particular de cada variável e cada coluna nos dá as informações sobre uma característica particular de toda a amostra do conjunto de dados.

Observe que um identificador único é uma variável que define claramente cada uma das unidades de observação no conjunto de dados. Por exemplo: números de série de dados sobre um determinado produto, números aleatórios gerados para identificar usuários que respondem a uma pesquisa, etc.

2. Limpe

Mantenha seus dados limpos para evitar duplicações e erros durante todo o ciclo de vida de sua pesquisa. Lembre-se que a falta de qualidade pode levar, entre outros problemas técnicos, a ineficiências operacionais.

Alguns exemplos de dados impuros são:

  • Títulos de categoria inconsistentes.
  • Valores numéricos no mesmo campo de observação que suporta apenas texto.
  • Valores textuais em um campo numérico, como CEP.
  • Dados duplicados.
  • Erros de codificação e formatação UTF-8, como caracteres especiais.
  • Valores sem referência.   

Algumas recomendações para agilizar esse processo:  

  • Certifique-se de que os dados estão alinhados em colunas apropriadas.
  • Verifique se não há dados perdidos ou valores anômalos. 
  • Procure por exceções, para identificar se houve uma possível contaminação de dados.
  • Remova campos que são desnecessários.
  • Verifique se os campos não contêm informações relevantes sobre as pessoas.

3. Formate seus dados

Comece com linhas tabulares de dados brutos para garantir que os dados coletados estejam em um formato utilizável para análise. Um conjunto de dados consiste em observações e variáveis individuais e geralmente é exibido em tabelas. Para fins de usabilidade geral, uma vez feito o formato, exporte-o para uma planilha na forma de um arquivo “.csv valores separados por vírgula”, que é um formato universal onde as diferentes colunas são separadas por vírgulas. Esses arquivos podem ser abertos e processados por programas como MS Excel ou Google Sheets, bem como por pacotes estatísticos mais avançados, incluindo Python, R, Pandas, SPSS ou STATA.

Caso seu conjunto de dados tenha um tamanho que não possa ser visualizado por programas de planilha mais tradicionais, você precisará de um sistema de gerenciamento de banco de dados (DBMS) que permita visualizar os dados de backend (quando dizemos backend queremos dizer as tabelas dentro do banco de dados). Nesse caso, será necessário garantir que os relatórios que os usuários executam, a partir dos dados, sejam precisos e considerando que geralmente existem vários bancos de dados, o objetivo não é apenas o que está nas tabelas, mas também como eles estão relacionados.

Seguindo um fluxo de trabalho semelhante, você pode garantir dados de qualidade a partir da coleta e organização, seguidos de decisões metodológicas e limpeza de dados, à visualização e análise; isso permitirá que você apresente um conjunto de dados significativo que seja fácil para outros usuários explorarem e analisarem. Após seguir essas três etapas, não se esqueça de documentar qual o significado das variáveis dentro de um dicionário de dados.


Arquivado em:Gestão de projetos Marcado com:bancos de dados, conhecimento aberto, pesquisa

Carolina Huart

Carolina Huart faz parte da equipe da Biblioteca Felipe Herrera e trabalha como bibliotecária especializada para o Setor de Integração e Comércio do BID. Trabalhou para a iniciativa Números para o Desenvolvimento (N4D), desde seu início no BID, em 2015, e seu trabalho nessa área se concentrou na supervisão de políticas institucionais para melhorar a gestão, preservação e intercâmbio de dados. Por meio de boas práticas de gerenciamento de dados de pesquisa (RDM) e curadoria digital (preservação e preservação), ela fornece aos pesquisadores os meios para estruturar dados e construir com eficácia a segurança, adequação, descoberta e reutilização futuras. Carolina apoia voluntariamente o trabalho de organizações que promovem a comunicação científica e a reprodutibilidade de dados de pesquisa, como "Fair Data" e "Data Citation Principles".

Reader Interactions

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Primary Sidebar

Receba nosso conteúdo exclusivo

ASSINE

Pesquisar

Ideação

Banco de inovação em gestão pública no Brasil

Categorias

Você pode se interessar por

  • Cinco dicas para construir consultas públicas significativas
  • Como criar um mapa de partes interessadas em seu projeto – parte #2
  • Quer aumentar o sucesso do seu projeto? Aprenda a gerenciar riscos

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube

Blogs escritos por funcionários do BID:

Copyright © Inter-American Development Bank ("IDB"). Este trabalho está sob a licença de Creative Commons IGO 3.0 Attribution-NonCommercial-NoDerivatives. (CC-IGO 3.0 BY-NC-ND) e pode ser reproduzido com atribuição ao BID para fins não comerciais. Trabalhos derivados não são permitidos. Qualquer disputa relacionada ao uso dos trabalhos do BID que não possam ser acordados de maneira amigável deve ser submetida à arbitragem de acordo com as regras da UNCITRAL. O uso do nome do BID para qualquer finalidade além de atribuição e o uso da logo do BID está sujeita a um acordo de licença separado entre o Banco e o usuário e não é parte da licença de CC- IGO. Note que o link proporcionado sobre a licença Creative Commons inclui termos e condições adicionais.


Blogs escritos por autores externos:

Para qualquer dúvida relacionada ao direito de copyright de artigos produzidos por autores que não são funcionários do BID, por favor preencher o formulário de contato para este blog.

As opiniões expressadas neste blog são dos autores e não refletem necessariamente as opiniões do BID, seu Conselho Executivo, ou de seus países membros.

Atribuição: além de atribuir o trabalho ao autor respectivo e ao dono do direito de copyright, conforme o caso, apreciamos se você pode incluir um link para o blog do BID.



Política de privacidade

Copyright © 2023 · Magazine Pro em Genesis Framework · WordPress · Log in

Banco Interamericano de Desarrollo

Aviso Legal

Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

facebook
twitter
youtube
We use cookies on our website to give you the most relevant experience by remembering your preferences and repeat visits. By clicking “Accept”, you consent to the use of ALL the cookies.
Cookie settingsACCEPT
Manage consent

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Always Enabled

Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.

Non-necessary

Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.

SAVE & ACCEPT