Ref: conicData: Publicação OficialDoc: Artigo Técnico

1. RESUMO

O Brasil enfrenta uma crise de desinformação de larga escala, e o dado público oficial, que poderia servir de contraponto factual ao debate, nem sempre chega a quem precisa dele. Embora oficial e garantido em lei, o acervo de dados sobre os municípios brasileiros está espalhado por portais distintos, em formatos incompatíveis e sem acesso programático padronizado, o que cria uma barreira técnica para o público não especializado. Este trabalho propõe e desenvolve um ecossistema de software com dois projetos complementares: uma interface de programação de aplicações (API) nacional, que coleta, normaliza e centraliza esses dados a partir das fontes oficiais, e o OBDOu (Observatório de Dados de Ourinhos), aplicação regional construída sobre a API, que oferece um agente de inteligência artificial para responder a perguntas sobre Ourinhos e sua região imediata. A metodologia segue uma abordagem orientada aos dados (data-first): a estrutura do sistema parte da inspeção das fontes reais. Os resultados preliminares incluem o mapeamento das fontes e o primeiro módulo de dados, o Produto Interno Bruto (PIB) municipal, deflacionado para comparação ao longo do tempo.
Palavras-chave: dados abertos; dados públicos municipais; desinformação; API; inteligência artificial.

2. INTRODUÇÃO

O Brasil vive uma crise de desinformação de larga escala. A pesquisa Panorama Político 2024, do Instituto DataSenado, ouviu 21.808 pessoas e apurou que 72% dos usuários de redes sociais (o equivalente a 67% da população com 16 anos ou mais) viram, nos seis meses anteriores, notícias que desconfiavam ser falsas; 81% consideram que essas notícias podem afetar de forma significativa o resultado de uma eleição (DATASENADO, 2024). Um levantamento do Instituto Locomotiva, no mesmo ano, apontou que cerca de 90% dos brasileiros admitem já ter acreditado em algum conteúdo falso (AGÊNCIA BRASIL, 2024). Os temas mais recorrentes deste conteúdo são políticas públicas, economia e propostas de campanha, áreas em que há dados oficiais capazes de funcionar como contraponto factual.
O acesso à informação pública é, além disso, um direito garantido pela Lei nº 12.527/2011 (Lei de Acesso à Informação, LAI). Diversos órgãos federais divulgam grandes volumes de dados sobre os municípios: o Instituto Brasileiro de Geografia e Estatística (IBGE) publica indicadores econômicos e demográficos; o Sistema de Informações Contábeis e Fiscais do Setor Público (SICONFI), finanças públicas; o Departamento de Informática do SUS (DATASUS), estatísticas de saúde. Em tese, esse acervo poderia ser uma base factual acessível a qualquer cidadão.
Na prática, porém, esses dados são de difícil acesso. Cada órgão mantém o próprio portal, com interfaces heterogêneas, formatos incompatíveis e, muitas vezes, sem mecanismo padronizado de acesso programático; cruzar indicadores de fontes distintas exige baixar e tratar arquivos separados à mão. Some-se a isso um déficit de transparência no nível local. A Escala Brasil Transparente (EBT) da Controladoria-Geral da União, que mede o cumprimento da LAI, avaliou de forma sistemática apenas os municípios com mais de 50 mil habitantes: 665 dos 5.570 municípios brasileiros, cerca de 12% (CGU, 2021). A grande maioria, formada por pequenos municípios, ficou fora de qualquer avaliação regular. O dado oficial que poderia ancorar o debate público é, portanto, disperso e, em boa parte do território, opaco.
Esse cenário define o problema de pesquisa deste trabalho: como reduzir a barreira de acesso aos dados públicos municipais brasileiros, de modo que sejam úteis tanto a desenvolvedores quanto a usuários sem formação técnica? A hipótese é a de que uma infraestrutura única de dados, somada a uma camada de interação baseada em inteligência artificial, reduz essa barreira de forma significativa e aproxima o cidadão da informação oficial.

3. OBJETIVOS

O objetivo geral é desenvolver um ecossistema de software que centralize e democratize o acesso aos dados públicos municipais brasileiros. Como objetivos específicos, definem-se: (a) levantar e mapear as principais fontes oficiais de dados públicos municipais; (b) construir uma API nacional alimentada por um processo automatizado de extração, transformação e carga (ETL) que colete e normalize esses dados em um modelo unificado; (c) desenvolver o OBDOu, aplicação regional dotada de um agente de inteligência artificial que consulta a API por chamadas de ferramenta (tool calls); e (d) avaliar em que medida a solução reduz a barreira de acesso para usuários sem formação técnica.

4. METODOLOGIA

Trata-se de pesquisa aplicada, de caráter exploratório, voltada ao desenvolvimento de um artefato de software. O método segue uma abordagem orientada aos dados (data-first): a modelagem do banco e o desenho dos pontos de acesso da API partem da inspeção direta dos dados das fontes oficiais, e não de definições prévias. Isso evita suposições equivocadas sobre a estrutura dos dados e reduz o retrabalho.
Os procedimentos compreendem: (i) levantamento das fontes oficiais (IBGE, SICONFI, DATASUS, INEP e TSE); (ii) coleta e inspeção dos arquivos de cada fonte; (iii) construção de um pipeline de ETL que extrai, limpa e normaliza os dados e, no caso de valores monetários, os deflaciona para preços constantes; (iv) modelagem e armazenamento em banco PostgreSQL; (v) exposição dos dados por uma API em GraphQL; e (vi) desenvolvimento da camada de inteligência artificial do OBDOu, que consome a API para responder a consultas em linguagem natural.

5. DESENVOLVIMENTO

A solução tem dois projetos distintos e complementares. O primeiro é a API de dados municipais, uma camada de infraestrutura genérica e sem recorte geográfico: um banco PostgreSQL exposto via GraphQL, em que cada cliente pede exatamente os campos de que precisa. O segundo é o OBDOu, a aplicação regional construída sobre essa API: um observatório que aproxima o dado oficial do público de Ourinhos e de sua região. Esse recorte adota a Região Geográfica Imediata de Ourinhos, agrupamento de municípios definido pela divisão regional do IBGE (IBGE, 2017). A distinção é importante: o alcance nacional vem da API, e o foco regional vem do OBDOu, que funciona como um filtro sobre a infraestrutura comum.
O OBDOu é implementado como um harness de agente de inteligência artificial: a camada de software que transforma o modelo de linguagem, de gerador de texto, em um agente capaz de agir sobre um sistema real. Dentro do harness, em vez de responder só com o conhecimento estatístico do treinamento (sujeito a invenções, as chamadas alucinações), o modelo recebe um conjunto de ferramentas (tools) e opera em um ciclo: interpreta a pergunta, escolhe a ferramenta e emite uma chamada estruturada (tool call); o harness executa essa chamada contra a API de dados municipais e devolve o resultado; com ele, o modelo formula a resposta final, fundamentada no dado oficial. No OBDOu, essas ferramentas são consultas à API restritas aos municípios da região imediata de Ourinhos, o que mantém o agente ancorado em uma base factual verificável.
Esse desenho responde diretamente ao problema da desinformação: ao obrigar o modelo a consultar o dado oficial antes de responder, o harness reduz o espaço para respostas inventadas e entrega ao cidadão uma informação rastreável até a fonte. No modelo de cinco estrelas de dados abertos de Berners-Lee (2010), a fragmentação das fontes oficiais brasileiras corresponde a um estágio intermediário, em que os dados estão publicados, mas ainda não são plenamente reutilizáveis. É essa lacuna que a infraestrutura proposta procura preencher.
O primeiro módulo implementado é o PIB dos municípios, divulgado pelo IBGE para a série de 2002 a 2023 (IBGE, 2025). Como os valores saem a preços correntes, aplicou-se um deflator para expressá-los em valores constantes; assim, separa-se o crescimento real do efeito da inflação e a série fica comparável ao longo do período. Há aqui uma limitação: não existe deflator municipal específico, então se aplica um índice nacional de preços à série local, uma aproximação aceitável para a comparação pretendida. A inspeção revelou também uma descontinuidade importante. Os anos de 2002 a 2021 trazem a abertura setorial do valor adicionado bruto (VAB), mas, por causa da reformulação do Sistema de Contas Nacionais, 2022 e 2023 trazem apenas o PIB e o PIB per capita. Essa limitação foi documentada e tratada, e ilustra a heterogeneidade que justifica a abordagem orientada aos dados.

6. RESULTADOS PRELIMINARES

Por ser pesquisa em andamento, os resultados aqui descritos são os primeiros achados. Até o momento, concluíram-se o levantamento e o mapeamento das principais fontes oficiais e a definição da arquitetura de dois projetos: a API em PostgreSQL com GraphQL e o OBDOu como harness de agente de inteligência artificial.
O primeiro módulo, o PIB municipal (IBGE, 2002–2023), está em tratamento: a coleta e o deflacionamento dos valores já foram feitos e a estruturação no modelo relacional está em curso; a exposição via GraphQL e o harness do OBDOu seguem em implementação. A descontinuidade do VAB setorial a partir de 2022 foi tratada de forma explícita, sem esconder a limitação da fonte.
Um aprendizado já aparece: a heterogeneidade de formatos e a falta de padronização entre as fontes foram obstáculos concretos logo no primeiro módulo. Isso confirma o problema de pesquisa e reforça as duas escolhas centrais do projeto, a infraestrutura unificadora e a abordagem orientada aos dados, que evitou fixar um esquema cedo demais.
As próximas etapas são concluir a API em GraphQL e o harness do OBDOu e incorporar novos módulos. Para o módulo de Comércio Exterior, com base no Comex Stat (MDIC/Secex), os indicadores já foram mapeados (saldo comercial, valor unitário e índices de concentração). Depois dele, virão módulos de finanças públicas, saúde e educação.

7. FONTES CONSULTADAS

AGÊNCIA BRASIL. Quase 90% dos brasileiros admitem ter acreditado em fake news. Brasília: EBC, 1 abr. 2024. Disponível em: https://agenciabrasil.ebc.com.br/geral/noticia/2024-04/quase-90-dos-brasileiros-admitem-ter-acreditado-em-fake-news. Acesso em: 19 jun. 2026.

BERNERS-LEE, T. Linked Data. W3C, 2006. Atualizado em 2010. Disponível em: https://www.w3.org/DesignIssues/LinkedData.html. Acesso em: 19 jun. 2026.

BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Regula o acesso a informações previsto na Constituição Federal. Brasília: Presidência da República, 2011. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm. Acesso em: 19 jun. 2026.

CONTROLADORIA-GERAL DA UNIÃO (CGU). CGU divulga resultado da 2ª edição da Escala Brasil Transparente – Avaliação 360°. Brasília: CGU, 15 mar. 2021. Disponível em: https://www.gov.br/cgu/pt-br/assuntos/noticias/2021/03/cgu-divulga-resultado-da-2a-edicao-da-escala-brasil-transparente-avaliacao-360deg. Acesso em: 19 jun. 2026.

DATASENADO. Panorama Político 2024: notícias falsas e democracia. Brasília: Senado Federal, 2024. Disponível em: https://www.senado.leg.br/institucional/datasenado/relatorio_online/pesquisa_fake_news/2024/interativo.html. Acesso em: 19 jun. 2026.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Divisão regional do Brasil em regiões geográficas imediatas e regiões geográficas intermediárias: 2017. Rio de Janeiro: IBGE, 2017. Disponível em: https://biblioteca.ibge.gov.br/index.php/biblioteca-catalogo?view=detalhes&id=2100600. Acesso em: 19 jun. 2026.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Produto Interno Bruto dos Municípios: Brasil: 2022-2023. Rio de Janeiro: IBGE, 2025. Disponível em: https://www.ibge.gov.br/estatisticas/economicas/contas-nacionais/9088-produto-interno-bruto-dos-municipios.html. Acesso em: 19 jun. 2026.

← Voltar ao Início