Python · Open Source · PyPI
CEPEA, CONAB, IBGE, NASA POWER, USDA, IMEA e mais 7 fontes — 13 origens, uma API unificada com fallback automático, cache inteligente e contratos versionados.
Camada Semântica
Datasets abstraem múltiplas fontes com fallback automático. Quando CEPEA retorna 403, o agrobr busca Notícias Agrícolas. Quando o servidor cai, serve do cache.
from agrobr import datasets
# Uma linha. Fallback automático. Cache DuckDB.
df = await datasets.preco_diario("soja")
df = await datasets.producao_anual("soja", ano=2023)
df = await datasets.estimativa_safra("soja", safra="2024/25")
df = await datasets.credito_rural("soja", safra="2024/25")
df = await datasets.exportacao("soja", ano=2024)
Infraestrutura
Fonte primária falha → tenta secundária → serve do cache. Transparente.
Histórico permanente local. Sem re-download. Séries temporais acumuladas.
Schema garantido por dataset. Breaking changes só em major. Semver.
httpx nativo com sync wrapper. Funciona em Jupyter, FastAPI e Airflow.
Modelos tipados. Sanity checks estatísticos. Fingerprinting de layout.
Reprodutibilidade total via contextvars. Para papers e auditorias.
Fontes de dados
Cada fonte tem seu próprio parser com versionamento, fingerprinting e tratamento de encoding. Você só vê o DataFrame.
Começar
MIT License. 949 testes. 13 fontes. 8 datasets. Documentação completa.