Este repositório contém um app Streamlit para explorar o dataset IDD 2023 do INEP Fonte dos dados: INEP — Indicadores de qualidade da educação superior (Dados Abertos). Acessado em 23/10/2025. O foco é analisar o Indicador de Diferença entre os Desempenhos Observado e Esperado (IDD) por curso, IES e UF.
project_ods_educacao/ (ou raiz do projeto)
├─ data/
│ ├─ geojson/
│ │ └─ br_states.json # GeoJSON de estados (necessário para o choropleth)
│ └─ processed/
│ └─ idd_processed.csv
├─ src/
│ └─ data_prep.py # funções de limpeza e processamento
├─ IDD_2023.xlsx # dataset (fornecido)
├─ streamlit_app.py # app principal (atualize se necessário)
├─ requirements.txt
└─ README.md (este arquivo)
- Crie um ambiente virtual e ative.
python -m venv .venv #Criação do Ambiente virtual
source venv/bin/activate # Ativação no Linux / macOS
venv\Scripts\activate # Ativação no Windows- Instale dependências:
pip install -r requirements.txtou
pip install pandas streamlit plotly pyarrow openpyxl- Garanta que o arquivo
IDD_2023.xlsxesteja no mesmo diretorio do appstreamlit_app.py(ou ajuste a variávelDATA_RAWno código). - Coloque o GeoJSON de estados em
data/geojson/br_states.json(recomendado) para ativar o mapa choropleth por UF. Exemplo de download (terminal):
mkdir -p data/geojson
curl -L -o data/geojson/br_states.json \
https://raw.githubusercontent.com/giuliano-macedo/geodata-br-states/main/geojson/br_states.json- Rode:
streamlit run streamlit_app.py- Filtros por área, UF e modalidade (o filtro de Ano pode ter sido removido tendo em vista que os dados são de 2023).
- KPIs: média/mediana do IDD, número de cursos, total de concluintes.
- Histogramas, barras por UF, scatter de participantes x IDD.
- Mapa choropleth por UF — requer
data/geojson/br_states.json. - Tabela filtrada com opção de download CSV.
- Script
src/data_prep.pyrealiza limpeza básica: normalização de nomes de colunas, conversão de tipos, tratamento de nulos e exportação para CSV/Parquet para leitura rápida.
- Para ativar o choropleth por UF, coloque o GeoJSON de estados em
data/geojson/br_states.json(recomendo o arquivo do repositório giuliano-macedo/geodata-br-states). - Nota: arquivos municipais permitem detalhe por município, mas são grandes — simplifique (mapshaper) antes de usar no app para evitar lentidão.