Este projeto implementa um pipeline completo e robusto para treinar e avaliar modelos de Deep Learning para a detecção da Doença de Chagas a partir de sinais de ECG de 8 derivações da base de dados eCODE.
O fluxo de trabalho inclui pré-processamento de dados, otimização de hiperparâmetros, treinamento, otimização de limiar de classificação e avaliação final com geração de relatórios e gráficos.
-
Estrutura de Pastas: Certifique-se de que a pasta
eCODE, contendo todos os subdiretórios de sinais (S0000000,S0010000, etc.), esteja localizada dentro da pastadata/. -
Ambiente Virtual: É altamente recomendado criar um ambiente virtual para isolar as dependências do projeto.
python3 -m venv .venv source .venv/bin/activate -
Instalar Dependências: Instale todas as bibliotecas necessárias.
pip install -r requirements.txt
-
Pré-processar os Dados (apenas uma vez): Cria o
master_dataset.csva partir dos dados brutos.python3 preprocess.py
-
Dividir os Dados (apenas uma vez): Cria os arquivos
train_split.csv,val_split.csvetest_split.csv.python3 split_data.py
-
Otimizar Hiperparâmetros: Encontra os melhores parâmetros e os salva em
outputs/best_params.json.python3 -m src.optimize --model transformer --n-trials 20 --n-folds 5
-
Treinar e Avaliar o Modelo Final: Lê os melhores parâmetros do passo anterior e executa o treinamento final e a avaliação completa.
python3 -m src.train --model cnn --epochs 20
-
Monitorar o treinamento:
tensorboard --logdir=runs