- À Propos du Projet
- Fonctionnalités
- Technologies Utilisées
- Prise en Main
- Utilisation
- Exemples de Résultats
- Perspectives du Projet
- Contribuer
- Remerciements
Ce projet consiste à utiliser un modèle d'apprentissage automatique pour prédire les chances de survie des passagers du Titanic en utilisant le jeu de données bien connu de Kaggle : Titanic - Machine Learning from Disaster.
En se basant sur des caractéristiques telles que l'âge, le sexe, la classe du billet, etc., le modèle entraîne un réseau de neurones pour estimer la probabilité de survie de chaque passager.
- Traitement des données manquantes et encodage des variables catégorielles.
- Standardisation des données pour améliorer l'entraînement du modèle.
- Construction d'un modèle de réseau de neurones avec TensorFlow/Keras.
- Utilisation de la validation croisée et de l'arrêt anticipé pour éviter le surapprentissage (overfitting).
- Génération d'un fichier de soumission CSV pour Kaggle.
- Langages : Python
- Bibliothèques :
- Pandas pour la manipulation des données
- Numpy pour les calculs numériques
- TensorFlow/Keras pour la création et l'entraînement du modèle
- Scikit-learn pour la normalisation et la division des données
- Python 3.x installé
- pip pour la gestion des paquets
- Cloner le dépôt :
```sh
git clone https://github.com/callbak/Titanic-MachineLearning-FromDisaster.git
cd Titanic-MachineLearning-FromDisaster
```
- Installer les dépendances :
```sh
pip install -r requirements.txt
```
- Assurez-vous que les fichiers `train.csv` et `test.csv` se trouvent dans le répertoire racine du projet.
- Exécuter le script principal :
```sh
python main.py
```
- Vérifier les résultats dans le fichier `submission.csv` généré.
On constate que, lors des 10 premiers et derniers 'epochs', la précision ('accuracy') et la fonction de perte ('loss') se sont continuellement améliorées, aussi bien pendant l'entraînement que durant la phase de validation ('validation split'). Cela indique une convergence progressive du modèle vers des performances optimales.
Merci à Kaggle pour le jeu de données Titanic - Machine Learning from Disaster

