Diabetes Classification Using Decision Tree

Project Overview

This project focuses on predicting diabetes in patients using a Decision Tree Classifier. The model is trained on medical diagnostic data to classify whether a patient is diabetic or non-diabetic. The project demonstrates a complete machine learning pipeline from data loading to model evaluation and visualization.

Dataset

The dataset consists of medical attributes commonly used for diabetes diagnosis.

Features

Pregnancies
Glucose
BloodPressure
SkinThickness
Insulin
BMI
DiabetesPedigreeFunction
Age

Target

Outcome
- 0 → Non-Diabetic
- 1 → Diabetic

Technologies Used

Python
Pandas
NumPy
Matplotlib
Seaborn
Scikit-learn
Graphviz
Google Colab

Workflow

Load dataset using Pandas
Perform basic data inspection
Split dataset into training and testing sets (80:20)
Train Decision Tree Classifier
Evaluate model accuracy
Visualize decision tree

Model Training

from sklearn.tree import DecisionTreeClassifier

Model Evaluation


y_pred = model.predict(x_test)
accuracy_score(y_test, y_pred)

Accuracy

74.67%

Decision Tree Visualization

import graphviz

graphviz.Source(export_graphviz(
    model,
    feature_names=x.columns,
    filled=True
))

Project Structure

├── diabetes.csv ├── diabetes_decision_tree.ipynb ├── README.md

Future Improvements

Handle zero values using imputation Hyperparameter tuning Feature selection Compare with other models (SVM, Random Forest) Model deployment using Flask or FastAPI

Author

Saravanavel E AI & Data Science Student GitHub: https://github.com/SaravanavelE

License

This project is intended for educational and academic use.

model = DecisionTreeClassifier() model.fit(x_train, y_train)

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Diabetes_Classification_using_Decision_Tree.ipynb		Diabetes_Classification_using_Decision_Tree.ipynb
README.md		README.md
diabetes.csv		diabetes.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Diabetes Classification Using Decision Tree

Project Overview

Dataset

Features

Target

Technologies Used

Workflow

Model Training

Model Evaluation

Accuracy

Decision Tree Visualization

Project Structure

Future Improvements

Author

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Diabetes Classification Using Decision Tree

Project Overview

Dataset

Features

Target

Technologies Used

Workflow

Model Training

Model Evaluation

Accuracy

Decision Tree Visualization

Project Structure

Future Improvements

Author

License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages