-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathPrincipleComponentAnalysis.py
More file actions
34 lines (23 loc) · 1.07 KB
/
PrincipleComponentAnalysis.py
File metadata and controls
34 lines (23 loc) · 1.07 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
"""
PCA (Temel Bileşen Analizi), bir veri setindeki boyut sayısını (özellik sayısını) azaltmak için kullanılan istatistiksel bir tekniktir.
Ne Yapar?
Veri setindeki en fazla varyansı (bilgiyi) taşıyan yeni, bağımsız eksenler (bileşenler) bulur.
İlk bileşen, en çok bilgiyi içerir. İkinci bileşen, kalan bilgiden en çoğunu içerir, vb.
Modelinizi eğitmek için orijinal özelliklerin tamamını değil, bu en önemli bileşenlerin sadece ilk birkaçını seçerek boyutu büyük ölçüde düşürürsünüz.
Temel Amaç: Bilgi kaybını minimuma indirerek, hesaplama maliyetini düşürmek ve veriyi görselleştirmeyi kolaylaştırmaktır.
"""
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
iris = load_iris()
X= iris.data
y = iris.target
pca = PCA(n_components=2)
X_pca=pca.fit_transform(X)
plt.figure()
for i in range(len(iris.target_names)):
plt.scatter(X_pca[y==i,0],X_pca[y==i,1],label=iris.target_names[i])
plt.xlabel("PC1")
plt.ylabel("PC2")
plt.title("PCA of Iris Dataset")
plt.show()