-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathtext_classification.html
More file actions
144 lines (121 loc) · 7.64 KB
/
text_classification.html
File metadata and controls
144 lines (121 loc) · 7.64 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
<meta name="description" content="">
<meta name="author" content="">
<title>Text Classification</title>
<!-- Bootstrap core CSS -->
<link href="bootstrap/css/bootstrap.min.css" rel="stylesheet">
<link href="custom/custom.css" rel="stylesheet">
</head>
<body>
<!-- Navigation -->
<nav aria-label="breadcrumb">
<ol class="breadcrumb">
<li class="breadcrumb-item"><a href="index.html">Home</a></li>
<li class="breadcrumb-item active" aria-current="page">Text Classification</li>
</ol>
</nav>
<!-- Page Content -->
<div class="container">
<div class="row mt-5">
<div class="col-md-7">
<h1>Text Classification</h1>
<p>โจทย์ส่วนใหญ่ของ NLP นั้นสามารถแก้ได้ด้วยการสร้างเครื่องจำแนกประเภทข้อความ (Text Classifier) ซึ่งมี machine learning algorithm เป็นแกนหลัก (สามารถศึกษาพื้นฐานของ machine learning จาก module <a href="sentiment_analysis.html">sentiment analysis</a>)
ปัจจุบันนี้คนหันมาใช้ Neural Network กันมากขึ้นโดยใช้พื้นฐานของความหมายของคำที่กำหนดโดยบริบทและการใช้ภาษา (Distributed semantic model หรือ distributional semantic model)ในคลังข้อมูลเป็นหลัก
</p>
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/zNy4L0NiAW8" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-3">
<p>Video List: </p>
<ol>
<li><a href="https://youtu.be/zNy4L0NiAW8">Text Classification คืออะไร</a></li>
<li><a href="https://youtu.be/YzidkwV50-c">Logistic Regression แบบไม่ต้องเขียนสมการ</a></li>
<li><a href="https://youtu.be/ybLYX657iwE">Crossentropy Loss ของ Logistic Regression</a></li>
<li><a href="https://youtu.be/gslc4zK1RRg">วิธีการฝึกโมเดลด้วย scikit-learn</a></li>
<li><a href="https://youtu.be/VqfCLWZOFPw">Sparse features and sparse matrix</a></li>
<li><a href="https://youtu.be/ggbIamllu3c">Data structure: numpy array and dense matrix</a></li>
<li><a href="https://youtu.be/CgspAzU0nSw">Data structure: Sparse Matrix</a></li>
</ol>
<p>เนื้อหาสำหรับอ่านและอ้างอิง</p>
<ul>
<li><a href="slides/text_classification_part1.pdf">Slides จากวิดีโอเรื่อง Text classification</a></li>
<li><a href="https://web.stanford.edu/~jurafsky/slp3/4.pdf">Chapter 4 จาก Jurafsky</a></li>
<li><a href="https://web.stanford.edu/~jurafsky/slp3/5.pdf">Chapter 5 จาก Jurafsky</a></li>
</ul>
</div>
</div>
<div class="row mt-5">
<div class="col-md-7">
<h2>Logistic regression (MaxEnt)</h2>
<p>Logistic Regression หรือ Maximum Entropy Model (MaxEnt) นับว่าเป็น machine learning model ที่สำคัญที่สุด เพราะไม่ต้องปรับจูนเยอะและสามารถพัฒนามาประยุกต์ใช้ได้อย่างรวดเร็ว
และมีประสิทธิภาพพอสมควรโดยไม่ต้องลงแรงมาก</p>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/YzidkwV50-c" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/ybLYX657iwE" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<div class="row mt-5">
<div class="col-md-7">
<h2>MaxEnt โดยใช้ sklearn (Python)</h2>
<p>scikit-learn เป็น Python package ที่มีฟังก์ชันและโมเดล machine learning ต่างๆ ไว้เพรียบพร้อม และทันสมัยอัพเดทตลอด คนที่ต้องใช้ NLP หรือ Machine learning ทุกคนควรจะเรียนรู้ไว้เป็นพื้นฐานในการทดสอบการสร้าง classifier</p>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
วิธีการฝึกโมเดลด้วย scikit-learn
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/gslc4zK1RRg" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
Sparse features and sparse matrix
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/VqfCLWZOFPw" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
Data structure: numpy array and dense matrix
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/ggbIamllu3c" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
Data structure: Sparse Matrix
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/CgspAzU0nSw" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<footer class="page-footer font-small">
<div class="container">
<div class="row">
<div class="col-md-12 py-3">
<div class="flex-center">
<hr/>
</div>
</div>
</div>
<div class="footer-copyright text-right py-3 mb-5">© 2020 Copyright: Attapol Thamrongrattanarit</div>
</div>
</footer>
<!-- Bootstrap core JavaScript -->
<script src="jquery/jquery.min.js"></script>
<script src="bootstrap/js/bootstrap.bundle.min.js"></script>
</body>
</html>