-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathinformation_extraction.html
More file actions
159 lines (132 loc) · 7.94 KB
/
information_extraction.html
File metadata and controls
159 lines (132 loc) · 7.94 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
<meta name="description" content="">
<meta name="author" content="">
<title>Information Extraction</title>
<!-- Bootstrap core CSS -->
<link href="bootstrap/css/bootstrap.min.css" rel="stylesheet">
<link href="custom/custom.css" rel="stylesheet">
</head>
<body>
<!-- Navigation -->
<nav aria-label="breadcrumb">
<ol class="breadcrumb">
<li class="breadcrumb-item"><a href="index.html">Home</a></li>
<li class="breadcrumb-item active" aria-current="page">Information Extraction</li>
</ol>
</nav>
<!-- Page Content -->
<div class="container">
<div class="row mt-5">
<div class="col-md-7">
<h1>Information Extraction</h1>
<p>NLP เป็นเทคนิคที่สำคัญในการสกัดความรู้ออกจากข้อมูลที่เป็นข้อความที่มีขนาดใหญ่เกินที่คนจะสามารถอ่านเองได้หมด ข้อมูลที่สกัดนี้มักจะถูกจัดอยู่ในรูปแบบที่เป็นมาตรฐานที่สามารถนำไปวิเคราะห์ต่อไปได้</p>
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/36L00fdRl3I" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-3">
<p>Video List: </p>
<ol>
<li><a href="https://youtu.be/36L00fdRl3I">Information Extraction คืออะไร</a></li>
<li><a href="https://youtu.be/R0iFkwmpyTQ">Part-of-speech tagging และ Base NP Chunking</a></li>
<li><a href="https://youtu.be/LgQwsosz-e8">Named-entity recognition การรู้จำเอ็นทิตี</a></li>
<li><a href="https://youtu.be/jn6XA9aVlkI">Sequence labeling model</a></li>
<li><a href="https://youtu.be/1Zj2h6JmSUg">NER System Evaluation</li>
<li><a href="https://youtu.be/VZcBQpoHAk0">Conditional Random Fields</a></li>
<li><a href="https://youtu.be/AGl1a1NzY-c">Viterbi decoding สำหรับ CRF</a></li>
<li><a href="https://youtu.be/zoXe0DFduNA">ตัวอย่างการรัน CRF Viterbi decoding</a></li>
<li><a href="https://youtu.be/7EIW2gdtxGM">การฝึกโมเดล CRF</a></li>
</ol>
<p>Slides</p>
<ul>
<li><a href="slides/info_extraction_crf.pdf">Slides จากวิดีโอ</a></li>
</ul>
</div>
</div>
<div class="row mt-5">
<div class="col-md-7">
<h2>Named-Entity Recognition (NER)</h2>
<p>NER คือการดึงข้อมูลที่เราอยากได้ออกจากข้อความ เหมือนกับการให้เครื่องทา highlight ส่วนของข้อความที่เราสนใจโดยอัตโนมัติ</p>
</div>
</div>
<div class="row mt-2">
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/R0iFkwmpyTQ" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/LgQwsosz-e8" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<div class="row mt-5">
<div class="col-md-7">
<h2>Sequence Labeling model</h2>
<p>Sequence labeling model เป็นโมเดลประเภทหนึ่งที่สามารถดึงส่วนข้อความที่สนใจออกจากข้อความหลัก โมเดล Sequece labeling ที่เป็นที่นิยมคือ Conditional Random Fields (CRF) และ Recurrent Neural Network</p>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/jn6XA9aVlkI" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/1Zj2h6JmSUg" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<div class="row mt-5">
<div class="col-md-7">
<h2>Conditional Random Fields</h2>
<p>Conditional Random Fields (CRF) เป็น sequence model ที่ได้รับความนิยมมากที่สุดเนื่องจากทำงานได้ดี train ได้โดยใช้เวลาไม่มาก ไม่ต้อง tune hyperparamters ให้ยุ่งยาก คนทำ NLP ทุกคนจำเป็นต้องใช้ model นี้ให้คล่อง</p>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/VZcBQpoHAk0" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/AGl1a1NzY-c" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<div class="row mt-4">
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/zoXe0DFduNA" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
<div class="col-md-5">
<div class="embed-responsive embed-responsive-16by9">
<iframe class="embed-responsive-item" src="https://www.youtube.com/embed/7EIW2gdtxGM" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
</div>
</div>
</div>
<footer class="page-footer font-small">
<div class="container">
<div class="row">
<div class="col-md-12 py-3">
<div class="flex-center">
<hr/>
</div>
</div>
</div>
<div class="footer-copyright text-right py-3 mb-5">© 2020 Copyright: Attapol Thamrongrattanarit</div>
</div>
</footer>
<!-- Bootstrap core JavaScript -->
<script src="jquery/jquery.min.js"></script>
<script src="bootstrap/js/bootstrap.bundle.min.js"></script>
</body>
</html>