Skip to content

Latest commit

 

History

History
6 lines (6 loc) · 334 Bytes

File metadata and controls

6 lines (6 loc) · 334 Bytes

Chinese Segmentation

Chinese word segmentation project

说明

我们基于matirx67的理论支撑设计了一套采用C++的针对无语料库的中文分词的解决方案。全部使用标准库构建。通过分析字频、词频、左邻和右邻信息熵进行分词。

微服务

我们提供了PHP版本的微服务支持