3、标注语料库例子(Examples of annotated corpora); 4、分词算法(Word segmentation algorithm); 一、 语料库及其性质(Corpora and its properties): ..
基于26个网页-相关网页
In the meantime, combining the traits of network applications, we put forward a largest matched word segmentation algorithm.
其间兼顾网络上应用的特点,提出了基于无指导的最大匹配分词算法。
参考来源 - 网络智能过滤系统的设计与实现·2,447,543篇论文数据,部分数据来源于NoteExpress
Index module: first of all, discuss the design method of Chinese word segmentation and choose a word segmentation algorithm.
索引模块中:首先,讨论了中文分词的设计思想,选择了分词的算法。
Initially, it is based on the application of the main open source project Luence, the combination of sub-word dictionary and grammar of Chinese word segmentation algorithm components.
最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。
The major work includes:1 Propose an improved Chinese word segmentation algorithm for large-scale Chinese information processing, which is the basic phase of the building of Chinese search engine.
其中主要的工作包括:1大规模中文信息处理是构建中文搜索引擎的基本环节,为了实现大规模中文信息处理,本文提出了一种改进的中文分词算法。
应用推荐