(3)后缀树聚类算法(Suffix Tree Clustering),简称STC,它是把文本看做字 符串,而非一堆没有顺序的词,然后识别文本之间公共的词组,最后把具有公共 词组的文本聚成一类,这...
基于14个网页-相关网页
其中采用了一种基于短语的后缀树聚类(Suffix Tree Clustering)算法。该算法对结果网页中的短语构建一个后缀树,每一短语代表一个候选簇,如果两个网页具有较多的共同短语则可以归为一簇,两个...
基于12个网页-相关网页
自动聚类:使用改进的基于后缀树(Suffix Tree Clustering)的聚类引擎, 效果远远优于以贝叶斯概率理论为基础的概率分析法和传统的K-Means特征向 量空间分析法.
基于8个网页-相关网页
该系统使用后缀树聚类(STC,Suffix Tree Clustering)算法,将具有共同短语的文档归到一类中,因此在对文档本身和文档摘要 进行聚类时都表现出了良好的性能。
基于4个网页-相关网页
Weighted Suffix Tree Clustering 加权后缀树聚类
On the basis of experiment results,K-means,Suffix Tree Clustering and improved Suffix Tree Clustering are compared in terms of accuracy and time-complexity.
对典型的k-平均算法、后缀树聚类算法和改进后的算法进行实验分析,在算法准确率和时间复杂度上进行了比较。
参考来源 - 网络文本信息聚类算法研究与应用·2,447,543篇论文数据,部分数据来源于NoteExpress
To improve the clustering efficiency, a simple but reasonable measure for base cluster selection is presented to exclude some generalized suffix tree nodes which contribute less to the clustering.
为了进一步提高聚类效率,给出了一种简单有效的用于基类选择的测度,用来排除一些无意义的广义后缀树节点。
Therefore, this article applies suffix tree algorithm to the meta search engines, and designs a meta search engine systems with a clustering algorithm.
因此,本文将后缀树算法应用到元搜索引擎中,设计了一个带聚类的元搜索引擎系统。
应用推荐