此时, 文件分类(text categorization)技术,即透过演算法分析一电子文件后,将其分配 (assign)给一或多个类别(categories),便扮演著其中重要的角色。
基于28个网页-相关网页
...索引擎哪些文档和自己的需求相关(及其相关的程度),哪些不相关,通过多次交互逐步求精。二是用正文分类(Text Categorization)技术将结果分类,使用可视化技术显示分类结构,用户可以只浏览自己感兴趣的类别。三是进行站点类聚或内容类聚,减少信息的总量。
基于6个网页-相关网页
automatic text categorization 自动文本分类 ; 文本自动分类 ; 自动分类 ; 文档自动分类
text categorization and clustering 文本分类与聚类
Chinese Text Categorization 中文文本分类
Automated Text Categorization 自动文本分类
Online Text Categorization 实时文本分类
Web text categorization Web文本分类
document classification or text categorization 文件分类
Text Categorization Model 文本分类模型
large-scale text categorization 大规模文本分类
This method has obvious advantages especially in similar text categorization.
这种分类方法在相似文本分类中具有明显的优势。
参考来源 - 期刊学术社区The main contributions of this thesis can be listed as follows:1) A thorough study on the feature selection methods and text categorization methods of text document is carried on.
本文的主要贡献是:1)深入地研究了对文档特征的提取方法和文档分类方法,通过比较,分析了各种方法的优缺点。
参考来源 - 中文文本分类研究Text categorization is a key technique in content-based automatic information management.
文本分类是基于内容的自动信息管理的核心技术。
参考来源 - 支持向量机分类方法及其在文本分类中的应用研究As text categorization, the first step of storing a chemical patent by computer is to classifythe patent to which kind it belongs to. Data mining, or machine learning algorithms are morecompetitive to those traditional manual methods.
保证查全率和查准率的关键在于专利文献的分类准确度,数据挖掘类型之一便是文本的自动分类,机器学习算法是实现数据挖掘技术的手段。
参考来源 - 药物专利的数据挖掘技术研究·2,447,543篇论文数据,部分数据来源于NoteExpress
High dimensionality is one of the main problems in text categorization.
文本分类中特征空间的高维问题是文本分类的主要障碍之一。
The main deducing steps are presented in the core-training algorithm of text categorization.
对于文本分类的核心训练算法,给出主要步骤的推导过程;
The vectorization of documents affects the speed and accuracy of text categorization greatly.
文档向量化的质量对于文本分类的速度和准确度有着很大的影响。
应用推荐