 |
|
自动文本分类 |
 |
|
|
 |
自动分类是对大量的非结构化的文字信息(文本文档、网页等)按照给定的分类体系,根据文字信息内容分到指定的类别中去,是一种有指导的学习过程。
分类过程采用基于统计的方法和向量空间模型可以对常见的文本网页信息进行分类,分类的准确率可以达到85%以上。 |
 |
·用户可根据自己的需求设定分类体系标准
·提供训练文本的特征选择
·支持增量训练
·分类模版的自动生成
·文本的自动分类 |
 |
· 与TF/IDF方法相结合的特征提取与选择方法
·基于内容的语义理解
·统计的方法与向量空间模型(VSM)相结合的分类技术 |
 |
·分类速度50篇/秒
·准确率85%以上
|
|
|