首页 | 关于九瑞 | 在线体验 | 招贤纳士 | 联系九瑞
全文检索系统
中文分词及词性标注
短/小文本分类
文本/网页去重
自动文本摘要
自动文本分类
自动文本聚类
信息采集系统
信息过滤系统
异构资源整合检索系统
光盘镜像管理系统
  当前位置: 首页 > 研究中心与产品 > 短/小文本分类
    短小文本分类是针对论坛/BBS、留言及回复、咨询、建议及意见反馈、手机短信/网络小纸条、即时聊天记录(MSN/QQ/POPO)等按照给定的分类体系进行分类,由于文本短小内容较少,短的只有几十字,多的也就是一百字左右,内容少,特征不明显。常用的基于统计与向量空间模型的方法处理效果不好,准确率只有70%左右。
    针对这种情况,我们采用基于统计与规则相结合的方法,引入语义范式对短小文本进行分类处理,同时通过人工介入的方法,准确率可以达到90%以上,一般可以达到95%左右。
·提供短/小文本的特征选择
·语义范式的辅助构造
·短/小文本的自动分类
·与TF/IDF方法相结合的特征提取与选择方法
·基于内容的语义理解
·语义范式的构造
·规则与VSM相结合的分类技术
·分类速度在80篇/秒
·分类准确率92%以上
Copyright@2009 北京九瑞网络科技有限公司 版权所有 违法必究 京ICP备05048898号