九瑞-数字图书馆,内容管理,实施服务,互联网信息采集

返回首页|招纳贤士|联系我们

  • 首页
  • 产品中心
  • 解决方案
  • 典型案例
  • 服务与支持
  • 集成与IT服务
  • 关于九瑞
资源共享平台
内容管理平台
知识服务系统
互联网资源采集应用

010-58246699

数字图书馆,内容管理,知识服务,互联网信息采集 您当前所在位置:首页 > 产品中心 > 互联网资源采集应用

产品概述

九瑞互联网信息采集发布平台经过十年不断开发与改进,已经成为研究机构,情报机构以及各个行业用户中的信息采集应用的高级龙头软件产品。特别在互联网知识应用,互联网情报采集分析,舆情监控等高级应用中处于全国领先地位。

九瑞互联网信息采集与发布平台提供从互联网信息采集、信息加工与整合、信息挖掘分析、全文检索数据库、信息审核发布、难采网站针对性采集、以及各类高级应用:互联网知识服务与协助、情报分析平台、舆情监控平台定题服务等一整套解决方案。无论是行业垂直搜索引擎还是大型企业情报分析平台舆情监控平台互联网知识服务平台均有成熟案例与应用。 

现状分析

十年互联网采集应用项目成功实施经验,使得我们能够准确理解不同客户的不同需求。能够使得互联网采集应用项目成为真正有用的软件系统。同时我们也总结出了当前互联网信息采集应用中的难点与现状问题,我们九瑞的解决方案能够有效解决下面的问题。

(1)新兴互联网信息源采集,例如微博,视频网站等。大部分市面采集器无法采集微薄,视频网站。

(2)很多专业的行业网站特别是军事类 情报类网站具备很强的屏蔽机制。市面上绝大多数采集器无法采集这些网站。

(3)如何简便制作网站模板是客户最头疼问题,当需要采集的网站进行改版或者有新站需要采集时往往使得采集器无法正常采集,我们具备上万网站模板库并且有专人进行维护,通过有效服务可以完美解决该问题。

(4)国外无法访问的网站的采集问题,我们通过采集器自带的搜索代理系统能够解决该问题。

(5)网站内部的文档难以采集,例如PPT、PDF、WORD、EXCEL等,但往往该类文档是重要文件。

(6)绝大部分市面采集产品采集后信息无法对信息进行有效清洗,抽取,格式化标准化,也无法对其进行挖掘分析,例如信息追踪、自动分类、自动聚类、自动摘要、相似信息计算、信息正负面分析、统计分析等一系列知识挖掘分析工作。无法提高互联网采集下来的信息质量。

(7)发布与入库问题无法有效解决,特别是采集器采集的信息如何无缝发布到已有系统中。

(8)大部分采集系统无法快速建立一套采集发布网站平台供客户使用,并且没有一些高级采集应用,例如:互联网信息定题服务、情报采集加工分析服务、舆情预警服务。九瑞不仅具备快速建立分类体系的采集发布平台门户,并能提供检索服务功能,而且还具备以上三种不同类型的高级采集应用服务功能。
 

功能组成

  采集层功能要点
通用网页采集
元采集
博客微博采集
数据库采集
文档采集
图片视频多媒体采集
分布式采集
    搜索代理层要点
采集代理
拟人化采集
防屏蔽机制采集
   

 

  采集站点管理层
新站发现
具备上万网站模版库功能
站点管理
远程访问、单点登录的整合策略
智能化参考咨询功能提高数字图书馆对外咨询服务
  资源处理挖掘
去噪去重
分类训练自动分类
自动摘要
全文检索
相似度计算
信息追踪与热点发现

 

平台特点

1、分布式采集,控制255台服务器同时采集,多任务多线程;

2、采集模板库规模上万;

3、采集难采情报类网站,具备拟人化采集代理机制;

4、采集视频市面最强,113种采集格式;

5、具备舆情监控、情报分析、定题服务等高级互联网应用功能且产品化;

6、不仅仅是采集,同时具备从采集到加工整合,分析挖掘全文索引,自动分类并且最终进行发布或者快速建站一系列整体方案。产品化程度很高。能够快速搭建各类互联网信息采集应用。

  • 互联网知识挖掘平台
  • 互联网专题采集与发布
  • 互联网舆情监控
  • 站内搜索与行业搜索引擎
  • Copyright@2009 北京九瑞网络科技有限公司 版权所有 违法必究 京ICP备05048898号