-
智能判断
每篇信息内容自动分类,并智能判断信息正负面指数及事件走势分析。
-
监测范围
系统自动对全国新闻网站、论坛、微博、博客、微信、外媒等监测。
-
响应能力
自动聚类能力达到10000篇/分钟,1亿篇文章关键词检索响应时间0.03秒。
-
采集效率
重点监测网站2-3分钟轮询一次,微博和贴吧数据 2-5分钟入库 。
-
系统部署
2000多台云服务器全天不间断采集网络数据,每天采集量不少于5000万条。
-
采集数据
全网5万多个网媒,510万个微博账号,1.3万个论坛, 百度贴吧等数据。
-
- 1错链、坏链、死链、内存溢出处置;
- 22000台云服务器,7*24小时无间断采集;
- 3自动类聚达10000篇/分钟,1亿篇文章关键词检索响应时间0.03秒。
- 1错链、坏链、死链、内存溢出处置;
- 22000台云服务器,7*24小时无间断采集;
- 3自动类聚达10000篇/分钟,1亿篇文章关键词检索响应时间0.03秒。
-
- 1分布式集群采集,单个采集器支持200个网站、1000个采集器并行;
- 2网站、论坛等最快3分钟轮询一次,微博信息实时推送。
- 1分布式集群采集,单个采集器支持200个网站、1000个采集器并行;
- 2网站、论坛等最快3分钟轮询一次,微博信息实时推送。
-
- 1网站、论坛、微博、博客、微信公众号、境外网站等11个信息端口全方位采集,不留死角;
- 2定向采集+非定向补充采集数据
- 3每天约7000万+数据
- 1网站、论坛、微博、博客、微信公众号、境外网站等11个信息端口全方位采集,不留死角;
- 2定向采集+非定向补充采集数据
- 3每天约7000万+数据
-
- 1模板和脚本引擎实现元数据抽取;
- 2信息抽取准确率达99%以上。
- 1模板和脚本引擎实现元数据抽取;
- 2信息抽取准确率达99%以上。
-
- 1自动分析页面层级关系,采集到最深层内容;
- 2可采集论坛跟帖、微博评论、网站评论。
- 1自动分析页面层级关系,采集到最深层内容;
- 2可采集论坛跟帖、微博评论、网站评论。
-
高校
180+
-
企业
120+
-
政府
50+
-
医院
30+
-
银行
6+
-