
随着互联网的发展,企事业单位和政府部门大都已经建立了自己的网站,如何运营好网站成为一个长期的任务。好的网站要有充实的内容,由于各种原因,这些网站目前普遍信息更新缓慢,信息量不足。而政府部门从信息安全的角度,一般采用和互联网隔离的专网,无法高效访问到internet上丰富的信息资源。企业用户更加需要特定行业和主题的最新专业信息,并且需要不断跟踪分析。
VSB文章采集系统,能自动从互联网上的其他网站上实时采集信息,以文章形式保存在自己的网站当中。这些信息可以是国内外政治、经济、军事等发展变化,也可以是国家宏观经济政策、地方政府的发展战略、优惠鼓励措施等公开的互联网信息;或者是市场动向、产品与服务、市场活动、各地区销售情况等等。系统自动采集这些信息并将其保存在指定的栏目之中。

可以对目标网站的指定的任意页面进行采集,也可以采集网站上发布的RSS内容。采集设置简单易用,每一步设置都有预览,可以让用户了解自己设置是否正确并做出调整。
系统内嵌文章正文的分析引擎,能自动智能的识别正文,可对正文内容自动过滤,将和正文无关的内容如超链接、广告图片之类自动剔除,支持抓取多页的文章正文。
可以抓取新闻正文内嵌的图片、FLASH和附件,可将其保存在本地或直接链接到原来的服务器。
可以设置采集条件,系统仅抓取符合条件的内容,例如内容包含关键字、排除某些关键字或者标题是否相同。
支持增量抓取,系统会自动识别已经抓取过的内容,不再重复抓取。
系统可以对多个数据源同时进行抓取,系统会自动调度采集任务,而不会影响运行网站的性能。
支持设置计划,可以任意组合采集任务,在指定时间或每隔一段时间自动执行采集任务。
提供采集审计日志,可以在采集出故障时查找到原因。
提供采集控制台,可以手动启动一个或多个采集任务,并检测每一个任务的执行情况。
系统内嵌于VSB系统中,安装VSB时即可同时安装到系统中,无需用户单独采购。