现象文章采集有自动采集的功能吗?可以设置采集计划吗?原因没有完全掌握此功能。解决方法可以设置采集计划来进行文章的采集工作。具体的操作是:第一步:选中需要设置采集计划的任务名称;第二步:点击设置计划;第三步:填写任务名称、执行时间等信息。
问题新版编辑器里,采集带有附件的文章时,附件采集不下来,怎么解决?答案采集带有附件的文章时,需要在采集任务的第五步的添加下载格式,比如pdf,doc,docx……,如下图所示:
问题我想把别人网站RSS发布的新闻,采集到本系统中可以么?解决方法当然可以,在从网页采集的第2步:基础中,选择“RSS 链接:您采集的是RSS 格式的XML链接”,剩下的类似普通文章采集的操作。
我们在采集网站的内容的时候,如果有几个栏目的采集代码比较接近,怎么样更快的采集这些文章呢?此处有2种方式:1. 同一个站点下如果是在同一个站点,则我们只需要复制原来设置好的任务,然后将复制到的任务进行微小的修改即可,如:任务名称,链接地址即可。2. 不同站点中如果采集的文章链接等都比较相似,但不在一个站点中,此此时可以下载原来设置好的任务为模版,在当前站点中导入此任务模版即可。
在采集文章的时候,经常会遇到文章正文带有附件的情况,附件下载下来,其实他的名称是一串数字或者字符,但我们的系统中,都是以附件实际的名称列为附件的链接名称的,怎么样解决这种问题呢?我们在采集文章的时候,可以不把附件当做附件进行采集,而是当做内嵌在文章中的文档去采集,此时,就不需要再对附件项进行设置了,直接在下载的文档和图片类型中,输入所有附件涉及到的格式即可。如下图所示:
现象配置文章采集时,点击预览页面,提示 请确保网络畅通:“java.net.UnknownHostExcption”。如下图原因 出现此类错误说明服务器无法连接到要采集的站点页面;需要从服务器上检查网络、dns等配置项解决方法检查以下配置项,均在博达网站群所在服务器执行:1、 使用nslookup工具,检测DNS解析是否正常;2、 使用ping 工具,测试网络是否正常3、 windows可使用浏览器直接访问要采集的页面测试;linux可使...
在文章采集处》从网页采集》任务设置处,先选择要设置采集计划的任务名称,选择上方的“设置计划”,如下图所示:在对应的输入框中选择开始时间和执行的频率即可。如下图:
问题博达网站群中,如何知道我们网站里面,谁修改了网站的模版?原因博达网站群系统功能不熟悉。答案博达网站群中,如果您想知道网站里面,谁修改了网站的模版,您可以在网站的站点管理“网站安全”—“工作日志”中进行查看。
如果想批量删除文章,可以进入到文章的列表页面,勾选列表上面的高级勾选框,如下图所示:然后在输入框中输入“delete”即可批量删除。
现象您好!我是博达网站群的用户,信息采集时能否同时将采集过来的数据进行一键排版,以保证采集过来的新闻数据样式统一?原因博达网站群系统功能不熟悉。解决方法博达网站群中,当您进行信息采集时,您可以在采集任务中进行配置,信息采集同时将采集过来的数据进行一键排版。详情如下图所示: