数据采集系统是一款智能化的互联网数据采集工具,与内容管理系统深度集成,可简单快速地将目标网站的内容采集到自己的网站中,以快速填充网站内容,或者通过定时采集来实现自动转载目标网站的新闻,以减少网站内容运维工作。
与内容管理系统深度集成
数据采集系统能够从目标网站采集数据,通过智能分析,将数据与指定内容模型的各个字段匹配生成相应的内容实体,并保存至指定栏目中。目标网页中的图片和附件会以文件形式保存在网站的上传文件夹中。
支持数据采集的内容模型包括文章、公开信息、政策文件等。
支持多种数据源格式
采集功能完备
- 支持按正序或倒序进行数据采集。
- 支持定时采集功能。
- 支持断点续采。
- 支持采集排重(增量采集),可以根据标题或 URL 进行排重。
- 支持自动下载内容中的图片和附件。
- 支持自动过滤正文中的链接。
- 支持更新采集,即在采集所有数据的同时不清空历史记录,并判断历史记录中是否存在相同数据,若存在则更新数据,否则插入新数据。
- 支持重新采集,即清空历史记录后重新采集全部数据。
- 支持批量执行采集任务。
- 支持查看采集进度。
- 支持采集历史记录管理,用户可以查看、删除、清空采集历史记录。
- 支持仅采集为链接内容,并保留至源网页的链接。
用户登录
还没有账号?
立即注册