您需要登录账号才能看到图片及隐藏内容,马上注册享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
八爪鱼网页数据采集器,是一款使用简单、功能强大的网络爬虫工具,完全可视化操作,无需编写代码,内置海量模板,支持任意网络数据抓取,连续四年大数据行业数据采集领域排名第一。 八爪鱼采集器 软件特点 云采集 5000台云服务器,24*7高效稳定采集,结合API可无缝对接内部系统,定期同步爬取数据 智能采集 提供多种网页采集策略与配套资源,帮助整个采集过程实现数据的完整性与稳定性 全网适用 眼见即可采,不管是文字图片,还是贴吧论坛,支持所有业务渠道的爬虫,满足各种采集需求 海量模板 内置数百个网站数据源,全面覆盖多个行业,只需简单设置,就可快速准确获取数据 简单易用 无需再学爬虫编程技术,简单三步就可以轻松抓取网页数据,支持多种格式一键导出,快速导入数据库 稳定高效 分布式云集群服务器和多用户协作管理平台的支撑,可灵活调度任务,顺利爬取海量数据 功能介绍 简单来讲,使用八爪鱼可以非常容易的从任何网页精确采集你需要的数据,生成自定义的、规整的数据格式。八爪鱼数据采集系统能做的包括但并不局限于以下内容: 1. 金融数据,如季报,年报,财务报告, 包括每日最新净值自动采集; 2. 各大新闻门户网站实时监控,自动更新及上传最新发布的新闻; 3. 监控竞争对手最新信息,包括商品价格及库存; 4. 监控各大社交网站,博客,自动抓取企业产品的相关评论; 5. 收集最新最全的职场招聘信息; 6. 监控各大地产相关网站,采集新房二手房最新行情; 7. 采集各大汽车网站具体的新车二手车信息; 8. 发现和收集潜在客户信息; 9. 采集行业网站的产品目录及产品信息; 10. 在各大电商平台之间同步商品信息,做到在一个平台发布,其他平台自动更新。 更新日志 解决在某些情况下,本地采集中同时运行的最大任务数不正确的问题 解决中在采集步骤重试时,切换代理IP不生效的问题 解决了任务设置中修改浏览器相关选项后浏览器不会自动刷新的问题 解决了代理IP模板任务提示启动不正确的问题 解决了触发中设置结束循环不起作用的问题 解决了用户自定义任务中输入的网址列表保存时不能删除空行的问题 解决滚动一屏后,版本7正常采集,版本8会漏掉图片地址的问题 解决在用户定义的任务中,中有一个空的循环列表的问题,这将导致整个任务根本不收集任何数据 解决定期将数据导出到数据库会失败的问题 解决当前时间字段被添加到自定义配置中和样本数据显示不正确的问题 解决将数据导出到csv文件时的额外字段行问题 解决在字段中找不到元素,集合不正确时,设置“本步骤所有单词的段留空”的问题 解决任务设置中不加载图片选项不生效的问题 解决某些Iframe网页无法收集的问题 解决一些JSON集合出现乱码或无法收集的问题 解决中,部分网站点击后被卡住的自定义配置问题 解决中日时间格式的自定义配置问题 解决字段多次被提取合并成一行,集合不正确的问题 解决自定义配置中循环列表项目显示不正确的问题 解决了采集时输入文本没有覆盖输入框中已有文本的问题
下载地址:https://lx6.lanzoui.com/irtxTfw3vfg
|