八爪鱼采集器是由深圳视界信息技术有限公司官方打造的一款网页采集器,它以完全自主研发的分布式云计算平台为核心,可以在很短的时间内,轻松从各种不同的网站或者网页获取大量的规范化数据,帮助任何需要从网页获取信息的客户实现数据自动化采集,编辑,规范化,摆脱对人工搜索及收集数据的依赖,从而降低获取信息的成本,提高效率!
简单来讲,使用八爪鱼可以非常容易的从任何网页精确采集你需要的数据,生成自定义的、规整的数据格式。
软件优势
1、操作简单
操作简单,完全可视化图形操作,无需专业IT人员,任何会使用电脑上网的人都可以轻松掌握。
2、云采集
采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。
3、拖拽式采集流程
模拟人的操作思维模式,可以登陆,输入数据,点击链接,按钮等,还能对不同情况采取不同的采集流程。
4、图文识别
内置可扩展的OCR接口,支持解析图片中的文字,可将图片上的文字提取出来。
5、定时自动采集
采集任务自动运行,可以按照指定的周期自动采集,并且还支持最快一分钟一次的实时采集。
6、2分钟快速入门
内置从入门到精通所需要的视频教程,2分钟就能上手使用,另外还有文档,论坛,qq群等。
7、免费使用
它是免费的,并且免费版本没有任何功能限制,你现在就可以试一试,立即下载安装。
八爪鱼采集器使用模板采集数据
【采集模板】是由八爪鱼官方提供的、做好的采集模板,目前已有200+采集模板,涵盖主流网站的采集场景。模板数还在不断增加。
【使用模板采集数据】时,只需输入几个参数(网址、关键词、页数等),就能在几分钟内快速获取到目标网站数据。(类似PPT模板,只需修改关键信息就能直接使用,无需自己从头配置。)
1、如何找到所需的【采集模板】
① 首页【输入框】
在客户端首页【输入框】中,输入目标网站名称,八爪鱼自动寻找相关的采集模板。将鼠标移到需要的模板上并单击,进入模板详情页面。
注意,请确保输入的网站名称正确,否则可能无法查找到相关模板。
② 首页【热门采集模板】
点击【热门采集模板】中的模板,或者【更多>>】,进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板。
③ 没有所需的模板
如果没有找到想要的模板,请进入模板展示页面后,点击右上角【我想要新模板】,提交新模板制作需求。
官方会评估需求,排期制作新的模板。
2、【采集模板】如何使用
Step1:进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【示例数据】,确认此模板采的数据符合需求。
注意:模板中的字段是固定的,无法自行增加字段。如果想要增加模板中的字段,请联系官方客服。
Step2:确定模板符合需求以后,点击【立即使用】,自行【配置参数】。常见的参数有关键词、翻页次数、URL等。
请认真查看【模板介绍】中的使用方法说明和参数说明,输入格式正确的参数,否则将影响模板的使用。
Step3:然后点击【保存并启动】,选择启动【本地采集】。八爪鱼自动启动1个采集任务并采集数据。
Step4:数据采集完成以后,可以需要的格式导出。这里以导出为【Excel】为例。数据示例:
通过【采集模板】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。在 客户端界面介绍 中有详细说明。
3、【采集模板】是否收费
【采集模板】大部分是免费的,少部分是收费的。
【采集模板】收费详情【模板详情页】有详细说明,使用前请仔细阅读。如有疑问请咨询客服。
现在,我们已经学会【使用模板采集数据】了。快选择合适的模板采集数据吧!
更新日志
v8.7.0版本
新增激励任务,简单几步即可获得余额奖励,赶紧冲
首页增加资讯模块,最新采集模版和培训直播不再错过
OTD模板任务支持文件下载
团队版试用申请免审核,第一时间快速体验
模版关键词或URL检索优化