/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
软件Tags: 网络神采</a>采集软件</a>采集工具
网络神采电脑版是为用户提供网页数据采集的应用工具,体积比较小巧,无需安装即可使用,功能丰富强大,能够支持多任务、多线程同时运行,可以精准采集数据,进行数据分析以及处理,方便大家找到扩展销售推广渠道。
《网络神采》是一款用于网页数据采集的工具软件,用于快速采集、下载网页数据。支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署。为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
1、运行稳定
系统运行稳定,要求“0 bug”。
2、流程化
支持定时采集,任务定时启动。通过插件开发,实现流程化的数据采集、数据分析与处理。
3、规模化
支持任务多级分类、批量管理。支持分布式部署,支持团队协作。
4、采集速度
支持多任务、多线程。多任务同时运行,每个任务支持多线程,确保运行效率。
5、采集强度
支持JS解析、POST分页、模拟点击、跨层采集。对于疑难采集页面,有成熟的解决方案。
1、操作方便快捷,支持可视化的配置界面。
2、软件简单好用,5-10分钟可配置一个采集任务。
3、为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
4、支持插件开发,通过插件开发,可扩展软件功能。
1、本软件为绿色软件,不需要安装,解压后即可使用
2、双击运行“bget.exe”即可打开
3、免费版,无条数限制、无时间限制
可视化采集配置,操作细节:
1、废除选项:复制XPath时覆盖现有,改为:复制XPath时,按Shift键可覆盖现有内容
2、显示完整XPath:选中后,不再取消当前元素,而是直接切换
3、Gecko内核:换回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍会出现 COM 断开,体验太差
可视化采集配置,放大、缩小范围时:
1、循环采集:按Shift键,支持连续 * 号
2、提取下一网址:默认为连续 * 号,按Ctrl键为单个 * 号
3、多个 * 号时,加亮显示
修复bug:
1、循环采集:整条数据或“关键规则”采集失败后,URL被回收多次
2、切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层XPath时出错: 未将对象引用设置到对象的实例”。