XPath2Doc(通用网站数据采集及Doc生成工具) [V1.0.0.0]
- 大小:
- 下载:0
- 分类:装机必备
- 发布者:zhangliang
资源介绍
XPath2Doc(通用网站数据采集及Doc生成工具)是一个全自动采集网页页面形成Word docx文件的专用工具,带天眼查、天眼查采集配备,应用XPath3Doc必须自身在WebBrowser对话框里边手工制作登陆,并寻找必须的数据网页页面,随后点击程序流程按键开展采集,因此 是个全自动的网页页面数据添充Docx专用工具。
【原理】
网页页面的每一个原素,都能够表明变成XPath句子,因此 我们可以载入打开浏览器的网页页面源码,根据XPath句子获得网页元素中的文字。
XPath句子的获得方法:
一般我们可以应用3603.html">Google的Chrome浏览器开启网页页面,按F12调成微信开发工具页面,在ELements菜单栏下,伴随着电脑鼠标的挪动能够见到网页页面被黑影遮盖,点开三角符号,能够更进一步精准定位精确的部位,直至寻找最后必须的数据部位。在寻找的文字上点鼠标点击,在弹出来的莱单中,挑选Copy-Copy XPath,随后黏贴到文本文档就可以获得必须的XPath句子。
这儿必须表明一点:假如复制出去的XPath句子中有/tbody会危害采集,程序流程內部对于此事难题开展了解决,但很有可能会在一些特殊情况下依然会危害数据采集,能够手工制作除掉。
【软件环境】
Windows7 Sp1电脑操作系统请安裝下边的部件(关键:VC库如果不安裝,本程序流程无法启动):
VC2017往上
.net framework 4.5.2
在Windows10系统软件下所述部件一般内置,不用独立安裝。Windows10 1903运作根据。