简单五步教你一口气采完一站网页数据信息
1、第一步:打开软件,输入网址,打开网页 就像用普通的浏览器一样,输入或者拖动网址到软件网址输入框中,回车或点击打开按钮打开。
2、第二步:获得要采集项目的TAG元素列表 点击”获取TAG列表“按钮,也就是获取网页元素谱驸扌溺列表,注意点击获得TAG列表,获得的是整个页面的,这样显示的元素信息会比较多,要从中找出所要的元素比较难一些,我们可以只选择网页上要采集的部分进行列示,点一下要获取的信息文字前位置,再按住键盘上的SHIFT键,不放,拖住鼠标到信息文字末尾右侧,之后软件的元素列表区就有这些元素的列表了。
3、第三步:分别设置要采集的项目 按顺序从TAG元素列表中找出需要的元素,找到后双击,使元素信蝌怦吩曰息显示在软件左侧的项目信息设置面板中,硼讷侍逖再根据需要设置采集文字的截取方式或替换方式,再设置字段名称,点击添加即可加入采集项目列表。 另外,你也可以直接按住键盘上的ALT键,再点击网页上的项目,快速将网页元素信息添加到项目设置面板中进行设置。 待所有项目设置完,可打勾要采集的项目,点击提取测试是否有效。
4、第四步:设置自动翻页方式 根据页面情况设置,有的网页上有下一页链接或按钮,有的网址中的页码数,有的可以在网页上输入页数转到下一页,有的网站要提取所有网址后根据网址列表翻页。下图网址页面有一个LI标记,在页面上显示为一个三角形,它的类名是next,可以用此进行翻页。
5、第五步:设置保存的路径及文件名,点击自动连续选项开始抓取
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。