如何使用网文采集大师采集指定博客名下所有文章
1、第一步,我们得先在软件中输入该博主的博文目录页网址,打开网页。

3、第三步:接下来,我们就要开始正式采集这些链接对应的正文了。点击刚才我们所提取到软件左侧链接谱驸扌溺列表中的一个链接,链接地址会自动显示在软件网址输入栏,再用鼠标点击网址输入栏后回车,查芬简砝鬃看博文的正文的开始及结束位置,经过比较,我们可以用网页上的“转载▼”作为正文起始位置关键字,用“分享:”作结束位置关键字,再依次打开链接列表中两到三个,同样进行如上操作,点击“获取文章”进行测试,发现都可正常获取。注意这种分割关键字的选取,也是要尽量照顾所有链接对应的文章,对于同一个列表中的页面要有通用性,也就是每页都要有的,如果有的页面没有,那么在提取时,就有可能提取不到文字,就像拉网捕鱼一样,网开始要撒得大,然后再慢慢收缩,如果一开始就撒得太小了,就可能捕不到鱼了。另外对于有的文章,我们还可选取“段落重排”、“去除干扰码”、“特殊删除”等选项,减少后期排版编辑的工作量。

4、第四步:确定文章保存的文件名的命名方式我们看每个博文在软件标题栏显示的标题,可以看到每个标题后面都跟了“_朱力方_新浪博客”,所以我们在保存文章按钮前一个输入框中输入“_",保存文章前第二个输入框不用输入文字,输入完后可以点击保存文章试一下,看到软件左下角的文件浏览区已经有一篇文章了,注意,软件采集的文章都在左侧设置的对应的目录中,文件夹和文件列表框右键都有快捷菜单的。最后,我们再点击执行命令按钮,在弹出菜单中选择”批量单页采集“就可一边喝茶去了。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:73
阅读量:52
阅读量:70
阅读量:36
阅读量:35