Python爬虫之文件下载

2025-05-12 05:03:18

1、怎样在网上找资源:就是百度图片为例,当你如下图在百度图片里搜索一个主题时,会为你跳出一大堆相关的图片。还有如果你想学英语,找到一个网站有很多mp3的听力资源,这些可能都是你想获取的内容。现在是一个互联网的时代,只要你去找,基本上能找到你想要的任何资源。

Python爬虫之文件下载

3、资源下载方法一:代码很简单,直接上代码:from urllib.request import urlretrieveurlretrieve("图片URL", "./image.jpg")直接通过urlretrieve函数就把URL对应的图片给下载到当前文件夹(./)中了,并把图片命名为image.jpg。

Python爬虫之文件下载

5、资源下载方法三:看代码:import re孥恶膈茯questsresource = requests.get("图片URL", stream=True)with open("./image.jpg", mode="wb") as fh: for chunk in resource.iter_content(chunk_size=100): fh.write(chunk)此方法与下载方法二的不同之处在于在get方法调用时使用了参数【stream=True】。而在写入的文件的时候是分块写入的。什么意思呢:前两种方法是把一个文件全部下载到内存后,再一起写入到硬盘文件中。方法三是下载一定的量(这里指的是100字节)后,就写入到硬盘文件中,直到全部写完。第三种方法的好处是,如果在下载大容量文件时,不会造成内存的过度使用。

Python爬虫之文件下载

7、资源下载说明二:上面例子中的代码都是下载单一资源的。如果要在同一网页中下载多个资源的思路如下:1. 找出要下载资源的URL,并形成一个资源集合;2. 把下载函数中的资源URL与保存路径参数化;3. 遍历资源集合,依靠循环调用下载函数来达到多个资源下载的目的。

Python爬虫之文件下载
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢