Python 下载文件的七种方式，你get了吗？（python中布尔类型的值是）-FinClip官网

Python 下载文件的七种方式，你get了吗？（python中布尔类型的值是）

网友投稿 2576 2022-08-18

Python -文件的七种方式，你get了吗？（python中布尔类型的值是）

本文档介绍了 Python -文件的各种方式，从-简单的小文件到用断点续传的方式-大文件。

Requests

使用 Requests 模块的 get 方法从一个 url 上-文件，在 python 爬虫中经常使用它-简单的网页内容

import requests

# 图片来自bing.com

url = 'https://cn.bing.com/th?id=OHR.DerwentIsle_EN-CN8738104578_400x240.jpg'

def requests_download():

content = requests.get(url).content

with open('pic_requests.jpg', 'wb') as file:

file.write(content)

urllib

使用 python 内置的 urllib 模块的 urlretrieve 方法直接将 url 请求保存成文件

from urllib import request

# 图片来自bing.com

url = 'https://cn.bing.com/th?id=OHR.DerwentIsle_EN-CN8738104578_400x240.jpg'

def urllib_download():

request.urlretrieve(url, 'pic_urllib.jpg')

urllib3

urllib3 是一个用于 Http 客户端的 Python 模块，它使用连接池对网络进行请求访问

def urllib3_download():

# 创建一个连接池

poolManager = urllib3.PoolManager()

resp = poolManager.request('GET', url)

with open("pic_urllib3.jpg", "wb") as file:

file.write(resp.data)

resp.release_conn()

wget

在 Linux 系统中有 wget 命令，可以方便的-网上的资源，Python 中也有相应的 wget 模块。使用 pip install 命令安装

import wget

# 图片来自bing.com

url = 'https://cn.bing.com/th?id=OHR.DerwentIsle_EN-CN8738104578_400x240.jpg'

def wget_download():

wget.download(url, out='pic_wget.jpg')

也可以直接在命令行中使用 wget 命令

python -m wget https://cn.bing.com/th?id=OHR.DerwentIsle_EN-CN8738104578_400x240.jpg

分块-大文件

在需要-的文件非常大，电脑的内存空间完全不够用的情况下，可以使用 requests 模块的流模式，默认情况下 stream 参数为 False, 文件过大会导致内存不足。stream 参数为 True 的时候 requests 并不会立刻开始-，只有在调用 iter_content 或者 iter_lines 遍历内容时-

iter_content：一块一块的遍历要-的内容 iter_lines：一行一行的遍历要-的内容

import requests

def steam_download():

# vscode 客户端

url = 'https://vscode.cdn.azure-/stable/e5a624b788d92b8d34d1392e4c4d9789406efe8f/VSCodeUserSetup-x64-1.51.1.exe'

with requests.get(url, stream=True) as r:

with open('vscode.exe', 'wb') as flie:

# chunk_size 指定写入大小每次写入 1024 * 1024 bytes

for chunk in r.iter_content(chunk_size=1024*1024):

if chunk:

flie.write(chunk)

进度条

在-大文件的时候加上进度条美化-界面，可以实时知道-的网络速度和已经-的文件大小，这里使用 tqdm 模块作为进度条显示，可以使用 pip install tqdm 安装

from tqdm import tqdm

def tqdm_download():

url = 'https://vscode.cdn.azure-/stable/e5a624b788d92b8d34d1392e4c4d9789406efe8f/VSCodeUserSetup-x64-1.51.1.exe'

resp = requests.get(url, stream=True)

# 获取文件大小

file_size = int(resp.headers['content-length'])

with tqdm(total=file_size, unit='B', unit_scale=True, unit_divisor=1024, ascii=True, desc='vscode.exe') as bar:

with requests.get(url, stream=True) as r:

with open('vscode.exe', 'wb') as fp:

for chunk in r.iter_content(chunk_size=512):

if chunk:

fp.write(chunk)

bar.update(len(chunk))

tqdm 参数说明：

total：bytes，整个文件的大小

unit='B': 按 bytes 为单位计算

unit_scale=True：以 M 为单位显示速度

unit_divisor=1024：文件大小和速度按 1024 除以，默认时按 1000 来除

ascii=True：进度条的显示符号，用于兼容 windows 系统

desc='vscode.exe' 进度条前面的文件名

断点续传

HTTP/1.1 在协议的请求头中增加了一个名为 Range的字段域， Range 字段域让文件从已经-的内容开始继续-

如果网站支持 Range 字段域请求响应的状态码为 206(Partial Content)，否则为 416(Requested Range not satisfiable)

Range 的格式

Range:[unit=first byte pos] - [last byte pos]，即 Range = 开始字节位置-结束字节位置，单位：bytes

将 Range 加入到 headers 中

from tqdm import tqdm

def duan_download():

url = 'https://vscode.cdn.azure-/stable/e5a624b788d92b8d34d1392e4c4d9789406efe8f/VSCodeUserSetup-x64-1.51.1.exe'

r = requests.get(url, stream=True)

# 获取文件大小

file_size = int(r.headers['content-length'])

file_name = 'vscode.exe'

# 如果文件存在获取文件大小，否在从 0 开始-，

first_byte = 0

if os.path.exists(file_name):

first_byte = os.path.getsize(file_name)

# 判断是否已经-完成

if first_byte >= file_size:

return

# Range 加入请求头

header = {"Range": f"bytes={first_byte}-{file_size}"}

# 加了一个 initial 参数

with tqdm(total=file_size, unit='B', initial=first_byte, unit_scale=True, unit_divisor=1024, ascii=True, desc=file_name) as bar:

# 加 headers 参数

with requests.get(url, headers = header, stream=True) as r:

with open(file_name, 'ab') as fp:

for chunk in r.iter_content(chunk_size=512):

if chunk:

fp.write(chunk)

bar.update(len(chunk))

总结

本文介绍了常用的 7 种文件-方式，其他python相关资讯或者教程欢迎关注

iOS之同步请求、异步请求、GET请求、POST请求

2576 2022-08-18

Python 下载文件的七种方式，你get了吗？（python中布尔类型的值是）

iOS之同步请求、异步请求、GET请求、POST请求

python 庖丁科技pdflux的表格解析（精度很高）

Android APK 更新之路（android什么意思）

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计