Python启航:30天编程速成之旅(第26天)- pathlib
喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。
前期基础教程:
「Python3.11.0」手把手教你安装最新版Python运行环境
讲讲Python环境使用Pip命令快速下载各类库的方法
Python启航:30天编程速成之旅(第2天)-IDE安装
【Python教程】JupyterLab 开发环境安装
pathlib 是 Python 3.4 引入的一个标准库模块,它提供了一种面向对象的方式处理文件系统路径。相比传统的 os.path 模块,pathlib 更加直观和易用。本教程将涵盖 pathlib 的基本概念、常用方法以及一些生动的例子,帮助你更好地理解和使用这个强大的工具。
1. 入门简介
pathlib 提供了两个主要的类来表示文件路径:
- Path: 适用于所有类型的路径。
- PurePath: 用于纯路径操作(不涉及文件系统的实际访问)。
在大多数情况下,你会使用 Path 类,因为它不仅提供了 PurePath 的所有功能,还可以与操作系统进行交互,如检查文件是否存在、创建目录等。
安装与导入
pathlib 是 Python 标准库的一部分,因此不需要额外安装。你可以直接导入并使用它:
from pathlib import Path
2. 基本用法
创建路径对象
你可以通过传递字符串或另一个 Path 对象来创建一个 Path 实例。Path 支持相对路径和绝对路径。
# 使用字符串创建路径
p = Path('my_folder/my_file.txt')
print(p) # 输出: my_folder/my_file.txt
# 使用另一个 Path 对象创建路径
base_path = Path('my_folder')
file_path = base_path / 'my_file.txt'
print(file_path) # 输出: my_folder/my_file.txt
注意:/ 运算符可以用来连接路径,这使得代码更加简洁和易读。
获取当前工作目录
你可以使用 Path.cwd() 来获取当前工作目录的路径。
current_dir = Path.cwd()
print(current_dir) # 输出当前工作目录的绝对路径
获取用户主目录
你可以使用 Path.home() 来获取当前用户的主目录。
home_dir = Path.home()
print(home_dir) # 输出当前用户的主目录
3. 路径属性
Path 对象提供了许多有用的属性来获取路径的不同部分。
文件名和扩展名
p = Path('my_folder/my_file.txt')
# 获取文件名
print(p.name) # 输出: my_file.txt
# 获取文件名(不含扩展名)
print(p.stem) # 输出: my_file
# 获取文件扩展名
print(p.suffix) # 输出: .txt
父级目录
p = Path('my_folder/sub_folder/my_file.txt')
# 获取父级目录
print(p.parent) # 输出: my_folder/sub_folder
# 获取上一级父级目录
print(p.parents[1]) # 输出: my_folder
绝对路径
p = Path('my_folder/my_file.txt')
# 获取绝对路径
print(p.resolve())
4. 文件和目录操作
检查文件或目录是否存在
from pathlib import Path
p = Path('第26天/常用库.py')
# 检查文件是否存在
if p.exists():
print("文件存在")
else:
print("文件不存在")
# 检查是否是文件
if p.is_file():
print("这是一个文件")
# 检查是否是目录
if p.is_dir():
print("这是一个目录")
创建目录
from pathlib import Path
p = Path('第26天')
# 创建单个目录
p.mkdir(exist_ok=True) # 如果目录已存在,不会抛出异常
# 创建多级目录
p = Path('第26天/test')
p.mkdir(parents=True, exist_ok=True)
删除文件或目录
from pathlib import Path
p = Path('my_file.txt')
# 删除文件
p.unlink(missing_ok=True) # 如果文件不存在,不会抛出异常
# 删除空目录
p = Path('test')
p.rmdir()
# 删除非空目录及其内容
import shutil
shutil.rmtree('test')
遍历目录
from pathlib import Path
p = Path('第26天')
# 遍历所有文件和子目录
for item in p.iterdir():
print(item)
# 递归遍历所有文件
for file in p.rglob('*.py'):
print(file)
# 查找特定模式的文件
for file in p.glob('*.py'):
print(file)
5. 文件操作
读取文件内容
p = Path('my_file.txt')
# 读取文本文件
content = p.read_text(encoding='utf-8')
print(content)
# 读取二进制文件
data = p.read_bytes()
print(data)
写入文件内容
p = Path('my_file.txt')
# 写入文本文件
p.write_text('Hello, World!', encoding='utf-8')
# 写入二进制文件
p.write_bytes(b'Binary data')
复制和移动文件
from pathlib import Path
import shutil
source = Path('my_file.txt')
destination = Path('copied_file.txt')
# 复制文件
shutil.copy(source, destination)
# 移动文件
source.rename(destination)
6. 高级用法
解析和构建路径
pathlib 提供了许多方法来解析和构建路径,使你的代码更加灵活和可维护。
p = Path('/home/user/documents/report.pdf')
# 解析路径
parts = p.parts
print(parts) # 输出: ('/', 'home', 'user', 'documents', 'report.pdf')
# 构建路径
new_path = Path('/').joinpath(*parts[1:])
print(new_path) # 输出: /home/user/documents/report.pdf
# 替换路径的一部分
new_p = p.with_name('new_report.pdf')
print(new_p) # 输出: /home/user/documents/new_report.pdf
# 替换文件扩展名
new_p = p.with_suffix('.txt')
print(new_p) # 输出: /home/user/documents/report.txt
处理符号链接
pathlib 也支持符号链接的操作。
# 创建符号链接
target = Path('real_file.txt')
link = Path('symbolic_link.txt')
link.symlink_to(target)
# 检查是否是符号链接
if link.is_symlink():
print("这是一个符号链接")
# 解析符号链接的目标
real_path = link.resolve()
print(real_path)
7. 生动的例子
示例 1:批量重命名文件
假设你有一个包含多个图片文件的目录,你想将它们批量重命名为 image_001.jpg, image_002.jpg 等格式。
from pathlib import Path
folder = Path('images')
files = list(folder.glob('*.jpg'))
for i, file in enumerate(files, start=1):
new_name = f'image_{i:03d}.jpg'
file.rename(folder / new_name)
示例 2:查找并删除大文件
假设你想查找并删除某个目录中超过 10MB 的文件。
from pathlib import Path
folder = Path('large_files')
for file in folder.rglob('*'):
if file.is_file() and file.stat().st_size > 10 * 1024 * 1024:
print(f"Deleting {file}")
file.unlink()
示例 3:备份文件夹
假设你想备份一个文件夹,并将其压缩为 .zip 文件。
from pathlib import Path
import zipfile
import os
def backup_folder(src_folder, dest_zip):
with zipfile.ZipFile(dest_zip, 'w', zipfile.ZIP_DEFLATED) as zipf:
for root, _, files in os.walk(src_folder):
for file in files:
file_path = Path(root) / file
arcname = file_path.relative_to(src_folder)
zipf.write(file_path, arcname)
# 使用示例
backup_folder('my_folder', 'backup.zip')
总结
pathlib 是一个非常强大且易于使用的模块,它简化了文件系统路径的操作。通过面向对象的设计,pathlib 使代码更加清晰、简洁和可维护。
喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。