Python启航:30天编程速成之旅(第26天)- pathlib

liftword4个月前 (12-27)技术文章53

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

前期基础教程:

「Python3.11.0」手把手教你安装最新版Python运行环境

讲讲Python环境使用Pip命令快速下载各类库的方法

Python启航:30天编程速成之旅(第2天)-IDE安装

【Python教程】JupyterLab 开发环境安装


pathlib 是 Python 3.4 引入的一个标准库模块,它提供了一种面向对象的方式处理文件系统路径。相比传统的 os.path 模块,pathlib 更加直观和易用。本教程将涵盖 pathlib 的基本概念、常用方法以及一些生动的例子,帮助你更好地理解和使用这个强大的工具。

1. 入门简介

pathlib 提供了两个主要的类来表示文件路径:

  • Path: 适用于所有类型的路径。
  • PurePath: 用于纯路径操作(不涉及文件系统的实际访问)。

在大多数情况下,你会使用 Path 类,因为它不仅提供了 PurePath 的所有功能,还可以与操作系统进行交互,如检查文件是否存在、创建目录等。

安装与导入

pathlib 是 Python 标准库的一部分,因此不需要额外安装。你可以直接导入并使用它:

from pathlib import Path

2. 基本用法

创建路径对象

你可以通过传递字符串或另一个 Path 对象来创建一个 Path 实例。Path 支持相对路径和绝对路径。

# 使用字符串创建路径
p = Path('my_folder/my_file.txt')
print(p)  # 输出: my_folder/my_file.txt

# 使用另一个 Path 对象创建路径
base_path = Path('my_folder')
file_path = base_path / 'my_file.txt'
print(file_path)  # 输出: my_folder/my_file.txt

注意:/ 运算符可以用来连接路径,这使得代码更加简洁和易读。

获取当前工作目录

你可以使用 Path.cwd() 来获取当前工作目录的路径。

current_dir = Path.cwd()
print(current_dir)  # 输出当前工作目录的绝对路径

获取用户主目录

你可以使用 Path.home() 来获取当前用户的主目录。

home_dir = Path.home()
print(home_dir)  # 输出当前用户的主目录

3. 路径属性

Path 对象提供了许多有用的属性来获取路径的不同部分。

文件名和扩展名

p = Path('my_folder/my_file.txt')

# 获取文件名
print(p.name)  # 输出: my_file.txt

# 获取文件名(不含扩展名)
print(p.stem)  # 输出: my_file

# 获取文件扩展名
print(p.suffix)  # 输出: .txt

父级目录

p = Path('my_folder/sub_folder/my_file.txt')

# 获取父级目录
print(p.parent)  # 输出: my_folder/sub_folder

# 获取上一级父级目录
print(p.parents[1])  # 输出: my_folder

绝对路径

p = Path('my_folder/my_file.txt')

# 获取绝对路径
print(p.resolve()) 

4. 文件和目录操作

检查文件或目录是否存在

from pathlib import Path

p = Path('第26天/常用库.py')

# 检查文件是否存在
if p.exists():
    print("文件存在")
else:
    print("文件不存在")

# 检查是否是文件
if p.is_file():
    print("这是一个文件")

# 检查是否是目录
if p.is_dir():
    print("这是一个目录")

创建目录

from pathlib import Path

p = Path('第26天')

# 创建单个目录
p.mkdir(exist_ok=True)  # 如果目录已存在,不会抛出异常

# 创建多级目录
p = Path('第26天/test')
p.mkdir(parents=True, exist_ok=True)

删除文件或目录

from pathlib import Path

p = Path('my_file.txt')

# 删除文件
p.unlink(missing_ok=True)  # 如果文件不存在,不会抛出异常

# 删除空目录
p = Path('test')
p.rmdir()

# 删除非空目录及其内容
import shutil
shutil.rmtree('test')

遍历目录

from pathlib import Path

p = Path('第26天')

# 遍历所有文件和子目录
for item in p.iterdir():
    print(item)

# 递归遍历所有文件
for file in p.rglob('*.py'):
    print(file)

# 查找特定模式的文件
for file in p.glob('*.py'):
    print(file)

5. 文件操作

读取文件内容

p = Path('my_file.txt')

# 读取文本文件
content = p.read_text(encoding='utf-8')
print(content)

# 读取二进制文件
data = p.read_bytes()
print(data)

写入文件内容

p = Path('my_file.txt')

# 写入文本文件
p.write_text('Hello, World!', encoding='utf-8')

# 写入二进制文件
p.write_bytes(b'Binary data')

复制和移动文件

from pathlib import Path
import shutil

source = Path('my_file.txt')
destination = Path('copied_file.txt')

# 复制文件
shutil.copy(source, destination)

# 移动文件
source.rename(destination)

6. 高级用法

解析和构建路径

pathlib 提供了许多方法来解析和构建路径,使你的代码更加灵活和可维护。

p = Path('/home/user/documents/report.pdf')

# 解析路径
parts = p.parts
print(parts)  # 输出: ('/', 'home', 'user', 'documents', 'report.pdf')

# 构建路径
new_path = Path('/').joinpath(*parts[1:])
print(new_path)  # 输出: /home/user/documents/report.pdf

# 替换路径的一部分
new_p = p.with_name('new_report.pdf')
print(new_p)  # 输出: /home/user/documents/new_report.pdf

# 替换文件扩展名
new_p = p.with_suffix('.txt')
print(new_p)  # 输出: /home/user/documents/report.txt

处理符号链接

pathlib 也支持符号链接的操作。

# 创建符号链接
target = Path('real_file.txt')
link = Path('symbolic_link.txt')
link.symlink_to(target)

# 检查是否是符号链接
if link.is_symlink():
    print("这是一个符号链接")

# 解析符号链接的目标
real_path = link.resolve()
print(real_path)

7. 生动的例子

示例 1:批量重命名文件

假设你有一个包含多个图片文件的目录,你想将它们批量重命名为 image_001.jpg, image_002.jpg 等格式。

from pathlib import Path

folder = Path('images')
files = list(folder.glob('*.jpg'))

for i, file in enumerate(files, start=1):
    new_name = f'image_{i:03d}.jpg'
    file.rename(folder / new_name)

示例 2:查找并删除大文件

假设你想查找并删除某个目录中超过 10MB 的文件。

from pathlib import Path

folder = Path('large_files')

for file in folder.rglob('*'):
    if file.is_file() and file.stat().st_size > 10 * 1024 * 1024:
        print(f"Deleting {file}")
        file.unlink()

示例 3:备份文件夹

假设你想备份一个文件夹,并将其压缩为 .zip 文件。

from pathlib import Path
import zipfile
import os

def backup_folder(src_folder, dest_zip):
    with zipfile.ZipFile(dest_zip, 'w', zipfile.ZIP_DEFLATED) as zipf:
        for root, _, files in os.walk(src_folder):
            for file in files:
                file_path = Path(root) / file
                arcname = file_path.relative_to(src_folder)
                zipf.write(file_path, arcname)

# 使用示例
backup_folder('my_folder', 'backup.zip')

总结

pathlib 是一个非常强大且易于使用的模块,它简化了文件系统路径的操作。通过面向对象的设计,pathlib 使代码更加清晰、简洁和可维护。

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

相关文章

python asyncio -- 异步编程 python异步编程用在哪里

概念:asyncio 是 python3.4 版本引入的标准库,直接内置了对异步IO的支持。本质上asyncio的编程模型是一个消息循环,asyncio 模块内部实现了EventLoop,把需要执行的...

pip在Python中的9个必须知道的用法

如今,构建商业软件需要使用许多现有的框架、包或模块。因此,一种优雅的编程语言应该有一个易于使用的包管理工具。Java有Maven, Ruby有RubyGems, JavaScript有npm,…,那么...

Python协程之asyncio Python协程之间共享变量

asyncio 是 Python 中的异步IO库,用来编写并发协程,适用于IO阻塞且需要大量并发的场景,例如爬虫、文件读写。私信小编01即可获取Python学习资料asyncio 在 Python3....

一次说明白Python爬虫中多线程,多进程,异步IO编程

图/文:迷神我们在Python爬虫中,重要的是讲究速度,如果有10万或者100万Url地址,写过爬虫的都会知道,那估计是非常慢的。我们的Python爬虫一般IO密集型业务,Python爬虫程序需要发起...

Python编程之第1节(环境配置) python3.8配置环境变量

1,Python是一种动态解释型的编程语言,可以在Windows、UNIX、MAC等多种操作系统上使用,也可以在Java、.NET开发平台上使用。2,特点:Python使用C语言开发,但Python不...

方便!Python 操作 Excel 神器 xlsxwriter 初识

作者:潮汐来源:Python 技术随着技术栈的越来越成熟,为了解决重复的劳动力型工作,越来越多的人开始学习自动化办公,使用技术帮助自己高效工作,提升工作效率,今天的文章讲解如何使用Python技术中的...