Python启航:30天编程速成之旅(第26天)- pathlib

liftword23小时前技术文章5

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

前期基础教程:

「Python3.11.0」手把手教你安装最新版Python运行环境

讲讲Python环境使用Pip命令快速下载各类库的方法

Python启航:30天编程速成之旅(第2天)-IDE安装

【Python教程】JupyterLab 开发环境安装


pathlib 是 Python 3.4 引入的一个标准库模块,它提供了一种面向对象的方式处理文件系统路径。相比传统的 os.path 模块,pathlib 更加直观和易用。本教程将涵盖 pathlib 的基本概念、常用方法以及一些生动的例子,帮助你更好地理解和使用这个强大的工具。

1. 入门简介

pathlib 提供了两个主要的类来表示文件路径:

  • Path: 适用于所有类型的路径。
  • PurePath: 用于纯路径操作(不涉及文件系统的实际访问)。

在大多数情况下,你会使用 Path 类,因为它不仅提供了 PurePath 的所有功能,还可以与操作系统进行交互,如检查文件是否存在、创建目录等。

安装与导入

pathlib 是 Python 标准库的一部分,因此不需要额外安装。你可以直接导入并使用它:

from pathlib import Path

2. 基本用法

创建路径对象

你可以通过传递字符串或另一个 Path 对象来创建一个 Path 实例。Path 支持相对路径和绝对路径。

# 使用字符串创建路径
p = Path('my_folder/my_file.txt')
print(p)  # 输出: my_folder/my_file.txt

# 使用另一个 Path 对象创建路径
base_path = Path('my_folder')
file_path = base_path / 'my_file.txt'
print(file_path)  # 输出: my_folder/my_file.txt

注意:/ 运算符可以用来连接路径,这使得代码更加简洁和易读。

获取当前工作目录

你可以使用 Path.cwd() 来获取当前工作目录的路径。

current_dir = Path.cwd()
print(current_dir)  # 输出当前工作目录的绝对路径

获取用户主目录

你可以使用 Path.home() 来获取当前用户的主目录。

home_dir = Path.home()
print(home_dir)  # 输出当前用户的主目录

3. 路径属性

Path 对象提供了许多有用的属性来获取路径的不同部分。

文件名和扩展名

p = Path('my_folder/my_file.txt')

# 获取文件名
print(p.name)  # 输出: my_file.txt

# 获取文件名(不含扩展名)
print(p.stem)  # 输出: my_file

# 获取文件扩展名
print(p.suffix)  # 输出: .txt

父级目录

p = Path('my_folder/sub_folder/my_file.txt')

# 获取父级目录
print(p.parent)  # 输出: my_folder/sub_folder

# 获取上一级父级目录
print(p.parents[1])  # 输出: my_folder

绝对路径

p = Path('my_folder/my_file.txt')

# 获取绝对路径
print(p.resolve()) 

4. 文件和目录操作

检查文件或目录是否存在

from pathlib import Path

p = Path('第26天/常用库.py')

# 检查文件是否存在
if p.exists():
    print("文件存在")
else:
    print("文件不存在")

# 检查是否是文件
if p.is_file():
    print("这是一个文件")

# 检查是否是目录
if p.is_dir():
    print("这是一个目录")

创建目录

from pathlib import Path

p = Path('第26天')

# 创建单个目录
p.mkdir(exist_ok=True)  # 如果目录已存在,不会抛出异常

# 创建多级目录
p = Path('第26天/test')
p.mkdir(parents=True, exist_ok=True)

删除文件或目录

from pathlib import Path

p = Path('my_file.txt')

# 删除文件
p.unlink(missing_ok=True)  # 如果文件不存在,不会抛出异常

# 删除空目录
p = Path('test')
p.rmdir()

# 删除非空目录及其内容
import shutil
shutil.rmtree('test')

遍历目录

from pathlib import Path

p = Path('第26天')

# 遍历所有文件和子目录
for item in p.iterdir():
    print(item)

# 递归遍历所有文件
for file in p.rglob('*.py'):
    print(file)

# 查找特定模式的文件
for file in p.glob('*.py'):
    print(file)

5. 文件操作

读取文件内容

p = Path('my_file.txt')

# 读取文本文件
content = p.read_text(encoding='utf-8')
print(content)

# 读取二进制文件
data = p.read_bytes()
print(data)

写入文件内容

p = Path('my_file.txt')

# 写入文本文件
p.write_text('Hello, World!', encoding='utf-8')

# 写入二进制文件
p.write_bytes(b'Binary data')

复制和移动文件

from pathlib import Path
import shutil

source = Path('my_file.txt')
destination = Path('copied_file.txt')

# 复制文件
shutil.copy(source, destination)

# 移动文件
source.rename(destination)

6. 高级用法

解析和构建路径

pathlib 提供了许多方法来解析和构建路径,使你的代码更加灵活和可维护。

p = Path('/home/user/documents/report.pdf')

# 解析路径
parts = p.parts
print(parts)  # 输出: ('/', 'home', 'user', 'documents', 'report.pdf')

# 构建路径
new_path = Path('/').joinpath(*parts[1:])
print(new_path)  # 输出: /home/user/documents/report.pdf

# 替换路径的一部分
new_p = p.with_name('new_report.pdf')
print(new_p)  # 输出: /home/user/documents/new_report.pdf

# 替换文件扩展名
new_p = p.with_suffix('.txt')
print(new_p)  # 输出: /home/user/documents/report.txt

处理符号链接

pathlib 也支持符号链接的操作。

# 创建符号链接
target = Path('real_file.txt')
link = Path('symbolic_link.txt')
link.symlink_to(target)

# 检查是否是符号链接
if link.is_symlink():
    print("这是一个符号链接")

# 解析符号链接的目标
real_path = link.resolve()
print(real_path)

7. 生动的例子

示例 1:批量重命名文件

假设你有一个包含多个图片文件的目录,你想将它们批量重命名为 image_001.jpg, image_002.jpg 等格式。

from pathlib import Path

folder = Path('images')
files = list(folder.glob('*.jpg'))

for i, file in enumerate(files, start=1):
    new_name = f'image_{i:03d}.jpg'
    file.rename(folder / new_name)

示例 2:查找并删除大文件

假设你想查找并删除某个目录中超过 10MB 的文件。

from pathlib import Path

folder = Path('large_files')

for file in folder.rglob('*'):
    if file.is_file() and file.stat().st_size > 10 * 1024 * 1024:
        print(f"Deleting {file}")
        file.unlink()

示例 3:备份文件夹

假设你想备份一个文件夹,并将其压缩为 .zip 文件。

from pathlib import Path
import zipfile
import os

def backup_folder(src_folder, dest_zip):
    with zipfile.ZipFile(dest_zip, 'w', zipfile.ZIP_DEFLATED) as zipf:
        for root, _, files in os.walk(src_folder):
            for file in files:
                file_path = Path(root) / file
                arcname = file_path.relative_to(src_folder)
                zipf.write(file_path, arcname)

# 使用示例
backup_folder('my_folder', 'backup.zip')

总结

pathlib 是一个非常强大且易于使用的模块,它简化了文件系统路径的操作。通过面向对象的设计,pathlib 使代码更加清晰、简洁和可维护。

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。

相关文章

人生苦短,我要在VSCode里面用Python

轻沉 发自 浅度寺 量子位 出品 | 公众号 QbitAI在程序员圈子里,Visual Studio Code(以下简称VSCode)可以说是目前最火的代码编辑器之一了。它是微软出品的一款可扩展的轻量...

轻松教会你Python的文件操作 python文件操作的三个步骤

1、前言Python中有几个内置模块和方法来处理文件。这些方法被分割到例如os, os.path , shutil 和 pathlib 等等几个模块中。文章将列举Python中对文件最常用的操作和方法...

你不可不知的Python宝藏库:pathlib.Path

在日常的Python开发中,我们经常需要处理文件和路径。传统上,我们可能会使用os模块来完成这些任务,但实际上,有一个更为优雅和强大的工具——pathlib模块,特别是其中的Path类,正是我们今天要...

赶紧收藏!编程python基础知识,本文给你全部整理好了

想一起学习编程Python的同学,趁我粉丝少,可以留言、私信领编程资料~Python基础入门既然学习 Python,那么至少得了解下这门编程语言,知道 Python 代码执行过程吧。Python 的历...

Python Supervisor进程管理介绍(大厂也在用)

要了解Supervisor进程管理需要先了解什么是守护进程。守护进程(daemon)是一类在后台运行的特殊进程,用于执行特定的系统任务。很多守护进程在系统引导的时候启动,并且一直运行直到系统关闭。另一...