Python文件遍历之os、pathlib 遍历文件夹python

liftword3周前 (12-19)技术文章16

20221208星期四:


# os方式一:通过递归调用,拿到所有文件,或者指定结尾的文件:

# os方式二:通过 os.walk ,拿到目录下所有的目录及文件:

# pathlib方式三:通过 rglob 方法:获取文件夹下(以及子文件夹)所有文件,返回文件路径列表;

# pathlib方式四:同上,使用列表推导式方式:

pathlib方式五:通过 glob 方法:获取文件夹下(不含子文件夹)所有文件,返回文件路径列表;


import os
from pathlib import Path

path = r'F:\filePath'


# os方式一:

# 通过递归调用,拿到所有文件,或者指定结尾的文件:

# os方式一:
# 通过递归调用,拿到所有文件,或者指定结尾的文件:
listfileAll = []
def getAllDirRE(path):
    # 得到当前目录下的所有目录及文件:
    filesList = os.listdir(path)
    # 处理每一个文件:
    for fileName in filesList:
        # 判断是否是路径(用绝对路径):
        fileabsPath = os.path.join(path,fileName)
        if os.path.isdir(fileabsPath):
            # 递归调用:
            getAllDirRE(fileabsPath)
        else:
            # 拿到 .xlsx 结尾的文件:
            if fileName.endswith(".xlsx"):
                listfileAll.append(fileabsPath)
getAllDirRE(path)
print('listfileAll:',len(listfileAll),listfileAll)


# os方式二:

# 通过 os.walk ,拿到目录下所有的目录及文件:

# os方式二:
# 通过 os.walk ,拿到目录下所有的目录及文件:
pathWalk = os.walk(path)
listWalkAll = []
for root,dirs,files in pathWalk:
    """root: F:\filePath
        root: F:\filePath\fileNew
        root: F:\filePath\fileNew\fileThre
    """
    # print('root:',root)
    # 筛除空的列表:
    if files:
        for i in files:
            # 筛选 .xlsx 文件,且不为 __init__.py:
            if i.endswith('.xlsx') and i != '__init__.py':
                listWalkAll.append(os.path.join(root,i))
print('listWalkAll:',len(listWalkAll),listWalkAll)


# pathlib方式三:

# 通过 rglob 方法:获取文件夹下(以及子文件夹)所有文件,返回文件路径列表;

# pathlib方式三:
# 通过 rglob 方法:获取文件夹下(以及子文件夹)所有文件,返回文件路径列表;
folder = Path(path.strip())
result = folder.rglob(f"*.*") # 也可以写成 result = list(folder.rglob(f"*.*"))
# result: <class 'generator'> <generator object Path.rglob at 0x000002227CCC82E0>
print('result:',type(result),result)
result01 = []
for i in result:
    # i: <class 'pathlib.WindowsPath'> F:\filePath\anaconda镜像下载.txt
    # print('i:',type(i),i)
    result01.append(str(i))
# result01: <class 'list'> 10
print('result01:',type(result01),len(result01),result01)


# pathlib方式四:

# 使用列表推导式方式:

# 通过 rglob 方法:获取文件夹下(含子文件夹)所有文件,返回文件路径列表;

# pathlib方式四:
# 使用列表推导式方式:
# 通过 rglob 方法:获取文件夹下(含子文件夹)所有文件,返回文件路径列表;
result02 = [str(f) for f in folder.rglob("*.*") if Path(f).is_file()]
# result01: <class 'list'> 10
print('result02:',type(result02),len(result02),result02)


# pathlib方式五:

# 使用列表推导式方式:

# 通过 glob 方法:获取文件夹下(不含子文件夹)所有文件,返回文件路径列表;

# pathlib方式五:
# 使用列表推导式方式:
# 通过 glob 方法:获取文件夹下(不含子文件夹)所有文件,返回文件路径列表;
# 即,子文件的文件不会获取
result03 = [str(f) for f in folder.glob("*.*") if Path(f).is_file()]
# result01: <class 'list'> 5
print('result03:',type(result03),len(result03),result03)


"""
相对于传统的os及os.path,pathlib具体如下优势:

pathlib实现统一管理,解决了传统操作导入模块不统一问题;
pathlib使得在不同操作系统之间切换非常简单;
pathlib是面向对象的,路径处理更灵活方便,解决了传统路径和字符串并不等价的问题;
pathlib简化了很多操作,简单易用。
"""





相关文章

python 列表的遍历和循环 python列表的遍历输出

在Python中,列表是一种常用的数据结构,用于存储一组有序的元素。列表的遍历和循环是常见的操作,可以通过多种方式实现。1. 使用for循环遍历列表:my_list = [1, 2, 3, 4, 5]...

python每天学习一点点(遍历列表-for循环)

什么是遍历列表,就是将列表中的各个元素单独查找出来,以便完成相应的操作。遍历列表常用的就是for循环。那么如何使用呢?for循环语法格式:for item in listname: # 代码其...

一文了解 Python 列表 python列表常用的五种方法

假设你打算去附近的商店购买必需品,你要做的第一件事是什么?有答案了吗?是的,你可能会写下购物清单!Python 有一个名为 list 的内置数据结构,它与你的购物清单非常相似。这篇文章介绍 Pytho...

python列表的长度及遍历 python中列表长度的函数

在 Python 中,可以使用 len() 函数来获取一个列表的长度,并使用 [] 运算符来创建一个列表。例如:python# 创建一个列表my_list = [1, 2, 3, 4, 5]# 访问列...

Python 中如何逐行将文件内容读入列表

在 Python 中将文件内容逐行读取到列表中,可以使用 with 关键字利用 readlines()方法、循环、列表推导式等方法来完成。使用 readlines() 逐行读取文件# 使用readli...

Python数据类型——列表 python数据类型list

Python是一门高效易用的编程语言,其内置的数据类型也是非常丰富的。其中,列表(List)是Python中最常用的一种数据类型,它的功能非常强大,可以用于存储和处理各种类型的数据。本文将介绍Pyth...