Python之txt数据预定替换word预定义定位标记生成word报告(三)

liftword1个月前 (03-29)技术文章5

需接Python之txt数据预定替换word预定义定位标记生成word报告(一)和(二),续写第三部分python代码,本部分代码为:数据处理模块 - DataProcessor类

Python之txt数据预定替换word预定义定位标记生成word报告(一)

https://mp.toutiao.com/profile_v4/graphic/preview?pgc_id=7482354347595088424

Python之txt数据预定替换word预定义定位标记生成word报告(二)

https://mp.toutiao.com/profile_v4/graphic/preview?pgc_id=7482355993293160994

数据处理模块 - DataProcessor类,代码如下:

class DataProcessor:
    """TXT数据处理引擎,功能:
    1. 从文件名提取IP
    2. 解析检查项数据
    """

    @staticmethod
    def extract_data(file_path):
        """从TXT文件提取结构化数据
        :param file_path: 文件完整路径
        :return: 字典格式 {标记: 数据内容}
        """
        data = {}
        current_section = None

        with open(file_path, 'r', encoding='utf-8-sig') as f:
            content = f.read()

        for marker, (start_pat, end_pat) in CHECK_BLOCKS.items():
            pattern = re.compile(rf"{start_pat}\n(.*?)\n{end_pat}", re.DOTALL | re.MULTILINE)
            if match := pattern.search(content):
                cleaned = re.sub(r"^-{4,}$", "", match.group(1).strip(), flags=re.MULTILINE)
                data[marker] = cleaned
                print(f"提取成功:{marker}({len(cleaned)}字符)")
            else:
                data[marker] = "[数据缺失]"
                print(f"未找到:{marker}")

        return data
- **类定义**:`DataProcessor`类用于处理TXT文件数据。
- **`extract_data`静态方法**:读取TXT文件内容,根据`CHECK_BLOCKS`中定义的正则表达式模式提取每个检查项的数据,返回一个字典,键为检查项标记,值为提取的数据内容,如果未找到则返回`[数据缺失]`。

相关文章

Python 中读取、写入和管理文件的基础知识

File 处理是 Python 中每个开发人员都应该掌握的一项基本技能。无论您是在处理文本文件、日志、配置文件,还是二进制数据,了解如何读取、写入和管理文件都是必不可少的。Python 的内置工具使文...

一文掌握Python找到文件操作

阅读文件读取文件的全部内容:with open('example.txt', 'r') as file: content = file.read() print(content)2....

Python文件和异常处理打开、读写和关闭文件详解

文件和异常处理是 Python 编程中非常重要的概念。在本篇文章中,我们将详细讲解如何打开、读写和关闭文件,以及如何处理异常。文件操作在 Python 中,可以使用内置的 open() 函数打开文件。...

小白零基础用Python半小时搞定TXT转PDF!附赠脚本

"原来根本不用充会员!" 昨天我还在为100本TXT电子书无法上传腾讯ima知识库急得跳脚,今天却用60行Python代码实现了全自动转换pdf(全程没花1分钱)。作为一个连安装软件都要百度的新手,这...

Python 文件读写(txt、json、xml、ini)

在进行接口自动化测试时,我们经常需要处理各种格式的文件。熟练掌握对这些文件的读写能力对于提升测试效率至关重要。今天我们就来一起学习如何用Python来操作常见的文件类型,包括文本文件(.txt)、JS...

怎么用Python提取txt的章节目录?

提取txt文本中的章节在网络上下载的小说,一般是txt格式的,并且往往是没有目录的。那么有没办法提取出小说的目录呢?下面是一个示例代码,用于提取txt文本中的章节作为目录: import re #...