写出更优雅的代码:搞懂 Python 协议与抽象基类的核心区别

多年来,我参与过许多 Python 项目,从大型企业系统到模块化库,一个持续的挑战是以清晰、可维护和可扩展的方式定义和实施对象的行为,Python 为此提供了两个强大的工具:协议和抽象基类 (ABC)。

虽然两者都有助于定义对象应该做什么,但它们迎合了不同的场景和思维方式,在这篇文章中,我将向你介绍它们是什么、它们如何工作以及我发现它们何时最有用。

动态 Duck 类型的协议

如果你曾经使用过 Python 的动态鸭子类型方法,你可能已经体验过依赖对象以某种方式“嘎嘎”的自由(和混乱),协议采用这个想法,并通过类型提示将其形式化。

Python 的 typing 模块 (3.8+) 中引入的协议提供了一种无需显式继承即可定义接口的方法,协议定义了对象必须实现的一组方法或属性才能被视为 “兼容”,协议的特别之处在于它们不关心继承 — 任何具有所需方法或属性的对象都满足协议。

数据处理示例

让我们举一个受我使用的财务分析工具启发的示例,系统处理来自 API、数据库和 CSV 文件等各种来源的数据,每个数据源对象都有 and 方法,但它们不共享公共父类,我们需要一种方法来确保这些对象与共享的处理函数一起工作,而无需强制重构。

from typing import Protocol

class DataSource(Protocol):
    def read(self) -> str:
        ...
    def write(self, data: str) -> None:
        ...

class APIClient:
    def read(self) -> str:
        return "Data from API"

    def write(self, data: str) -> None:
        print(f"Sending data to API: {data}")

class CSVHandler:
    def read(self) -> str:
        return "Data from CSV"

    def write(self, data: str) -> None:
        print(f"Writing to CSV: {data}")

def process_data(source: DataSource) -> None:
    data = source.read()
    print(f"Processing: {data}")
    source.write("Processed data")

api_client = APIClient()
csv_handler = CSVHandler()

process_data(api_client)  # Works with APIClient
process_data(csv_handler)  # Works with CSVHandler

此方法允许函数接受满足协议的任何对象。这就是为什么我认为协议在这种情况下效果很好:

  • 该协议定义了传递给 的任何对象所需的 and 方法.DataSourcereadwriteprocess_data
  • 和 都实现了这些方法,但不需要从公共基类继承.APIClientCSVHandler
  • 这种灵活性可确保系统可扩展 — 你可以在不修改现有代码的情况下添加新的数据源类型。

根据我的经验,协议在处理遗留代码或集成第三方库时特别有用,由于它们不需要继承,因此它们可以提供类型安全并强制执行行为,而无需强制你重构现有系统。

协议的工作原理

在后台,Python 使用元类使协议同时用作类型提示和运行时验证器,当你使用 Python 定义协议时,Python 会创建一个处理结构类型检查的特殊元类,这意味着,如果对象实现了所需的方法和属性,则该对象被视为协议的虚拟子类。

print(issubclass(APIClient, DataSource))  # True
print(isinstance(csv_handler, DataSource))  # True

既不是 NOR 显式继承自 ,但 Python 的元类机制确保它们符合条件,因为它们实现了 and 方法。
APIClientCSVHandlerDataSourcereadwrite

请注意,如果需要在运行时验证协议,则必须使用模块中的装饰器,没有它,检查将不起作用:@
runtime_checkabletypingisinstanceissubclass

from typing import runtime_checkable

@runtime_checkable
class DataSource(Protocol):
    def read(self) -> str:
        ...
    def write(self, data: str) -> None:
        ...

print(isinstance(api_client, DataSource))  # True

这种灵活性使协议在类型检查方面特别强大,同时保持代码的动态性和可扩展性。

用于设计时结构的抽象基类

协议具有很高的灵活性,但有时你需要更结构化的方法,这就是抽象基类 (ABC) 的用武之地,ABC 是一种工具,通过定义 subclasses 必须实现的严格接口来强制执行一致行为,与协议不同,ABC 需要显式继承,因此当你希望在代码中明确定义层次结构时,它们是更好的选择。

我发现 ABC 在系统的设计阶段特别有用,因为你从头开始构建东西,并希望确保所有子类都遵循一个通用的契约。

报告插件示例

假设我们正在构建一个系统,其中每个插件都会生成一个报告并需要特定的配置,在这里,我们可以使用 ABC 来强制执行一个结构,其中所有插件都实现了 method 和 .generate_reportconfigure

from abc import ABC, abstractmethod

class ReportPlugin(ABC):
    @abstractmethod
    def generate_report(self, data: dict) -> str:
        """Generate a report based on the given data."""
        pass

    @abstractmethod
    def configure(self, settings: dict) -> None:
        """Configure the plugin with specific settings."""
        pass

class PDFReportPlugin(ReportPlugin):
    def generate_report(self, data: dict) -> str:
        return f"PDF Report for {data['name']}"

    def configure(self, settings: dict) -> None:
        print(f"Configuring PDF Plugin with: {settings}")

class HTMLReportPlugin(ReportPlugin):
    def generate_report(self, data: dict) -> str:
        return f"HTML Report for {data['name']}"

    def configure(self, settings: dict) -> None:
        print(f"Configuring HTML Plugin with: {settings}")

def run_plugin(plugin: ReportPlugin, data: dict, settings: dict) -> None:
    plugin.configure(settings)
    report = plugin.generate_report(data)
    print(report)

pdf_plugin = PDFReportPlugin()
run_plugin(pdf_plugin, {"name": "John Doe"}, {"font": "Arial"})

html_plugin = HTMLReportPlugin()
run_plugin(html_plugin, {"name": "Jane Smith"}, {"color": "blue"})

在此示例中:

  • 强制结构:所有插件都必须显式继承并实现 and 方法。ReportPlugingenerate_reportconfigure
  • 行为是可预测的:该函数可在任何插件上运行,而无需了解其详细信息。run_plugin
  • 可扩展性很简单:添加新插件非常简单,共享接口可确保一致性。

何时使用协议与 ABC

协议和 ABC 之间的选择并不总是非黑即白的,根据我的经验,这通常取决于项目的背景和你的目标,以下是帮助你决定使用哪种方法的一般准则:

在以下情况下使用协议

  • 你正在使用现有代码或集成第三方库。
  • 灵活性是重中之重,你不希望强制实施严格的层次结构。
  • 来自不相关类层次结构的对象需要共享行为。

在以下情况下使用 ABC

  • 你正在从头开始设计一个系统,需要强制执行结构。
  • 类之间的关系是可预测的,并且继承是有意义的。
  • 共享功能或默认行为可以减少重复并提高一致性。

反思

根据我的经验,协议和抽象基类不是相互竞争的工具,它们是互补的,我使用协议将类型安全改造到遗留系统中,而无需进行大量重构,另一方面,在从头开始构建系统时,我一直依赖 ABC,其中结构和一致性至关重要。

在决定使用哪个时,请考虑项目的灵活性需求和长期目标,协议提供灵活性和无缝集成,而 ABC 有助于建立结构和一致性,通过了解它们的优势,你可以选择合适的工具来构建强大、可维护的 Python 系统。

原文
:https://www.tk1s.com/python/protocols-vs-abstract-base-classes-in-python

相关文章

python面向对象四大支柱——抽象(Abstraction)详解

抽象是面向对象编程的四大支柱之一,它强调隐藏复杂的实现细节,只暴露必要的接口给使用者。下面我将全面深入地讲解Python中的抽象概念及其实现方式。一、抽象的基本概念1. 什么是抽象?抽象是一种"...

探秘Python抽象类

在那篇探讨Python接口与“鸭类型”关系的文章中(Python中接口与鸭类型),我们详细介绍了Python中接口的实现方式--鸭类型。尽管“鸭类型”仅作为接口的一种实现策略,并不具备像Java等其他...

[python] python抽象基类使用总结

在Python中,抽象基类是一类特殊的类,它不能被实例化,主要用于作为基类被其他子类继承。抽象基类的核心作用是为一组相关的子类提供统一的蓝图或接口规范,明确规定子类必须实现的方法,从而增强代码的规范性...

Python面向对象编程(OOP)实践教程

一、OOP理论基础1. 面向对象编程概述面向对象编程(Object-Oriented Programming, OOP)是一种编程范式,它使用"对象"来设计应用程序和软件。OOP的核心...

抽象基类ABC,名字取的傻白甜,其实是Python进阶必会知识点

作者:麦叔来源:麦叔编程ABC是什么我们来聊一个Python进阶话题,抽象基类,英文是Abstract Base Class,简称为ABC。这个名字看起来很简单,ABC,但其实是Python进阶的重要...

编程开发中的抽象概念

在编程开发中,抽象概念是核心思想之一,它通过隐藏复杂细节、提炼共性模式来简化设计和实现。以下是编程中常见的抽象概念分类及示例:1. 数据抽象(Data Abstraction)核心思想:将数据的具体表...