12 个你可能从未听说过的强大 Python 库


Python 是一门以其简单性、可读性和广泛的库生态系统而闻名的多功能编程语言。虽然许多开发人员都熟悉诸如 NumPypandasrequestsFlask 等流行库,但还有很多鲜为人知的库可以提高你的生产力,帮助你更高效地解决特定问题。

这些库常常被更为流行的库所掩盖,但它们提供了独特的功能,可以简化任务、优化工作流程并为你的项目带来创新。

Python 拥有许多非常有用但并不广为人知的库。这些库可以用来自动化重复任务、更有效地处理数据,并用更少的代码构建强大的应用程序。

本文将涵盖解决文件处理、数据处理和 Web 开发等不同领域的各种库,这些库可以让你的开发过程更加顺畅和高效。让我们开始吧!

1. WeasyPrint - 将 HTML 和 CSS 转换为 PDF

WeasyPrint 是一个简单优雅的库,它允许你从 HTML 和 CSS 生成 PDF。与其他 PDF 库不同,它支持复杂的布局并使用熟悉的 Web 技术。

示例:

# WeasyPrint - 将 HTML 和 CSS 转换为 PDF

from weasyprint import HTML

html_content = """

Hello, World!

This is a PDF generated from HTML and CSS.

""" HTML(string=html_content).write_pdf("output.pdf")

此库可用于需要动态生成发票和报告 PDF 的 Web 应用程序中。

2. Pyexcel - 简化 Excel 数据处理

Pyexcel 是一个轻量级库,允许我们以最少的代码读取、写入和操作多种格式的 Excel 文件(如 .xls、.xlsx、.ods)。

示例:

# Pyexcel - 简化 Excel 数据处理

import pyexcel as p

data = p.get_array(file_name="example.xlsx")

print(data)

这个库适合在项目中处理多种 Excel 格式时使用。

3. Pendulum - 简化日期/时间处理

Pendulum 是 Python datetime 库的一个替代品。它提供了更直观、简洁的 API,用于处理日期和时间,支持时区、解析、格式化和日期运算。

示例:

# Pendulum - 简化日期/时间处理

import pendulum

now = pendulum.now('UTC')

print(now.to_datetime_string())  

# 输出: 
2024-04-09 14:32:10

该库简化了许多复杂的日期操作,处理时区和夏令时变化时尤为有用。

4. Tenacity - Python 重试库

Tenacity 是一个通用的重试库,它简化了对不可靠函数(如网络请求或数据库连接)的重试逻辑。

示例:

# Tenacity - Python 重试库

from tenacity import retry, stop_after_attempt

@retry(stop=stop_after_attempt(3))
def unreliable_function():
    print("Attempting to execute...")
    raise Exception("Failed")

unreliable_function()

该库可用于优雅地处理偶尔的网络错误。

5. Dataset - 简化数据库交互

Dataset 是一个数据库抽象层库,它允许我们使用 Python 风格的语法与 SQL 数据库交互。非常适合快速构建基于数据库的应用程序,而无需编写 SQL。

示例:

# Dataset - 简化数据库交互

import dataset

db = dataset.connect('sqlite:///mydatabase.db')

db['users'].insert(dict(name='John Doe', age=30))

这个库使我们可以专注于应用逻辑,而不必担心复杂的 ORM 配置。

6. Poetry - 依赖管理和打包工具

Poetry 是一个依赖管理和打包工具,简化了 Python 项目的管理。它可以处理依赖、构建和发布到 PyPI,只需一个简单的配置文件。

示例:

# Poetry - 依赖管理和打包工具

poetry new my_project

poetry add pendulum
poetry add requests

这个库简化了虚拟环境的设置、依赖管理和项目打包的流程。

7. Dask - 带有任务调度的并行计算

Dask 是一个灵活的并行计算库,可以与现有的 Python 代码集成。它允许处理大数据集,通过并行处理大大减少整体处理时间。

示例:

# Dask - 带有任务调度的并行计算

import dask.dataframe as dd

# 读取大数据集
df = dd.read_csv('large_dataset.csv')

# 并行执行 groupby 操作
result = df.groupby('category').sum().compute()

print(result)

8. Faker - 生成用于测试的假数据

Faker 是一个帮助我们生成假数据的库,如姓名、地址、电子邮件和电话号码等。它适用于测试、数据生成和数据库填充。

示例:

# Faker - 生成用于测试的假数据

from faker import Faker

fake = Faker()

print(fake.name())  # 输出随机名字
print(fake.address())  # 输出随机地址

9. FlashText - 快速关键词搜索和替换

FlashText 是一个用于快速关键词搜索和替换的库。与正则表达式相比,它在关键词搜索操作中更高效。

示例:

# FlashText - 快速关键词搜索和替换

from flashtext import KeywordProcessor

keyword_processor = KeywordProcessor()
keyword_processor.add_keyword('JavaScript', 'JS')

text = "JavaScript is a popular programming language."

print(keyword_processor.replace_keywords(text))  

# 输出: 
JS is a popular programming language.

10. PyPDF2 - 操作 PDF 文件

PyPDF2 是一个库,允许我们操作 PDF 文件,包括合并、拆分、旋转和从 PDF 中提取文本。

示例:

# PyPDF2 - 操作 PDF 文件

from PyPDF2 import PdfReader, PdfWriter

reader = PdfReader('input.pdf')

writer = PdfWriter()

for page in reader.pages:
    writer.add_page(page)

with open('output.pdf', 'wb') as f:
    writer.write(f)

11. Humanize - 将数据转换为用户友好的格式

Humanize 是一个 Python 库,提供了将数据转换为人类可读格式的工具,例如将数字转换为词语、将日期转换为模糊时间等。

示例:

# Humanize - 将数据转换为用户友好的格式

import humanize

print(humanize.naturalsize(1024))  
# 输出: '1.0 kB'

print(humanize.intword(1234567890))  
# 输出: '12 亿'

12. Memory-Profiler - 监控 Python 代码的内存使用情况

Memory-Profiler 是一个用于逐行监控 Python 程序内存使用情况的模块。

示例:

# Memory-Profiler - 监控 Python 代码的内存使用情况

from memory_profiler import profile

@profile
def my_func():
    a = [1] * (10 ** 6)
    b = [2] * (2 * 10 ** 7)
    del b
    return a

my_func()

结论

Python 的生态系统充满了可以显著提升开发体验的库,尽管它们不像主流库那么广为人知。

#秋日生活打卡季#

相关文章

python中常用的10个标准库

Python中常用的标准库有很多,它们可以帮助我们完成各种任务,例如操作系统、文件、网络、数据、数学、文本等。以下是一些python中10常用的标准库的介绍:os:os模块提供了许多与操作系统交互的函...

13个python常用库,提高你的开发能力

Python拥有大量封装好的功能模块和工具库,这些库广泛应用于数据分析、机器学习、Web开发、自动化等多个领域。库在Python的作用非常重要,利用库不仅能简化复杂的任务还能极大减少开发的时间。下面介...

创业公司都在使用的3款Python库

Instavest上发表了一篇博文,文章分享了深受创业公司喜爱的3款Python库,该文章在Hacker News 上引发了开发者的激烈探讨,如果你也对此感兴趣,不妨移步去看下。笔者将该文简译过来以分...

推荐 7 个实用的 Python 工具库,加速你的项目开发

转载说明:原创不易,未经授权,谢绝任何形式的转载工欲其善,必先利其器,推荐 7 个高效的 Python 库当一个库可以完成同样的事情时,你为什么要创建自定义功能?在我看来,一个好的项目会利用一些可用的...

这7个实用的Python库,提高你的开发生产力

转载说明:原创不易,未经授权,谢绝任何形式的转载Python 作为一种高效、易用的编程语言,其强大的生态系统使其成为了各行各业的首选语言。在这个生态系统中,有很多优秀的 Python 库,能够帮助开发...

5个奇妙的Python库

引言Python是一个非常神奇语言,无论我们要做什么任务,python都有其解决方案,无论它与机器学习,数据可视化,图像处理还是任何简单的任务。Python为各种简单和困难的任务提供了大量的资源。大多...