探索隐藏在Python标准库中的小工具

liftword3周前 (12-04)技术文章13

你可能会一点Python编程,也写过很多脚本和小工具。但是鲜为人知是在Python的标准库中却包含着很多很有用的小工具,你无需写半行代码,就可以直接拿来在shell中使用。

比如Python中的gzip模块,就可以这样使用:

python -m gzip –decompress xxx.gz

这是一个简洁的Python功能:带有if __name__ == "__main__":

Python标准导入路径上可用的块可以使用以下命令从终端执行

python -m name_of_module。

事实上python标准库中有很多这样的工具,请大家和虫虫一起去探索。

概述

我们先用简单的方法探索一下Python的标准库,使用

python -m site

可以输出有当前环境下Python安装路径等有用信息:

python3 -m site

sys.path = [

'/home/debian',

'/usr/lib/python39.zip',

'/usr/lib/python3.9',

'/usr/lib/python3.9/lib-dynload',

'/usr/local/lib/python3.9/dist-packages',

'/usr/lib/python3/dist-packages',

]

USER_BASE: '/home/debian/.local' (exists)

USER_SITE: '/home/debian/.local/lib/python3.9/site-packages' (doesn't exist)

ENABLE_USER_SITE: True

这表明Python标准库位置为/usr/lib/python3.9。

所以我切换到那里并使用 ripgrep查找可能的包:

cd /usr/lib/python3.9

再次,我们用一个ripgrep单行命令:

rg 'if __name__ =' -l | grep -v 'test/' | grep -v 'tests/' | grep -v idlelib | grep -v turtledemo\

ripgrep -l选项表示列出匹配的文件。然后使用grep -v排除掉test/,tests/,idlelib/和turtledemo/等目录,这些目录下都是无用的,其他则是python标准库中包含的一些有用的小工具:

pickle.py
pprint.py
asyncio/__main__.py
getopt.py
json/tool.py
smtpd.py
dbm/__init__.py
imghdr.py
smtplib.py
platform.py
sndhdr.py
pstats.py
tabnanny.py
py_compile.py
modulefinder.py
curses/textpad.py
curses/has_key.py
venv/__init__.py
distutils/fancy_getopt.py
runpy.py
compileall.py
zipfile.py
random.py
sre_constants.py
http/server.py
zipapp.py
gzip.py
mailcap.py
heapq.py
inspect.py
nntplib.py
doctest.py
aifc.py
pickletools.py
calendar.py
ftplib.py
xmlrpc/client.py
xmlrpc/server.py
lib2to3/pgen2/driver.py
lib2to3/pgen2/literals.py
lib2to3/pgen2/tokenize.py
pydoc.py
pdb.py
site.py
ctypes/util.py
encodings/rot_13.py
wsgiref/simple_server.py
cgi.py
filecmp.py
netrc.py
shlex.py
webbrowser.py
uu.py
timeit.py
tarfile.py
pyclbr.py
quopri.py
dis.py
codecs.py
base64.py
telnetlib.py
formatter.py
sysconfig.py
mimetypes.py
symtable.py
code.py
fileinput.py
difflib.py
xml/sax/expatreader.py
xml/sax/xmlreader.py
tokenize.py
textwrap.py
profile.py
poplib.py
cProfile.py
turtle.py
ast.py
imaplib.py
multiprocessing/spawn.py

工具使用

上面,咱们搜索出来这些工具都有用处,感兴趣的同学可以一一尝试一下,此处我们介绍几个非常有用称手的供大家参考使用。

http.server

这个工具很多人,可能早就知道了。就是python中自带的一个web服务器http.server。该工具可以在当前目录下起一个web服务,默认监听的端口为8000。

python3 -m http.server

可以自定义其他端口,比如8080(注意不要和其他服务已经监听的端口重复了):

Python3 -m http.server 8080

默认是列出当前目录中的文件,可以用于临时文件共享等使用。

我们可以创建一个index.html文件,就可以显示一个页面了:

echo "<H1>Hello,Chongchong!</H1>" >index.html

然后用浏览器访问:

注意该该web服务工具,没有考虑安全、性能等问题,建议仅仅当做临时服务用途。

base64

这是一个base64文档的编码工具,其使用可以用-h查看帮助。

python3 -m base64 -h
usage: .../base64.py [-h|-d|-e|-u|-t] [file|-]
-h: print this help message and exit
-d, -u: decode
-e: encode (default)
-t: encode and decode string 'Aladdin:open sesame'

我们可以用他进行编码(-e)和解码(-d)

echo "Hello,chongchong!"|python3 -m base64 -e

asyncio

这提供了一个带有异步await的Python控制台:

Python3 -m asyncio


tokenize

tokenize是一个很有意思的工具。它是Python简单的分词器(基于标点符号)。可以用一个文件作为参数运行它:

python3 -m tokenize index.html

AST

ast模块提供的parse()函数将源代码进行解析,转为抽象语法树对象。

python3 -m ast ee.py

json.tool

可以对接送内容进行解析和展示:

echo ' {"AAA": "XXX", "NUM": [1, 2, 3]} ' | python3 -m json.tool
{
"AAA": "XXX",
"NUM": [
1,
2,
3
]
}

random

这是一个用于生成随机数字的的工具,但是只提供简单生成随机,不支持额外选项:

python3 -m random

calendar

显示当前年份的日历:

python3 -m calendar

这个有更多选项,-h查看帮助。

ntplib

nntplib是python内置的显示python新闻组中的最新文章,默认的新闻组为gmane.comp.python.general:

这些看起来像是真实的、最近的消息

总结

本文我们介绍了,在Python内置的标准库中挖宝的故事。在Python标准库中隐藏着很多不为人所知的工具,如果善于利用能对我们有很大的帮助。本文提及的只是冰山一角,还有大量的工具有待于大家去探索,除了可以直接拿来用之外,这个探索过程本身也是了解Python生态体系和模块使用的过程,对提高我们的Python编程能力大有裨益。

相关文章

独家 | 让你的代码事半功倍——Python装饰器

作者: Ayush Thakur 翻译:王可汗校对:潘玏妤本文约2400字,建议阅读5分钟本文介绍了用Python装饰器的基本概念和示例。大家好,欢迎来到我的博客!今天我将与大家分享一些神奇的Pyt...