探索隐藏在Python标准库中的小工具
你可能会一点Python编程,也写过很多脚本和小工具。但是鲜为人知是在Python的标准库中却包含着很多很有用的小工具,你无需写半行代码,就可以直接拿来在shell中使用。
比如Python中的gzip模块,就可以这样使用:
python -m gzip –decompress xxx.gz
这是一个简洁的Python功能:带有if __name__ == "__main__":
Python标准导入路径上可用的块可以使用以下命令从终端执行
python -m name_of_module。
事实上python标准库中有很多这样的工具,请大家和虫虫一起去探索。
概述
我们先用简单的方法探索一下Python的标准库,使用
python -m site
可以输出有当前环境下Python安装路径等有用信息:
python3 -m site
sys.path = [
'/home/debian',
'/usr/lib/python39.zip',
'/usr/lib/python3.9',
'/usr/lib/python3.9/lib-dynload',
'/usr/local/lib/python3.9/dist-packages',
'/usr/lib/python3/dist-packages',
]
USER_BASE: '/home/debian/.local' (exists)
USER_SITE: '/home/debian/.local/lib/python3.9/site-packages' (doesn't exist)
ENABLE_USER_SITE: True
这表明Python标准库位置为/usr/lib/python3.9。
所以我切换到那里并使用 ripgrep查找可能的包:
cd /usr/lib/python3.9
再次,我们用一个ripgrep单行命令:
rg 'if __name__ =' -l | grep -v 'test/' | grep -v 'tests/' | grep -v idlelib | grep -v turtledemo\
ripgrep -l选项表示列出匹配的文件。然后使用grep -v排除掉test/,tests/,idlelib/和turtledemo/等目录,这些目录下都是无用的,其他则是python标准库中包含的一些有用的小工具:
pickle.py
pprint.py
asyncio/__main__.py
getopt.py
json/tool.py
smtpd.py
dbm/__init__.py
imghdr.py
smtplib.py
platform.py
sndhdr.py
pstats.py
tabnanny.py
py_compile.py
modulefinder.py
curses/textpad.py
curses/has_key.py
venv/__init__.py
distutils/fancy_getopt.py
runpy.py
compileall.py
zipfile.py
random.py
sre_constants.py
http/server.py
zipapp.py
gzip.py
mailcap.py
heapq.py
inspect.py
nntplib.py
doctest.py
aifc.py
pickletools.py
calendar.py
ftplib.py
xmlrpc/client.py
xmlrpc/server.py
lib2to3/pgen2/driver.py
lib2to3/pgen2/literals.py
lib2to3/pgen2/tokenize.py
pydoc.py
pdb.py
site.py
ctypes/util.py
encodings/rot_13.py
wsgiref/simple_server.py
cgi.py
filecmp.py
netrc.py
shlex.py
webbrowser.py
uu.py
timeit.py
tarfile.py
pyclbr.py
quopri.py
dis.py
codecs.py
base64.py
telnetlib.py
formatter.py
sysconfig.py
mimetypes.py
symtable.py
code.py
fileinput.py
difflib.py
xml/sax/expatreader.py
xml/sax/xmlreader.py
tokenize.py
textwrap.py
profile.py
poplib.py
cProfile.py
turtle.py
ast.py
imaplib.py
multiprocessing/spawn.py
工具使用
上面,咱们搜索出来这些工具都有用处,感兴趣的同学可以一一尝试一下,此处我们介绍几个非常有用称手的供大家参考使用。
http.server
这个工具很多人,可能早就知道了。就是python中自带的一个web服务器http.server。该工具可以在当前目录下起一个web服务,默认监听的端口为8000。
python3 -m http.server
可以自定义其他端口,比如8080(注意不要和其他服务已经监听的端口重复了):
Python3 -m http.server 8080
默认是列出当前目录中的文件,可以用于临时文件共享等使用。
我们可以创建一个index.html文件,就可以显示一个页面了:
echo "<H1>Hello,Chongchong!</H1>" >index.html
然后用浏览器访问:
注意该该web服务工具,没有考虑安全、性能等问题,建议仅仅当做临时服务用途。
base64
这是一个base64文档的编码工具,其使用可以用-h查看帮助。
python3 -m base64 -h
usage: .../base64.py [-h|-d|-e|-u|-t] [file|-]
-h: print this help message and exit
-d, -u: decode
-e: encode (default)
-t: encode and decode string 'Aladdin:open sesame'
我们可以用他进行编码(-e)和解码(-d)
echo "Hello,chongchong!"|python3 -m base64 -e
asyncio
这提供了一个带有异步await的Python控制台:
Python3 -m asyncio
tokenize
tokenize是一个很有意思的工具。它是Python简单的分词器(基于标点符号)。可以用一个文件作为参数运行它:
python3 -m tokenize index.html
AST
ast模块提供的parse()函数将源代码进行解析,转为抽象语法树对象。
python3 -m ast ee.py
json.tool
可以对接送内容进行解析和展示:
echo ' {"AAA": "XXX", "NUM": [1, 2, 3]} ' | python3 -m json.tool
{
"AAA": "XXX",
"NUM": [
1,
2,
3
]
}
random
这是一个用于生成随机数字的的工具,但是只提供简单生成随机,不支持额外选项:
python3 -m random
calendar
显示当前年份的日历:
python3 -m calendar
这个有更多选项,-h查看帮助。
ntplib
nntplib是python内置的显示python新闻组中的最新文章,默认的新闻组为gmane.comp.python.general:
这些看起来像是真实的、最近的消息
总结
本文我们介绍了,在Python内置的标准库中挖宝的故事。在Python标准库中隐藏着很多不为人所知的工具,如果善于利用能对我们有很大的帮助。本文提及的只是冰山一角,还有大量的工具有待于大家去探索,除了可以直接拿来用之外,这个探索过程本身也是了解Python生态体系和模块使用的过程,对提高我们的Python编程能力大有裨益。