13个python常用库,提高你的开发能力
Python拥有大量封装好的功能模块和工具库,这些库广泛应用于数据分析、机器学习、Web开发、自动化等多个领域。库在Python的作用非常重要,利用库不仅能简化复杂的任务还能极大减少开发的时间。下面介绍了13个python常见库。
1. NumPy
用途:数值计算和数组处理。
功能:提供支持大规模多维数组和矩阵运算;提供数学函数库,用于对数组执行各种操作,如线性代数、傅里叶变换、随机数生成等。
import numpy as np
arr = np.array([1, 2, 3])
print(arr * 2) # 输出:[2 4 6]
2. Pandas
用途:数据分析和处理。
功能:提供DataFrame结构,方便处理和分析表格数据;数据清洗、转换、合并、分组等。
import pandas as pd
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)
print(df)
3. Matplotlib
用途:数据可视化。
功能:绘制各种图表,如折线图、散点图、柱状图等;支持自定义图表外观。
import matplotlib.pyplot as plt
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
plt.plot(x, y)
plt.show()
4. Seaborn
用途:基于Matplotlib的统计数据可视化。
功能:更简洁的接口和美观的图表;自动处理数据的统计分析(如箱线图、热图等)。
import seaborn as sns
tips = sns.load_dataset('tips')
sns.boxplot(x="day", y="total_bill", data=tips)
5. Scikit-learn
用途:机器学习。
功能:提供多种机器学习算法(分类、回归、聚类等);支持数据预处理、特征选择、模型评估等。
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
model = RandomForestClassifier()
model.fit(X_train, y_train)
print(model.score(X_test, y_test))
6. TensorFlow / PyTorch
用途:深度学习。
功能:提供构建和训练神经网络的工具;支持自动求导、GPU加速等功能。
import tensorflow as tf
model = tf.keras.Sequential([tf.keras.layers.Dense(10, input_shape=(3,))])
model.compile(optimizer='adam', loss='mean_squared_error')
7. Flask / Django
用途:Web开发。
功能:Flask:一个轻量级的Web框架,适合开发小型Web应用;Django:功能更强大的Web框架,适用于开发大型Web应用。
from flask import Flask
app = Flask(__name__)
@app.route('/')
def hello():
return 'Hello, World!'
if __name__ == '__main__':
app.run(debug=True)
8. Requests
用途:HTTP请求。
功能:发送HTTP请求,获取响应;处理GET、POST等请求类型,支持文件上传、cookie管理等。
import requests
response = requests.get('https://api.github.com')
print(response.json())
9. BeautifulSoup
用途:网页解析和爬虫。
功能:解析HTML和XML文档;从网页中提取数据,常与requests结合使用。
from bs4 import BeautifulSoup
import requests
url = 'https://example.com'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
print(soup.prettify())
10. SQLAlchemy
用途:数据库操作。
功能:提供Python对SQL数据库的ORM(对象关系映射)支持;通过Python类与数据库进行交互,简化SQL操作。
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
Base = declarative_base()
class User(Base):
__tablename__ = 'users'
id = Column(Integer, primary_key=True)
name = Column(String)
engine = create_engine('sqlite:///:memory:')
Base.metadata.create_all(engine)
Session = sessionmaker(bind=engine)
session = Session()
new_user = User(name='Alice')
session.add(new_user)
session.commit()
11. OpenCV
用途:计算机视觉。
功能:处理图像和视频,提供图像识别、特征提取、边缘检测等功能。
import cv2
img = cv2.imread('image.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('Gray Image', gray)
cv2.waitKey(0)
cv2.destroyAllWindows()
12. Celery
用途:异步任务队列/分布式任务调度。
功能:处理异步任务,实现分布式工作流。
from celery import Celery
app = Celery('tasks', broker='pyamqp://guest@localhost//')
@app.task
def add(x, y):
return x + y
13. PyTest
用途:单元测试。
功能:提供简洁的API来编写和执行测试,支持自动化测试和测试覆盖率。
def test_add():
assert add(1, 2) == 3