【Python机器学习系列】基于Flask来构建API调用机器学习模型服务
这是我的第364篇原创文章。
一、引言
我们知道机器学习的模型大多是使用python或者是R语言来写的,但是使用这些模型的软件工程师可能用的完全不是这些语言(机器学习模型有时只是一个软件中的一小部分,比如聊天机器人、自动邮箱发送系统)。所以针对这个问题可以有下面两种解决办法:
- 用软件工程师工作的语言来重写整个机器学习代码,但是这消耗时间和精力太多,并且像JavaScript这样的语言又不能提供很好的库来执行机器学习方法,所以这样方法是不可取的。
- 使用API方法,Web API使跨语言应用程序可以轻松运行。如果前端开发人员需要使用ML模型来创建ML支持的Web应用程序,他们只需要从提供API的位置获取URL端点。
Flask是一个轻量级的Python Web开发框架,它自带了一个轻型服务器,可以部署Python 应用,对外提供api服务。
二、实现过程
2.1 训练保存模型
训练、保存模型,命名training_model.py
import pandas as pd
from sklearn.linear_model import LinearRegression
import pickle
# 从csv文件中读取数据,分别为:X列表和对应的Y列表
def get_data(file_name):
# 1. 用pandas读取csv
data = pd.read_excel(file_name)
# 2. 构造X列表和Y列表
X_parameter = []
Y_parameter = []
for single_square_feet,single_price_value in zip(data['square_feet'],data['price']):
X_parameter.append([float(single_square_feet)])
Y_parameter.append(float(single_price_value))
return X_parameter,Y_parameter
# 线性回归分析模型训练、保存
def linear_model(X_parameter, Y_parameter):
#训练模型
regr = LinearRegression()
regr.fit(X_parameter, Y_parameter)
#保存模型
pickle.dump(regr, open('model.pkl','wb'))
if __name__ == '__main__':
# 1. 读取数据
X, Y = get_data('./house_price.xlsx')
# 2. 训练、保存模型
linear_model(X, Y)
print("模型保存完成。")
运行程序,会在项目根目录下生成一个pkl模型文件。
2.2 开发web应用
前端:web界面,创建templates目录,目录下创建page.html
Title
使用Flask部署机器学习模型Demo——房价预测
{{ prediction_display_area }}
后端:基于flask写服务器程序,命名app.py
import numpy as np
from flask import Flask, request, jsonify, render_template
import pickle
app = Flask(__name__)
model = pickle.load(open('model.pkl','rb'))
@app.route('/')
def home():
return render_template('page.html')
@app.route('/predict', methods=['POST'])
def predict():
features_list = [float(x) for x in request.form.values()]
features = np.array(features_list).reshape(1,-1)
predict_outcome_list = model.predict(features)
predict_outcome = round(predict_outcome_list[0],2)
return render_template('page.html',prediction_display_area='预测价格为:{}'.format(predict_outcome))
if __name__ == "__main__":
app.run(port=80,debug = True)
2.3 访问与测试
运行服务器程序:python app.py
浏览器访问http://localhost/或输入ip:127.0.0.1,出现页面:
输入房子英尺数,点击‘预测房价按钮’,展示出预测价格:
完整的项目目录结构:
作者简介: 读研期间发表6篇SCI数据算法相关论文,目前在某研究院从事数据算法相关研究工作,结合自身科研实践经历持续分享关于Python、数据分析、特征工程、机器学习、深度学习、人工智能系列基础知识与案例。关注gzh:数据杂坛,获取数据和源码学习更多内容。
原文链接: