通过Power BI Desktop调用Python的正确姿势 (基于Anaconda)
前言
最近一直在尝试通过各种方法生成Calendar Table,如通过Python Pandas生成日历表,和通过PostgreSQL生成日历表等。

Power BI与Python集成
本来这篇文章的目的是打算通过 #powerbi#来演示一下如何通过Power Query来生成日历表,但是转头一想,Power BI是支持Python的,我为何不先尝试一下调用Python脚本呢?结果一路走下去,一路坑...
相信与我一样遇到类似问题的小朋友也不在少数,有些可能通过安装独立的Python环境,再通过pip 安装了Pandas和Numpy解决了类似问题,这篇文章的重点是:通过Power BI Desktop调用基于Anaconda的Python环境,省略了独立安装Python环境的困扰,可以让各位少走一些弯路,下面介绍一下具体步骤。
解决步骤
环境准备
- 先搭建一个虚拟环境,我使用的是Windows Server 2016;
- 准备好Power BI Desktop和Anaconda的安装包,如下图所示;

VM Env and Installation files
- 安装Power BI Desktop,一路点下去,按默认设置即可

开始安装PBI

PBI安装结束
- 安装Anaconda
Anaconda3 2021.11版本使用了Python3.9,请注意在图2高级设置中,选择第二项,环境变量我们稍后手动添加。

安装Anaconda

安装Anaconda的高级选项

Anaconda安装完毕
先验证一下Python环境是否工作,详细代码请参考通过Python Pandas创建日历表。
如下所示,已经成功得到df数据集合。

验证Python工作环境
打开Power BI Desktop,选择“Options and setting”,再次选择“Options”。

检查PBI的Options
确认Anaconda的环境已经被PBI检测到

PBI检测Anaconda的Python环境
路径是:
C:\ProgramData\Anaconda3
接下来,尝试通过Python脚本获取df数据:

选择PBI的Get Data
数据源选项中选择“Other” -> “Python scripts” -> “Connect”

选择Python Script并连接
第一次报错
输入Python脚本,弹出错误提示对话框:

遇到错误了
报错中的信息如下,看样子是加载Numpy的时候有误,Power BI Desktop并没有识别出来Numpy环境。
ImportError: Unable to import required dependencies:
numpy:
IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!
Importing the numpy C-extensions failed. This error can happen for
many reasons, often due to issues with your setup or how NumPy was
installed.
第二次报错
我们通过cmd命令行进入Anaconda的安装路径,尝试运行Python,导入Numpy的时候得到了与PBI提示一致的错误,警示信息中已经告诉我们:Anaconda的环境并没有被激活。

执行Python命令的警示信息
尝试通过conda命令进行激活,cmd中提示无法识别conda命令,这时候我们需要将Anaconda的安装路径添加到系统的环境变量中。

cmd中无法识别conda命令
进入系统变量

进入系统变量
添加Anaconda安装路径以及相关文件夹到系统变量的Path变量中,如下图所示:

添加系统变量
Anaconda需要添加的路径如下
C:\ProgramData\Anaconda3
C:\ProgramData\Anaconda3\Scripts
C:\ProgramData\Anaconda3\bin
下面再次尝试使用conda命令,当使用activate命令的时候,提示需要首先初始化cmd.exe环境,按部就班进行初始化。注意,我同时初始化了powershell,以免后期使用。
conda init cmd.exe
conda init powershell

提示需要初始化

初始化cmd环境

初始化powershell环境
再次尝试激活conda的base环境,并创建Numpy的array变量。

成功激活conda的base环境
关键步骤
这时候,关键的步骤来了,我们一定要切记,通过已经激活的conda环境,来启动Power BI Desktop应用程序。

通过cmd命令启动Power BI Desktop软件
成功得到Python脚本中的df数据,即我们前面已经得到的Calendar日历表数据。

连接Python脚本获取数据
数据经过PBI的加载已经可以在Vis中进行使用。

创建Vis表格
更加优雅的启动
我们已经可以通过PBI运行基于Anaconda的Python脚本了,可是每次都要打开CMD进行执行,是不是有点繁琐?我尝试编写了两个脚本,可以直接执行,如下所示:
- BAT脚本
@echo off
start cmd /c "conda activate && "C:\Program Files\Microsoft Power BI Desktop\bin\PBIDesktop.exe""
- Powershell脚本
Powershell脚本在第一次执行的时候会有提示,请选择输入“A”即All,运行下面脚本;
"conda activate"; &"C:\Program Files\Microsoft Power BI Desktop\bin\PBIDesktop.exe"
这样就可以一次性打开Power BI Desktop的程序了,并且直接调用Python脚本也不会有任何错误提示。
总结
今天花了点时间研究了一下通过Power BI Desktop集成Anaconda Python环境,并调用相关脚本的方法,其中几个点值得回味:
- Power BI Desktop会自动检测当前系统中的Python环境,如果各位有独立安装Python程序,并且已经通过pip命令安装了Pandas、Numpy包之后,应该不会碰到类似的错误。
- Anaconda Python的环境,其实是一种虚拟环境,在使用之前,需要对当前的虚拟环境进行activate。base是Anaconda安装后默认生成的虚拟环境。
- PBI调用基于Anaconda的Python环境,需要在激活base之后,直接调用其应用程序文件进行启动。
- 尝试通过BAT以及Powershell脚本同时激活base环境,并启动PBI。
如果您觉得这篇小软文为你提供了帮助,还请帮忙 点赞 + 关注 + 转发 ~,您的鼓励是我持续前进的动力!

你的爱心