通过Power BI Desktop调用Python的正确姿势 (基于Anaconda)

liftword1周前 (03-05)技术文章1

前言

最近一直在尝试通过各种方法生成Calendar Table,如通过Python Pandas生成日历表,和通过PostgreSQL生成日历表等。

Power BI与Python集成

本来这篇文章的目的是打算通过 #powerbi#来演示一下如何通过Power Query来生成日历表,但是转头一想,Power BI是支持Python的,我为何不先尝试一下调用Python脚本呢?结果一路走下去,一路坑...

相信与我一样遇到类似问题的小朋友也不在少数,有些可能通过安装独立的Python环境,再通过pip 安装了Pandas和Numpy解决了类似问题,这篇文章的重点是:通过Power BI Desktop调用基于Anaconda的Python环境,省略了独立安装Python环境的困扰,可以让各位少走一些弯路,下面介绍一下具体步骤。

解决步骤

环境准备

  • 先搭建一个虚拟环境,我使用的是Windows Server 2016;
  • 准备好Power BI Desktop和Anaconda的安装包,如下图所示;

VM Env and Installation files

  • 安装Power BI Desktop,一路点下去,按默认设置即可

开始安装PBI

PBI安装结束

  • 安装Anaconda

Anaconda3 2021.11版本使用了Python3.9,请注意在图2高级设置中,选择第二项,环境变量我们稍后手动添加。

安装Anaconda

安装Anaconda的高级选项

Anaconda安装完毕

先验证一下Python环境是否工作,详细代码请参考通过Python Pandas创建日历表

如下所示,已经成功得到df数据集合。

验证Python工作环境

打开Power BI Desktop,选择“Options and setting”,再次选择“Options”。

检查PBI的Options

确认Anaconda的环境已经被PBI检测到

PBI检测Anaconda的Python环境

路径是:

C:\ProgramData\Anaconda3

接下来,尝试通过Python脚本获取df数据:

选择PBI的Get Data

数据源选项中选择“Other” -> “Python scripts” -> “Connect”

选择Python Script并连接

第一次报错

输入Python脚本,弹出错误提示对话框:

遇到错误了

报错中的信息如下,看样子是加载Numpy的时候有误,Power BI Desktop并没有识别出来Numpy环境。

ImportError: Unable to import required dependencies:

numpy: 

IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!

Importing the numpy C-extensions failed. This error can happen for

many reasons, often due to issues with your setup or how NumPy was

installed.

第二次报错

我们通过cmd命令行进入Anaconda的安装路径,尝试运行Python,导入Numpy的时候得到了与PBI提示一致的错误,警示信息中已经告诉我们:Anaconda的环境并没有被激活。

执行Python命令的警示信息

尝试通过conda命令进行激活,cmd中提示无法识别conda命令,这时候我们需要将Anaconda的安装路径添加到系统的环境变量中。

cmd中无法识别conda命令

进入系统变量

进入系统变量

添加Anaconda安装路径以及相关文件夹到系统变量的Path变量中,如下图所示:

添加系统变量

Anaconda需要添加的路径如下

C:\ProgramData\Anaconda3
C:\ProgramData\Anaconda3\Scripts
C:\ProgramData\Anaconda3\bin

下面再次尝试使用conda命令,当使用activate命令的时候,提示需要首先初始化cmd.exe环境,按部就班进行初始化。注意,我同时初始化了powershell,以免后期使用。

conda init cmd.exe
conda init powershell

提示需要初始化

初始化cmd环境

初始化powershell环境

再次尝试激活conda的base环境,并创建Numpy的array变量。

成功激活conda的base环境

关键步骤

这时候,关键的步骤来了,我们一定要切记,通过已经激活的conda环境,来启动Power BI Desktop应用程序

通过cmd命令启动Power BI Desktop软件

成功得到Python脚本中的df数据,即我们前面已经得到的Calendar日历表数据。

连接Python脚本获取数据

数据经过PBI的加载已经可以在Vis中进行使用。

创建Vis表格

更加优雅的启动

我们已经可以通过PBI运行基于Anaconda的Python脚本了,可是每次都要打开CMD进行执行,是不是有点繁琐?我尝试编写了两个脚本,可以直接执行,如下所示:

  • BAT脚本
@echo off

start cmd /c "conda activate && "C:\Program Files\Microsoft Power BI Desktop\bin\PBIDesktop.exe""
  • Powershell脚本

Powershell脚本在第一次执行的时候会有提示,请选择输入“A”即All,运行下面脚本;

"conda activate"; &"C:\Program Files\Microsoft Power BI Desktop\bin\PBIDesktop.exe"

这样就可以一次性打开Power BI Desktop的程序了,并且直接调用Python脚本也不会有任何错误提示。

总结

今天花了点时间研究了一下通过Power BI Desktop集成Anaconda Python环境,并调用相关脚本的方法,其中几个点值得回味:

  1. Power BI Desktop会自动检测当前系统中的Python环境,如果各位有独立安装Python程序,并且已经通过pip命令安装了Pandas、Numpy包之后,应该不会碰到类似的错误。
  2. Anaconda Python的环境,其实是一种虚拟环境,在使用之前,需要对当前的虚拟环境进行activate。base是Anaconda安装后默认生成的虚拟环境。
  3. PBI调用基于Anaconda的Python环境,需要在激活base之后,直接调用其应用程序文件进行启动。
  4. 尝试通过BAT以及Powershell脚本同时激活base环境,并启动PBI。

如果您觉得这篇小软文为你提供了帮助,还请帮忙 点赞 + 关注 + 转发 ~,您的鼓励是我持续前进的动力!

你的爱心

相关文章

Python 命令行工具 python 的常用参数执行命令

作为 Python 的初学者,最不缺见的就是命令行工具 python 的执行命令了,每每遇到就可能去查资料帮助,同样,自己也会不时的需要某些执行命令来完成自己的需求,鉴于此我对 python 工具的执...

python中执行shell命令的几个方法小结!很实用,帮助很大

最近有个需求就是页面上执行shell命令,第一想到的就是os.system,os.system('cat /proc/cpuinfo') 但是发现页面上打印的命令执行结果 0或者1,当然不满足需求了。...

如何在 Python 中执行外部命令 ?

Python 是一种强大的编程语言,可以帮助自动执行许多任务,包括在 Linux 系统上运行命令。在本指南的最后,您将能够使用 Python 轻松有效地执行 Linux 命令。使用 os 模块os 模...

Python 中的一些命令行命令

虽然 Python 通常用于构建具有图形用户界面 (GUI) 的应用程序,但它也支持命令行交互。命令行界面 (CLI) 是一种基于文本的方法,用于与计算机的操作系统进行交互并运行程序。从命令行运行 P...

入门必学25个python常用命令

以下是 Python 入门必学的 25 个常用命令(函数、语句等):基础输入输出与数据类型print():用于输出数据到控制台,例如print("Hello, World!")。input():获取用...

Python 基础教程 九之cron定时执行python脚本

前言在Linux或Unix系统中,你可以使用cron任务来定时执行Python脚本。cron是一个基于时间的作业调度器,允许你安排命令或脚本在系统上自动执行。安装cron大多数Linux发行版默认安装...