一行Python代码,数据集转化为交互式可视化分析工具

liftword12小时前技术文章2

大家好,我是章北海

介绍一个非常Cool的拖拽式数据分析工具

PyGWalker

PyGWalker 是个在 Jupyter Notebook 环境中运行的可视化探索式分析工具,仅一条命令即可生成一个可交互的图形界面,以类似 Tableau/PowerBI 的方式,通过拖拽字段进行数据分析。

过去在 python 中进行数据可视化分析时,经常需要查询大量的可视化类的代码,并编写胶水代码将其应用在数据集上。PyGWalker 的目标是通过一行代码,将数据集转化为一个可视化分析工具,只需拖拉拽即可生成图表,从而减少数据分析师在数据可视化上的时间成本。

为什么叫 PyGWalker?PyGWalker,全称为"Python binding of Graphic Walker",将 Jupyter Notebook(或类 Jupyter Notebook) 和 Graphic Walker 集成。Graphic Walker 是一个轻量级的 Tableau/Power BI 开源替代品,可以帮助数据分析师使用简单的拖拉拽操作,进行数据可视化和探索。

From https://github.com/Kanaries/pygwalker/blob/main/docs/README.zh.md

安装、极简使用

使用 pip 或 Conda 安装 pygwalker

pip install pygwalker

在您的 Jupyter Notebook 中导入 pygwalker 和 pandas 来开始使用。

import pandas as pd
import pygwalker as pyg

使用拖拉拽,直接操作 dataframe,创建可视化视图,完成数据分析:

使用PyGWalker制作数据可视化图--快速预览数据

使用PyGWalker制作数据可视化图--分面图 (Facet)

使用PyGWalker制作数据可视化图--连接视图(Concat)

其他玩法

玩法还有很多

比如生成一个html页面并在网页中拖拽式数据分析

import pygwalker as pyg
import pandas as pd
df = pd.read_csv("https://kanaries-app.s3.ap-northeast-1.amazonaws.com/public-datasets/bike_sharing_dc.csv")
with open("pyg_demo.html", "w", encoding="utf-8") as f:
    html = pyg.to_html(df)
    f.write(html)

它还可以

  • 与gradio、streamlit、dash结合
  • 将数据可视化导出为代码
  • PyGwalker还有R版本

one more thing

事实上类似的工具还有一个——LUX

https://github.com/lux-org/lux

用法也极其相似

# 安装  pip install lux-api
import lux
import pandas as pd
df = pd.read_csv("college.csv")
df


图解机器学习 - 中文版(72 张 PNG)

ChatGPT 、大模型系列研究报告(50+ 个 PDF)

搭建完美的写作环境:工具篇(12 章)

108页PDF小册子:搭建机器学习开发环境及Python基础

116页PDF小册子:机器学习中的概率论、统计学、线性代数

《全网最全 Python、机器学习、AI、LLM 速查表(100 余张)》

相关文章

使用python把csv汇总成excel(python怎么将csv文件中的列存入列表)

最近领导安排让我每周定时把grafana导出的csv文件进行统计汇总工作,需要处理的csv文件还是蛮多的,况且还要每周重复汇总处理。干脆写个脚本,每周执行一遍脚本,既方便还不会出错。一、需求分析1....

python爬虫25 | 爬取的数据怎么保存?CSV了解一下

大家好我是小帅b是一个练习时长两年半的练习生喜欢唱!跳!rap!篮球!敲代码!装逼!不好意思我又走错片场了接下来的几篇文章小帅b将告诉你如何将你爬取到的数据保存下来有文本文件、redis、数据库(My...

将MySQL查询结果输出为CSV格式的方法

技术背景在数据库管理和数据分析中,我们常常需要将MySQL查询结果以CSV格式输出,方便在其他工具(如Excel、Python数据分析库)中进行进一步处理。然而,由于CSV格式有其特定的规范,如字段分...

Django 如何使用视图动态输出 CSV 以及 PDF

Django 如何使用视图动态输出 CSV 以及 PDF这一篇我们需要用到 python 的 csv 和 reportLab 库,通过django视图来定义输出我们需要的 csv 或者 pdf 文件。...

Python版的迷你程序——json文件转换为csv

浅话C语言是过去几十年软件和硬件两个阵营之间,签署的最坚实的契约。硬件为C语言的语义提供了最能发挥其性能的基础构件,而软件虽然搞了很多的圆环套圆环般的层次,但最终都以C语言作为最后的沉淀收尾。----...

Python CSV文件的读写和处理(csv python 读取)

一、介绍CSV文件的概念和结构CSV(Comma-Separated Values,逗号分隔值)是一种常见的文本文件格式,用于存储表格数据。CSV 文件以纯文本形式存储数据,使用逗号作为字段之间的分隔...