Python绘制可爱的图表 cutecharts
一个很酷的python手绘样式可视化包——可爱的图表 cutecharts。Cutecharts 非常适合为图表提供更个性化的触感。
Cutecharts 与常规的 Matplotlib 和 Seaborn 库完全不同,它可以查看手工制作的图表,并在将鼠标悬停在图表上时显示值。Matplotlib 图表中没有悬停效果,这是可爱图表的一个优势。与 seaborn 相比,在可爱图表中创建图表的时间要长一些,但代码数量仍然比标准 matplotlib 库少。
该包可用于生成以下类型的图表。目前,该库支持五种不同的图表——条形图、饼图、雷达图、散点图和折线图。
安装cutecharts
这是个python第三方库,要创建此图表,需要安装cutecharts库。具体安装方法与其他库一样。
pip install cutecharts
导入库
import cutecharts.charts as ctc
import pandas as pd
数据集
看看 TMBD 数据是什么样子的?数据有 21 列。
df = pd.read_csv(r'tmdb-movies.csv')
df.head(2)
数据说明
- Popularity流行度: 指定电影流行度的数字量
- Budget预算: 电影制作的预算。
- Revenue收入: 电影产生的全球收入
- Original Title原片名: 翻译或改编前电影的片名。
- Cast演员: 在电影中扮演角色的演员姓名
- Homepage主页: 指向电影主页的链接。
- Director导演: 导演电影的导演姓名。
- Title片名: 电影名称
- Keywords关键字: 与电影相关的关键字或标签。
- Overview概述: 对电影的简要描述
- Runtime运行时间: 以分钟为单位的电影运行时间。
- Genres类型: 电影的类型,剧情、动作、喜剧、惊悚等。
- Production Company制作公司: 电影的制作公司。
- Vote Count投票数: 收到的票数。
- Vote Average投票平均: 电影收到的平均评分。
日期时间
- Release Date上映日期: 电影上映的日期。
- Release Year发行年份: 电影发行的年份。
数据清洗
先清理数据,然后会看到可爱的图表。
将特征更改为正确的日期时间格式并将流行功能四舍五入到小数点后两位,以获得更多内容。
df['release_date'] = pd.to_datetime(df['release_date'])
df['popularity'] = round(df['popularity'], 2)
删除不必要的功能
df.drop(['imdb_id', 'homepage', 'budget_adj','revenue_adj'],
axis=1, inplace=True)
用missing替换特征nan值
df['tagline'].fillna('missing',inplace=True)
df['keywords'].fillna('missing',inplace=True)
df['production_companies'].fillna('missing',inplace=True)
df['cast'].fillna('missing',inplace=True)
df['director'].fillna('missing',inplace=True)
df['genres'].fillna('missing',inplace=True)
df['overview'].fillna('missing',inplace=True)
从预算和收入中删除等于 0 的值。
df.drop(df[(df['budget']==0) & (df['revenue']==0)].index,
inplace=True)
现在,数据是干净的,现在可以进一步创建一些可爱的图表。
cutecharts中使用的参数
分配要的图表名称,例如,要一个饼图然后运行下面的代码。
chart = ctc.Pie()
设置需要width, height在参数中添加的图表的标题、宽度和高度。
chart = ctc.Pie('Title', width='600px', height='300px')
设置图表选项,可以将使用set_options()函数。
chart.set_options()
设置x和y标签的标题,使用x_label, y_label传入set_options()函数示例如下。
chart.set_options(x_label='X Labels',
y_label='Y Labels')
最后,使用一个函数来显示图表render_notebook(),下面给出一个例子。
chart.render_notebook()
绘制饼图
要制作的图表是甜甜圈图表。看到发行量最高的电影的前 5 年。
df_year = df['release_year'].value_counts(
).reset_index().sort_values(by='index',
ascending=False)[:5].rename(columns={'index':'release_year',
'release_year':'Count'})
chart = ctc.Pie('Top 5 years', width='600px', height='300px')
chart.set_options(labels=list(df_year['release_year']), inner_radius=0)
chart.add_series(list(df_year['Count']))
chart.render_notebook()
绘制圆环图
df_year = df['release_year'].value_counts(
).reset_index().sort_values(by='index',
ascending=False)[:5].rename(columns={'index':'release_year',
'release_year':'Count'})
chart = ctc.Pie('Top 5 years', width='600px', height='300px')
chart.set_options(labels=list(df_year['release_year']), inner_radius=0.8)
chart.add_series(list(df_year['Count']))
chart.render_notebook()
条形图代码
from cutecharts.faker import Faker
chart = ctc.Bar('Top Movie Geners', width='600px', height='200px')
chart.set_options(labels=list(df_genre_movies['Drama'][:7]),
x_label='Drama',
y_label='Count',
colors=Faker.colors
)
chart.add_series('Geners',list(df_genre_movies['Count'][:7]))
chart.render_notebook()
绘制雷达图
data = {'Day': ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun'],
'This week': [12, 10, 9, 9, 10, 3, 3],
'Last week': [15, 12, 8, 9, 11, 4, 3]
}
df_coffee = pd.DataFrame(data, columns = ['Day', 'This week', 'Last week'])