Python:pandas的DataFrame如何按指定list排序

liftword4周前 (12-11)技术文章19

现在有一个pandas的Series和一个python的list,想让Series按指定的list进行排序,如何实现?

根据指定的list所包含元素比Dataframe中需要排序的列的元素的多或少,可以分为三种情况:

  • 相等的情况下,可以使用 reorder_categories和 set_categories方法;
  • list的元素比较多的情况下, 可以使用set_categories方法;
  • list的元素比较少的情况下, 也可以使用set_categories方法,但list中没有的元素会在DataFrame中以NaN表示
  • 引入pandas库
import pandas as pd
  • 构造Series数据
s = pd.Series({'a':1,'b':2,'c':3})
s
a    1
b    2
c    3
dtype: int64
s.index
Index(['a', 'b', 'c'], dtype='object')
  • 指定的list,后续按指定list的元素顺序进行排序
list_custom = ['b', 'a', 'c']
list_custom
['b', 'a', 'c']
  • 将Series转换成DataFrame
df = pd.DataFrame(s)
df = df.reset_index()
df.columns = ['words', 'number']
df

设置成“category”数据类型

# 设置成“category”数据类型
df['words'] = df['words'].astype('category')
# inplace = True,使 recorder_categories生效
df['words'].cat.reorder_categories(list_custom, inplace=True)

# inplace = True,使 df生效
df.sort_values('words', inplace=True)
df



作者:leenard
链接:https://www.jianshu.com/p/2d3dd3e30d51
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

指定list元素多的情况:

若指定的list所包含元素比Dataframe中需要排序的列的元素,怎么办?

  • reorder_catgories()方法不能继续使用,因为该方法使用时要求新的categories和dataframe中的categories的元素个数和内容必须一致,只是顺序不同。
  • 这种情况下,可以使用 set_categories()方法来实现。新的list可以比dataframe中元素多。
list_custom_new = ['d', 'c', 'b','a','e']
dict_new = {'e':1, 'b':2, 'c':3}
df_new = pd.DataFrame(list(dict_new.items()), columns=['words', 'value'])
print(list_custom_new)
df_new.sort_values('words', inplace=True)
df_new
['d', 'c', 'b', 'a', 'e']
df_new['words'] = df_new['words'].astype('category')

# inplace = True,使 set_categories生效
df_new['words'].cat.set_categories(list_custom_new, inplace=True)

df_new.sort_values('words', ascending=True)

指定list元素少的情况:

若指定的list所包含元素比Dataframe中需要排序的列的元素,怎么办?

  • 这种情况下,set_categories()方法还是可以使用的,只是没有的元素会以NaN表示

注意下面的list中没有元素“b”

list_custom_new = ['d', 'c','a','e']
dict_new = {'e':1, 'b':2, 'c':3}
df_new = pd.DataFrame(list(dict_new.items()), columns=['words', 'value'])
print(list_custom_new)
df_new.sort_values('words', inplace=True)
df_new
['d', 'c', 'a', 'e']
df_new['words'] = df_new['words'].astype('category')

# inplace = True,使 set_categories生效
df_new['words'].cat.set_categories(list_custom_new, inplace=True)

df_new.sort_values('words', ascending=True)



作者:leenard
链接:https://www.jianshu.com/p/2d3dd3e30d51
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


相关文章

Python中如何按值对字典进行排序

# 如何按值对字典进行排序 >>> xs = {'a': 4, 'b': 3, 'c': 2, 'd': 1}...

python字典按值排序的方法

在 Python 中,可以使用字典的 values() 方法获取字典中所有的值,并将它们转换成一个列表。然后,可以使用列表的 sort() 方法对这些值进行排序,从而对字典按照值进行排序。在排序过程中...

Python中的函数是什么?如何使用Python函数?

Python 中的函数是什么?在 Python 中,函数是完成指定任务的可重用代码的有组织的片段。它们有助于将大型程序划分为更小、更易于管理的部分。函数可以接受参数、处理参数并返回结果。Python...

「Python位运算符」按位或运算符(|)

功能要求编写一个Python应用程序,对十进制4和8进行按位或运算;对十进制-4和8进行按位或运算;对十进制4和-8进行按位或运算;对十进制-4和-8进行按位或运算,将结果显示在控制台。实现步骤1.创...

Python教程:列表的排序操作

在Python中,如果希望对列表中的元素进行重新排列,则可以使用sort方法或者reverse方法实现。其中,sort方法是将列表中的元素按照特定的顺序重新排列,默认为由小到大。如果要将列表中的元素由...

Python中的super()函数:深入解析与实用技巧

在Python编程中,super()函数是一个不可或缺的工具,特别是在处理类继承时。虽然它看起来简单,但实际上super()背后隐藏了许多复杂的细节和强大的功能。本文将深入探讨super()的真正作用...