DataFrame(13)：DataFrame的排序与排名问题-FinClip官网

DataFrame(13)：DataFrame的排序与排名问题

网友投稿 1130 2022-11-11

DataFrame(13)：DataFrame的排序与排名问题

1、说明

DataFrame中的排序分为两种，一种是对索引排序，一种是对值进行排序。索引排序：sort_index()；值排序：sort_values()；值排名：rank() 对于索引排序，涉及到对行索引、列索引的排序，并且还涉及到是升序还是降序。函数df.sort_index(axis= , ascending= , inplace=)，需要特别注意这三个参数。axis表示对行操作，还是对列操作；ascending表示升序，还是降序操作。对于值排序，同样也是涉及到行、列排序问题，升序、降序排列问题。函数df.sort_values(by= , axis= , ascending= , inplace=),也需要特别注意这几个参数，只是多了一个by操作，需要我们指明是按照哪一行或哪一列，进行排序的。注意：axis=0表示对行操作，axis=1表示对列进行操作；ascending=True表示升序，ascending=False表示降序；inplace=True表示对原始DataFrame本身操作，因此不需要赋值操作，inplace=False相当于是对原始DataFrame的拷贝，之后的一些操作都是针对这个拷贝文件进行操作的，因此需要我们赋值给一个变量，保存操作后的结果。

2、索引排序：df.sort_index()

① 对行索引，进行升序排列

df = pd.DataFrame({"A":[1,3,5,7,9], "D":[1,2,3,4,5], "C":[3,6,9,12,15], "B":[2,4,6,8,10]}, index=list("acbed"))display(df)display(id(df))df.sort_index(axis=0,ascending=True,inplace=True)display(df)display(id(df))df1 = df.sort_index(axis=0,ascending=True)display(df1)display(id(df1))

结果如下：

② 对列索引，进行降序排列

df = pd.DataFrame({"A":[1,3,5,7,9], "D":[1,2,3,4,5], "C":[3,6,9,12,15], "B":[2,4,6,8,10]}, index=list("acbed"))display(df)df.sort_index(axis=1,ascending=False,inplace=True)display(df)

结果如下：

3、值排序：df.sort_values()

① 对某一列进行升序排列(有实际意义)

df = pd.DataFrame({"A":[3,1,5,9,7], "D":[4,1,2,5,3], "C":[3,15,9,6,12], "B":[2,4,6,10,8]}, index=list("acbed"))display(df)df.sort_values(by="A",axis=0,ascending=True,inplace=True)display(df)

结果如下：

② 对某一行进行降序排列(实际意义不大)

df = pd.DataFrame({"A":[3,1,5,9,7], "D":[4,1,2,5,3], "C":[3,15,9,6,12], "B":[2,4,6,10,8]}, index=list("acbed"))display(df)df.sort_values(by="A",axis=1,ascending=False,inplace=True)display(df)

结果如下：

③ 对多列进行联合排序(重要)

df = pd.DataFrame({"A":[3,1,3,9,7], "D":[666,1,888,5,3], "C":[3,15,9,6,12], "B":[2,4,6,10,8]}, index=list("acbed"))display(df)df.sort_values(by=["A","D"],axis=0,ascending=[True,False],inplace=True)

结果如下：

注意：上图中，我们分别按照A和D这个列进行排序，先按照A列做升序排列，当A列中具有相同值的时候，就按照D列做降序排列。

4、sort_values()中的na_position参数

na_position参数用于设定缺失值的显示位置，first表示缺失值显示在最前面；last表示缺失值显示在最后面。

df = pd.DataFrame({"A":[10,8,np.nan,2,4], "D":[1,7,5,3,8], "B":[5,2,8,4,1]}, index=list("abcde"))display(df)df.sort_values(by="A",axis=0,inplace=True,na_position="first")display(df)df.sort_values(by="A",axis=0,inplace=True,na_position="last")display(df)

结果如下：

5、“值排名”：rank()函数

1）rank()函数的常用参数说明

2）原始数据

x = {"name":["张三","李四","王五","赵六","郑七","陈八","黄九","孙十"], "sales":[60,40,50,40,30,80,70,60]}df = pd.DataFrame(x)display(df)

结果如下：

3）rank()函数使用如下

① method=“first”

x = {"name":["张三","李四","王五","赵六","郑七","陈八","黄九","孙十"], "sales":[60,40,50,40,30,80,70,60]}df = pd.DataFrame(x)display(df)df["排名"] = df["sales"].rank(method="first")display(df)

结果如下：

② method=“min”

x = {"name":["张三","李四","王五","赵六","郑七","陈八","黄九","孙十"], "sales":[60,40,50,40,30,80,70,60]}df = pd.DataFrame(x)display(df)df["排名"] = df["sales"].rank(method="min")display(df)

结果如下：

③ method=“max”

结果如下：

④ method=“average”

x = {"name":["张三","李四","王五","赵六","郑七","陈八","黄九","孙十"], "sales":[60,40,50,40,30,80,70,60]}df = pd.DataFrame(x)display(df)df["排名"] = df["sales"].rank(method="average")display(df)

结果如下：

智慧屏第三方App安装如何提升用户体验与功能拓展

1130 2022-11-11

DataFrame(13)：DataFrame的排序与排名问题

app开发者平台在数字化时代的重要性与发展趋势解析

智慧屏第三方App安装如何提升用户体验与功能拓展

智慧屏安装 app如何提升家庭娱乐与教育体验的关键工具

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计