Python之根据条件筛选特定行（python筛选在某时间段内的行）-FinClip官网

Python之根据条件筛选特定行（python筛选在某时间段内的行）

网友投稿 2877 2022-09-21

Python之根据条件筛选特定行（python筛选在某时间段内的行）

原博客链接https://blog.csdn-/u010770993/article/details/70312506

一、选取几列组成新的dataframe：

　　df = df[['A列列名', 'S列列名', 'H列列名']]

二、选取某列'STATUS'里面元素为"ACTIVE"的行，即删掉列STATUS元素不是ACTIVE的行

　　df = df[df['STATUS'] == "ACTIVE"]

　（单项条件搜索，类似SELECT ALL WHERE df.STATUS = ACTIVE）

三、选取'BADTHING'列为元素空的行，即去掉BADTHING所在列中的空行所在行数据，组成一个新的dataframe

　　df = df[df['BADTHING'].isnull()]

　（空值搜索）

四、选取GOODREASON列元素为列表['quality', 'cheap']内元素的行，即可用特定列表内容进行筛选

　　df = df[df['GOODREASON'].isin(['quality', 'cheap'])]

　（多项条件搜索，类似SELECT ALL WHERE df.GOODREASON= quality AND cheap）

五、分组并进行遍历，运用groupby和for：

　　groupByNew = df.groupby('CITY', sort=False)

　　for name, groupData in groupByNew:

　　　　# TODO …… ……

　　如代码所示，我们可以对dataframe以某列'CITY'进行分组。我们如何取出某组的数据呢？当然是用

　　for循环。取出来的name即是组名，而groupData同样是一个dataframe，可以进行更进一步操作。

六、对Series数据进行排序：

　　series= series.sort_values(ascending=False) # 进行从大到小排序

进阶：关于groupby的一些信息：

　　在进行groupby运算后，直接打印会得一个object信息，添加groups参数后

　　print df.groupby(by=['CITY']).groups

　　打印出来会是带group标签和原数据行标签（也就是原来dataframe里面对应行的index）的组合信息：

　　{'BEIJING': [25998L, 26134L, 26135L, 26235L, 26340L], 'SHANGHAI': [33370L, 33426L, 33541L], 'CHENGDU': [26153L]

　　我们可以看到，按照groups来print，得出city为北京的情况下，对应原来的行标签第25998行、26134行等

　　即使指定了某列：

　　print df.groupby(by=['CITY'])['QUANTITY'].groups

　　依然会得出相同的结果：

　　{'BEIJING': [25998L, 26134L, 26135L, 26235L, 26340L], 'SHANGHAI': [33370L, 33426L, 33541L], 'CHENGDU': [26153L]

　　除非我们把每个分组的所有行都整理成一行，如用sum来求和：

　　print df.groupby(by=['CITY'])['QUANTITY'].sum()

　　这样就可以成功转换成dataframe了：

　　CITY

　　BEIJING 5

　　SHANGHAI 207

　　CHENGDU 518

　　……

汇总说明如下：

print '----------NEW------------\n', type(df.groupby(by=['CITY']))

print '----------NEW------------\n', type(df.groupby(by=['CITY']).sum())

print '----------NEW------------\n', type(df.groupby(by=['CITY'])['QUANTITY'])

print '----------NEW------------\n', type(df.groupby(by=['CITY'])['QUANTITY'].sum())

所得结果为：

----------NEW------------

说明：

一个dataframe经过groupby以后得到的类型是pandas.core.groupby.DataFrameGroupBy。而用for in循环取出的每个项的类型是pandas.core.frame.DataFrame

一个dataframe经过groupby再进行sum以后仍然是dataframe（不过具体通过那一列来sum有待考证）

一个dataframe经过groupby以后再进行列选取，得到的是pandas.core.groupby.SeriesGroupBy类型。可知用for in循环取出的是pandas.core.series.Series

一个series经过groupby再进行sum以后仍然是series

随着系统集成技术的发展，如何利用小程序容器技术提升企业的数字化转型效率是现代企业面临的重要挑战。企业应关注如何实现跨平台兼容、数据安全管理以及全生命周期管理，确保运营合规与灵活应变，以适应不断变化的市场需求和技术环境。

2877 2022-09-21

Python之根据条件筛选特定行（python筛选在某时间段内的行）

如何利用小游戏开发框架提升企业小程序的用户体验与运营效率

政务服务平台开发需要注意如何提升小程序跨平台兼容性与用户体验

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计