会了这几招，可以让你的 Python 代码可以更“瘦”（怎么样才能能让你）-FinClip官网

会了这几招，可以让你的 Python 代码可以更“瘦”（怎么样才能能让你）

网友投稿 600 2022-09-23

会了这几招，可以让你的 Python 代码可以更“瘦”（怎么样才能能让你）

在执行程序时，如果内存中有大量活动的对象，就可能出现内存问题，尤其是在可用内存总量有限的情况下。在本文中，我们将讨论缩小对象的方法，大幅减少 Python 所需的内存。

为了简便起见，我们以一个表示点的 Python 结构为例，它包括 x、y、z 坐标值，坐标值可以通过名称访问。

Dict

在小型程序中，特别是在脚本中，使用 Python 自带的 dict 来表示结构信息非常简单方便：

由于在 Python 3.6 中 dict 的实现采用了一组有序键，因此其结构更为紧凑，更深得人心。但是，让我们看看 dict 在内容中占用的空间大小：

如上所示，dict 占用了大量内存，尤其是如果突然虚需要创建大量实例时：

类实例

有些人希望将所有东西都封装到类中，他们更喜欢将结构定义为可以通过属性名访问的类：

类实例的结构很有趣：

在上表中，__ weakref__ 是该列表的引用，称之为到该对象的弱引用（weak reference）；字段 __ dict__ 是该类的实例字典的引用，其中包含实例属性的值（注意在 64-bit 引用平台中占用 8 字节）。从 Python 3.3 开始，所有类实例的字典的键都存储在共享空间中。这样就减少了内存中实例的大小：

因此，大量类实例在内存中占用的空间少于常规字典（dict）：

不难看出，由于实例的字典很大，所以实例依然占用了大量内存。

带有 __ slots__ 的类实例

为了大幅降低内存中类实例的大小，我们可以考虑干掉 __ dict__ 和__weakref__。为此，我们可以借助 __ slots__：

如此一来，内存中的对象就明显变小了：

在类的定义中使用了slots以后，大量实例占据的内存就明显减少了：

目前，这是降低类实例占用内存的主要方式。

这种方式减少内存的原理为：在内存中，对象的标题后面存储的是对象的引用（即属性值），访问这些属性值可以使用类字典中的特殊描述符：

为了自动化使用 __ slots__ 创建类的过程，你可以使用库namedlist（https://pypi.org/project/namedlist）。namedlist.namedlist 函数可以创建带有 __ slots__ 的类：

还有一个包 attrs（https://pypi.org/project/attrs），无论使用或不使用 __ slots__ 都可以利用这个包自动创建类。

元组

Python 还有一个自带的元组（tuple）类型，代表不可修改的数据结构。元组是固定的结构或记录，但它不包含字段名称。你可以利用字段索引访问元组的字段。在创建元组实例时，元组的字段会一次性关联到值对象：

元组实例非常紧凑：

由于内存中的元组还包含字段数，因此需要占据内存的 8 个字节，多于带有slots的类：

命名元组

由于元组的使用非常广泛，所以终有一天你需要通过名称访问元组。为了满足这种需求，你可以使用模块 collections.namedtuple。

namedtuple 函数可以自动生成这种类：

如上代码创建了元组的子类，其中还定义了通过名称访问字段的描述符。对于上述示例，访问方式如下：

这种类所有的实例所占用的内存与元组完全相同。但大量的实例占用的内存也会稍稍多一些：

记录类：不带循环 GC 的可变更命名元组

由于元组及其相应的命名元组类能够生成不可修改的对象，因此类似于 ob.x 的对象值不能再被赋予其他值，所以有时还需要可修改的命名元组。由于 Python 没有相当于元组且支持赋值的内置类型，因此人们想了许多办法。在这里我们讨论一下记录类（recordclass，https://pypi.org/project/recordclass），它在 StackoverFlow 上广受好评（https://stackoverflow.com/questions/29290359/existence-of-mutable-named-tuple-in）。

此外，它还可以将对象占用的内存量减少到与元组对象差不多的水平。

recordclass 包引入了类型 recordclass.mutabletuple，它几乎等价于元组，但它支持赋值。它会创建几乎与 namedtuple 完全一致的子类，但支持给属性赋新值（而不需要创建新的实例）。recordclass 函数与 namedtuple 函数类似，可以自动创建这些类：

类实例的结构也类似于 tuple，但没有 PyGC_Head：

在默认情况下，recordclass 函数会创建一个类，该类不参与垃圾回收机制。一般来说，namedtuple 和 recordclass 都可以生成表示记录或简单数据结构（即非递归结构）的类。在 Python 中正确使用这二者不会造成循环引用。因此，recordclass 生成的类实例默认情况下不包含 PyGC_Head 片段（这个片段是支持循环垃圾回收机制的必需字段，或者更准确地说，在创建类的 PyTypeObject 结构中，flags 字段默认情况下不会设置 Py_TPFLAGS_HAVE_GC 标志）。

大量实例占用的内存量要小于带有 __ slots__ 的类实例：

dataobject

recordclass 库提出的另一个解决方案的基本想法为：内存结构采用与带 slots 的类实例同样的结构，但不参与循环垃圾回收机制。这种类可以通过 recordclass.make_dataclass 函数生成：

这种方式创建的类默认会生成可修改的实例。

另一种方法是从 recordclass.dataobject 继承：

这种方法创建的类实例不会参与循环垃圾回收机制。内存中实例的结构与带有slots的类相同，但没有 PyGC_Head：

如果想访问字段，则需要使用特殊的描述符来表示从对象开头算起的偏移量，其位置位于类字典内：

大量实例占用的内存量在 CPython 实现中是最小的：

Cython

还有一个基于 Cython（https://cython.org/）的方案。该方案的优点是字段可以使用 C 语言的原子类型。访问字段的描述符可以通过纯 Python 创建。例如：

本例中实例占用的内存更小：

内存结构如下：

大量副本所占用的内存量也很小：

但是，需要记住在从 Python 代码访问时，每次访问都会引发 int 类型和 Python 对象之间的转换。

Numpy

使用拥有大量数据的多维数组或记录数组会占用大量内存。但是，为了有效地利用纯 Python 处理数据，你应该使用 Numpy 包提供的函数。

一个拥有 N 个元素、初始化成零的数组可以通过下面的函数创建：

内存占用是最小的：

一般情况下，访问数组元素和行会引发 Python 对象与 C 语言 int 值之间的转换。如果从生成的数组中获取一行结果，其中包含一个元素，其内存就没那么紧凑了：

因此，如上所述，在 Python 代码中需要使用 numpy 包提供的函数来处理数组。

总结

在本文中，我们通过一个简单明了的例子，求证了 Python 语言（CPython）社区的开发人员和用户可以真正减少对象占用的内存量。

微前端架构如何改变企业的开发模式与效率提升

600 2022-09-23

会了这几招，可以让你的 Python 代码可以更“瘦”（怎么样才能能让你）

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计