解决报错RuntimeError: CUDA out of memory-FinClip官网

解决报错RuntimeError: CUDA out of memory

网友投稿 2622 2022-11-17

解决报错RuntimeError: CUDA out of memory

文章目录

一、问题描述二、解决方法Reference

一、问题描述

(work2) andy@gpu-machine:~/deepFM_CTR_beat/model_train$ python beat_deepFM_train.py 开始模型训练：！！！！Traceback (most recent call last): File "beat_deepFM_train.py", line 155, in model = model.to(device) File "/home/andy/.conda/envs/fun/lib/python3.8/site-packages/torch/nn/modules/module.py", line 907, in to return self._apply(convert) File "/home/andy/.conda/envs/fun/lib/python3.8/site-packages/torch/nn/modules/module.py", line 578, in _apply module._apply(fn) File "/home/andy/.conda/envs/fun/lib/python3.8/site-packages/torch/nn/modules/module.py", line 578, in _apply module._apply(fn) File "/home/andy/.conda/envs/fun/lib/python3.8/site-packages/torch/nn/modules/module.py", line 601, in _apply param_applied = fn(param) File "/home/andy/.conda/envs/fun/lib/python3.8/site-packages/torch/nn/modules/module.py", line 905, in convert return t.to(device, dtype if t.is_floating_point() or t.is_complex() else None, non_blocking)RuntimeError: CUDA out of memory. Tried to allocate 5.96 GiB (GPU 0; 9.78 GiB total capacity; 1.07 GiB already allocated; 5.81 GiB free; 1.08 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and

二、解决方法

首先简单粗暴的方法当然是换大显卡或者多卡训练。设置内存条：max_split_size_mb释放无关内存（清空程序占用的无关内存）：

if hasattr(torch.cuda, 'empty_cache'): torch.cuda.empty_cache()

可能同时间有其他运行的进程，可以通过taskkill /F /PID 杀死对应的进程。调整bs的技巧：如何设置batchsize

batchsize过小：每次计算的梯度不稳定，引起训练的震荡比较大，很难收敛。batchsize过大可以用下面用法（试过了还不行）

更详细的参考：一文读懂 PyTorch 显存管理机制在pytorch官方github的issue

batch_szie参数：（1）提高了内存利用率，大矩阵乘法并行计算效率提高。（2）计算的梯度方向比较准，引起的训练的震荡比较小。（3）跑完一次epoch所需要的迭代次数变小，相同数据量的数据处理速度加快。缺点：容易内容溢出，想要达到相同精度，epoch会越来越大，容易陷入局部最优，泛化性能差。 batchsize设置：通常10到100，一般设置为2的n次方。原因：计算机的gpu和cpu的memory都是2进制方式存储的，设置2的n次方可以加快计算速度。

Reference

[1] RuntimeError: CUDA out of memory

智慧屏第三方App安装如何提升用户体验与功能拓展

2622 2022-11-17

解决报错RuntimeError: CUDA out of memory

app开发者平台在数字化时代的重要性与发展趋势解析

智慧屏第三方App安装如何提升用户体验与功能拓展

智慧屏安装 app如何提升家庭娱乐与教育体验的关键工具

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计