paddlepaddle使用多进程报错“(External) CUDA error(3), initialization error.”的解决方法

2021-12-02 16:03:18 阅读：296 来源： 互联网

标签：显存训练 initialization paddlepaddle 报错 error 进程 GPU

使用paddlepaddle训练模型时，存在模型训练已结束，但GPU显存依然占用，影响下一次训练的问题。为了能够在模型训练结束后自动释放GPU显存，参考Tensorflow借助多进程释放内存的方法，可以将paddlepaddle的模型训练放到多进程中进行，从而让训练进程结束后GPU资源自动的释放。

但是在使用 multiprocessing 训练paddlepaddle模型时有时候会遇到

CUDA error(3), initialization error.

的错误提示。

参考paddlepaddle在github上的issue讨论，发现将所有与paddle相关的模块都放到 multiprocessing 里 import 且不要在多进程外有 import 这些模块就可以正常运行了，这样在进程结束后相应的资源也会自动释放。

参考：
TensorFlow函数使用完成释放显存问题 - 知乎
 单gpu 多进程报错 · Issue #2241 · PaddlePaddle/PaddleDetection · GitHub
multiprocessing --- 基于进程的并行 — Python 3.7.12 文档

标签：显存,训练,initialization,paddlepaddle,报错,error,进程,GPU
来源： https://www.cnblogs.com/1blog/p/15633701.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

paddlepaddle使用多进程报错“(External) CUDA error(3), initialization error.”的解决方法