标签:RuntimeError error 999 cuda nvidia runtime
项目场景:
模型训练开始–结束过程
问题描述:
一个数据集刚跑完,换另一个数据集继续做实验,训练一开始就爆出个Error,了不得!反正就是999未知错误。
RuntimeError: cuda runtime error (999) : unknown error at C:/cb/pytorch_1000000000000/work/aten/src\THCUNN/generic/ClassNLLCriterion.cu:235
RuntimeError: cuda runtime error (999) : unknown error at C:/cb/pytorch_1595629403081/work/aten/src/THC/THCGeneral.cpp:47
原因分析:
看到cuda runtime error,很好知道cuda出毛病了,然后看到999这是神马?感冒灵?就换了一下数据集的路径,总不可能动到其他文件吧,所以代码错误排除。
大概可能或许就是cuda初始化或者加载出问题了吧。
解决方案:
1.针对linux系统(网上通用解决办法):
重新加载nvidia内核模块
sudo rmmod nvidia_uvm
sudo modprobe nvidia_uvm
2.针对所有系统
没什么问题是重装不能解决的,如果有那就重装CUDA两遍!!!
3.针对Windows系统
用惯了windows就是不想换系统,重装CUDA又那么费劲,懒人有懒人的万能解决办法:重启电脑,just so so!
标签:RuntimeError,error,999,cuda,nvidia,runtime 来源: https://blog.csdn.net/qq_36622589/article/details/121940408
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。