RuntimeError: [enforce fail at inline_container.cc:145] 【报错总结】
程序开发
2023-09-10 14:52:44
🥇 版权: 本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连
🎉 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
文章目录
情况一:磁盘空间不足,导致训练过程中正在生成的模型保存失败,从而resume训练时,加载报错
这个截图 是这个博主的分析,比较详细,就不再赘述了,本博文主要进一步记录遇到这种报错,可以采取的解决方法示例
Resume 训练 代码分析
在 Resume 训练时,通常需要修改的 命令 参数如下:
Resume 训练示例如下,节选自这篇博文 基于无监督退化表示学习的 Blind SR | 环境搭建 | 训练简记【更新补充】|【CVPR2021】
训练过程,每隔固定次数,进行模型保存
这种训练,模型保存策略的优点:
这种训练,模型保存策略的缺点:
情况二:模型在Copy、传输的时候数据丢失,复制不完整
这种情况通过检查模型大小,或者 md5sum 命令对比两个文件 可以用来 判断 两个文件是否是同一份
# md5sum 查看普通文件md5sum Definitions.h 9176014a7908ef9fe33b5f19fb0d2d10 Definitions.h# md5sum 查看 so 库md5sum libopencv_core.so523656f3490a0f732f66f2b8f2aabafc libopencv_core.so
精选专栏
计算机视觉领域 八大专栏、不少干货、有兴趣可了解一下
标签:
上一篇:
Android Activity 进入退出动画
下一篇:
相关文章
-
无相关信息