深度学习Halcon中GPU显存利用率高,但GPU、CPU利用率较低,导致模型训练速度很慢,通过设置硬件参数的解决方法 转载 https://blog.csdn.net/qq_18620653/article/details/106176590

时间:2024-03-07 07:00:41

深度学习Halcon中GPU显存利用率高,但GPU、CPU利用率较低,导致模型训练速度很慢,通过设置硬件参数的解决方法

前言

在训练自己模型的时候,会遇到GPU显存利用率高,但GPU、CPU利用率较低,导致模型训练速度很慢的问题。这个问题一方面是由于硬件没有设置到最佳工作状态,另一方面是代码中参数没有设置好。最近在跑Halcon DL遇到这个问题,而Halcon不像开源的几个框架那样*,代码封装的比较严实。所以遇到这种问题,只能在参数最优的情况下,通过设置硬件参数来提升性能。
当然,在跑DL之前,无论什么框架,都需要把硬件性能提升到最高效,这样心里才平衡,因为只有这样才能不辜负花出去的白花花银子。

前景再现

这是没有进行硬件设置之前,GPU状态(效率非常低,一度怀疑自己的卡是矿卡)。
在这里插入图片描述
进行一系列硬件设置之后GPU运行状态(两次运行的代码以及数据集都是相同的)。
在这里插入图片描述

硬件设置

1、电源性能

找到控制面板->电源选项->选择高性能
在这里插入图片描述

2、显卡性能

开始菜单栏->NVIDIA Control Panel(显卡控制面板)
在这里插入图片描述
拖动滑动条选择性能选项。
在这里插入图片描述
配置PhysX,PhysX设置下选择自己的显卡,点击应用生效。
在这里插入图片描述

3、BIOS CPU性能

进入BIOS,将CPU性能设置到最佳(不同品牌主板设置可能有区别,视自己的情况而设置,最终只要达到提升CPU性能的目的就好)。
在这里插入图片描述
根据我的CPU功能,开启涡轮加速模式(上图的Turbo-Model)
在这里插入图片描述

4、硬盘性能

如果有固态硬盘,最好将要处理的数据集存放在固态硬盘上,这样会提高数据交互效率。