本發(fā)明涉及顯卡性能監(jiān)測,尤其涉及一種顯卡組件性能監(jiān)測方法、裝置及設(shè)備。
背景技術(shù):
1、傳統(tǒng)的顯卡散熱方案主要依賴于固定的風(fēng)扇轉(zhuǎn)速曲線和簡單的溫度閾值控制,無法準(zhǔn)確捕捉gpu芯片、顯存、電源管理模塊等不同組件之間的溫度耦合關(guān)系,導(dǎo)致散熱效果不理想,影響顯卡的整體性能和使用壽命。
2、目前業(yè)界普遍采用的顯卡溫度監(jiān)測方法往往只關(guān)注單點溫度數(shù)據(jù),缺乏對多組件溫度分布的整體性分析。這種方法忽視了顯卡各組件之間的熱傳導(dǎo)效應(yīng),無法建立準(zhǔn)確的熱網(wǎng)絡(luò)模型,導(dǎo)致溫度預(yù)測精度低,散熱控制策略難以優(yōu)化。同時,傳統(tǒng)的溫度控制方法多采用簡單的pid控制或查表法,無法應(yīng)對復(fù)雜的溫度動態(tài)變化過程。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種顯卡組件性能監(jiān)測方法、裝置及設(shè)備,本發(fā)明實現(xiàn)了溫度耦合系數(shù)的精確計算和溫度解耦控制器的設(shè)計,有效解決了組件間溫度耦合問題,使散熱控制策略能夠自適應(yīng)調(diào)整,適應(yīng)不同的工作負(fù)載條件。
2、第一方面,本發(fā)明提供了一種顯卡組件性能監(jiān)測方法,所述顯卡組件性能監(jiān)測方法包括:
3、對顯卡的gpu芯片、顯存、電源管理模塊和散熱器設(shè)置溫度傳感器陣列進(jìn)行溫度數(shù)據(jù)采集和預(yù)處理,得到溫度分布矩陣;
4、根據(jù)所述溫度分布矩陣建立包含n個節(jié)點的熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并對所述熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行有限元離散化計算,得到熱網(wǎng)絡(luò)狀態(tài)空間方程;
5、對所述熱網(wǎng)絡(luò)狀態(tài)空間方程進(jìn)行偏最小二乘回歸分析,計算溫度耦合系數(shù)矩陣,通過極點配置法構(gòu)建溫度解耦控制器,得到m個溫度控制區(qū)域;
6、將所述溫度控制區(qū)域的溫度狀態(tài)向量和負(fù)載狀態(tài)向量輸入混合q網(wǎng)絡(luò)結(jié)構(gòu),執(zhí)行ε-貪心策略和q學(xué)習(xí)更新規(guī)則,得到散熱控制參數(shù)序列。
7、第二方面,本發(fā)明提供了一種顯卡組件性能監(jiān)測裝置,所述顯卡組件性能監(jiān)測裝置包括:
8、溫度數(shù)據(jù)采集模塊,用于對顯卡的gpu芯片、顯存、電源管理模塊和散熱器設(shè)置溫度傳感器陣列進(jìn)行溫度數(shù)據(jù)采集和預(yù)處理,得到溫度分布矩陣;
9、離散化計算模塊,用于根據(jù)所述溫度分布矩陣建立包含n個節(jié)點的熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并對所述熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行有限元離散化計算,得到熱網(wǎng)絡(luò)狀態(tài)空間方程;
10、回歸分析模塊,用于對所述熱網(wǎng)絡(luò)狀態(tài)空間方程進(jìn)行偏最小二乘回歸分析,計算溫度耦合系數(shù)矩陣,通過極點配置法構(gòu)建溫度解耦控制器,得到m個溫度控制區(qū)域;
11、執(zhí)行模塊,用于將所述溫度控制區(qū)域的溫度狀態(tài)向量和負(fù)載狀態(tài)向量輸入混合q網(wǎng)絡(luò)結(jié)構(gòu),執(zhí)行ε-貪心策略和q學(xué)習(xí)更新規(guī)則,得到散熱控制參數(shù)序列。
12、本發(fā)明第三方面提供了一種顯卡組件性能監(jiān)測設(shè)備,包括:存儲器和至少一個處理器,所述存儲器中存儲有指令;所述至少一個處理器調(diào)用所述存儲器中的所述指令,以使得所述顯卡組件性能監(jiān)測設(shè)備執(zhí)行上述的顯卡組件性能監(jiān)測方法。
13、本發(fā)明提供的技術(shù)方案中,通過布置多點溫度傳感器陣列并建立溫度分布矩陣,實現(xiàn)了對顯卡各組件溫度的精確監(jiān)測,采用集總參數(shù)熱網(wǎng)絡(luò)模型和有限元離散化方法,準(zhǔn)確描述了顯卡組件間的熱傳導(dǎo)關(guān)系,建立了完整的熱網(wǎng)絡(luò)狀態(tài)空間方程,引入偏最小二乘回歸分析和極點配置法,實現(xiàn)了溫度耦合系數(shù)的精確計算和溫度解耦控制器的設(shè)計,有效解決了組件間溫度耦合問題;采用混合q網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行散熱控制,結(jié)合全局價值網(wǎng)絡(luò)和局部價值網(wǎng)絡(luò)的優(yōu)勢,實現(xiàn)了對顯卡散熱參數(shù)的智能優(yōu)化,通過ε-貪心策略和經(jīng)驗回放機制,增強了控制系統(tǒng)的探索能力和學(xué)習(xí)效率,使散熱控制策略能夠自適應(yīng)調(diào)整,適應(yīng)不同的工作負(fù)載條件。
14、本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
15、為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。
1.一種顯卡組件性能監(jiān)測方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的顯卡組件性能監(jiān)測方法,其特征在于,所述對顯卡的gpu芯片、顯存、電源管理模塊和散熱器設(shè)置溫度傳感器陣列進(jìn)行溫度數(shù)據(jù)采集和預(yù)處理,得到溫度分布矩陣,包括:
3.根據(jù)權(quán)利要求1所述的顯卡組件性能監(jiān)測方法,其特征在于,所述根據(jù)所述溫度分布矩陣建立包含n個節(jié)點的熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并對所述熱網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行有限元離散化計算,得到熱網(wǎng)絡(luò)狀態(tài)空間方程,包括:
4.根據(jù)權(quán)利要求3所述的顯卡組件性能監(jiān)測方法,其特征在于,所述對所述熱平衡方程組進(jìn)行時間域離散化處理,得到時間離散化熱平衡方程組,并對所述時間離散化熱平衡方程組進(jìn)行空間域有限元離散化處理,得到熱網(wǎng)絡(luò)有限元方程組,包括:
5.根據(jù)權(quán)利要求1所述的顯卡組件性能監(jiān)測方法,其特征在于,所述對所述熱網(wǎng)絡(luò)狀態(tài)空間方程進(jìn)行偏最小二乘回歸分析,計算溫度耦合系數(shù)矩陣,通過極點配置法構(gòu)建溫度解耦控制器,得到m個溫度控制區(qū)域,包括:
6.根據(jù)權(quán)利要求1所述的顯卡組件性能監(jiān)測方法,其特征在于,所述將所述溫度控制區(qū)域的溫度狀態(tài)向量和負(fù)載狀態(tài)向量輸入混合q網(wǎng)絡(luò)結(jié)構(gòu),執(zhí)行ε-貪心策略和q學(xué)習(xí)更新規(guī)則,得到散熱控制參數(shù)序列,包括:
7.根據(jù)權(quán)利要求6所述的顯卡組件性能監(jiān)測方法,其特征在于,所述將所述狀態(tài)編碼向量輸入混合q網(wǎng)絡(luò)結(jié)構(gòu)的全局價值網(wǎng)絡(luò)和局部價值網(wǎng)絡(luò),所述全局價值網(wǎng)絡(luò)采用三層全連接層結(jié)構(gòu),所述局部價值網(wǎng)絡(luò)針對每個溫度控制區(qū)域構(gòu)建獨立的兩層全連接網(wǎng)絡(luò),得到q值評估結(jié)果,包括:
8.一種顯卡組件性能監(jiān)測裝置,其特征在于,用于執(zhí)行如權(quán)利要求1-7中任一項所述的顯卡組件性能監(jiān)測方法,所述裝置包括:
9.一種顯卡組件性能監(jiān)測設(shè)備,其特征在于,所述顯卡組件性能監(jiān)測設(shè)備包括:存儲器和至少一個處理器,所述存儲器中存儲有指令;