日本国产欧美大码a视频,亚洲美女久久,人人爱人人搞,亚洲18在线观看,aaa少妇高潮大片免费下载,日日干夜夜草,99免费在线观看

語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品與流程

文檔序號(hào):42291506發(fā)布日期:2025-06-27 18:24閱讀:6來(lái)源:國(guó)知局

本申請(qǐng)涉及電子,尤其涉及一種語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品,其中,存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),產(chǎn)品為計(jì)算機(jī)程序產(chǎn)品。


背景技術(shù):

1、通過(guò)語(yǔ)音喚醒設(shè)備或者控制設(shè)備執(zhí)行相應(yīng)操作,可以提高人機(jī)交互的效率,因此,準(zhǔn)確識(shí)別音頻中是否包含喚醒詞或者其他指定詞語(yǔ)對(duì)人機(jī)交互十分重要。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供一種語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品,可以準(zhǔn)確識(shí)別音頻數(shù)據(jù)中的目標(biāo)詞匯。

2、為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的第一方面,提供一種語(yǔ)音檢測(cè)方法,包括:

3、獲取音頻數(shù)據(jù)的音頻特征信息;

4、對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;

5、根據(jù)所述目標(biāo)音頻特征信息確定所述音頻數(shù)據(jù)是否包含所述目標(biāo)詞匯。

6、根據(jù)本申請(qǐng)的第二方面,提供一種語(yǔ)音檢測(cè)裝置,包括:

7、獲取單元,用于獲取音頻數(shù)據(jù)的音頻特征信息;

8、選擇單元,用于對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;

9、確定單元,用于根據(jù)所述目標(biāo)音頻特征信息確定所述音頻數(shù)據(jù)是否包含所述目標(biāo)詞匯。

10、根據(jù)本申請(qǐng)的第三方面,提供一種控制器,包括存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。

11、根據(jù)本申請(qǐng)的第四方面,提供一種車輛,包括控制器;所述車輛通過(guò)所述控制器執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。

12、根據(jù)本申請(qǐng)的第五方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器加載以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。

13、根據(jù)本申請(qǐng)的第六方面,提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序或指令,所述計(jì)算機(jī)程序或指令被處理器加載以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。

14、本申請(qǐng)實(shí)施例通過(guò)獲取音頻數(shù)據(jù)的音頻特征信息;對(duì)音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;根據(jù)目標(biāo)音頻特征信息確定音頻數(shù)據(jù)是否包含目標(biāo)詞匯,可以從音頻數(shù)據(jù)的音頻特征信息中選擇與目標(biāo)詞匯相關(guān)的特征信息,進(jìn)而可以更加關(guān)注于與目標(biāo)詞匯相關(guān)的特征,準(zhǔn)確識(shí)別音頻數(shù)據(jù)中是否包含目標(biāo)詞匯。



技術(shù)特征:

1.一種語(yǔ)音檢測(cè)方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述音頻特征信息包括第一音頻特征信息,所述對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息,包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述處理后特征信息中與所述目標(biāo)詞匯相關(guān)的第一特征部分,得到所述目標(biāo)音頻特征信息,包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述處理后特征信息包括在不同時(shí)刻采集到的音頻片段對(duì)應(yīng)的特征信息,所述對(duì)所述處理后特征信息中與所述目標(biāo)詞匯相關(guān)的第一特征部分進(jìn)行提取處理,得到第一目標(biāo)音頻特征信息,包括:

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述處理后特征信息,確定所述處理后特征信息中每一所述時(shí)刻對(duì)應(yīng)的特征信息的選擇性權(quán)重,包括:

6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述目標(biāo)模型包括狀態(tài)轉(zhuǎn)移矩陣,所述通過(guò)目標(biāo)模型基于所述選擇性權(quán)重從所述處理后特征信息中提取所述第一特征部分,得到所述第一目標(biāo)音頻特征信息,包括:

7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述目標(biāo)模型還包括觀測(cè)轉(zhuǎn)移矩陣,所述根據(jù)每一所述時(shí)刻對(duì)應(yīng)的所述隱狀態(tài),從所述處理后特征信息中提取所述第一特征部分,得到所述第一目標(biāo)音頻特征信息,包括:

8.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述音頻特征信息還包括第二音頻特征信息,所述基于所述第一目標(biāo)音頻特征信息得到所述目標(biāo)音頻特征信息,包括:

9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于所述第一融合后特征信息,確定所述目標(biāo)音頻特征信息,包括:

10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述音頻特征信息還包括第三音頻特征信息,所述基于所述第二目標(biāo)音頻特征信息得到所述目標(biāo)音頻特征信息,包括:

11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述目標(biāo)模型通過(guò)以下步驟訓(xùn)練得到:

12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述音頻數(shù)據(jù)樣本對(duì)應(yīng)有樣本標(biāo)簽,所述根據(jù)所述檢測(cè)結(jié)果和損失權(quán)重對(duì)所述初始模型進(jìn)行訓(xùn)練,以得到所述目標(biāo)模型,包括:

13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述初始模型包括用于確定所述損失權(quán)重的超參數(shù),所述根據(jù)所述檢測(cè)結(jié)果確定針對(duì)所述初始模型的損失權(quán)重,包括:

14.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述音頻數(shù)據(jù)樣本通過(guò)以下步驟獲得:

15.根據(jù)權(quán)利要求1-14任一項(xiàng)所述的方法,所述音頻數(shù)據(jù)在載具的座艙內(nèi)采集,所述目標(biāo)詞匯包括所述座艙的喚醒詞。

16.一種語(yǔ)音檢測(cè)裝置,其特征在于,包括:

17.一種控制器,其特征在于,包括存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。

18.一種車輛,其特征在于,包括權(quán)利要求17所述的控制器;所述車輛通過(guò)所述控制器,執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。

19.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器加載,以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。

20.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序或指令,所述計(jì)算機(jī)程序或指令被處理器加載以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。


技術(shù)總結(jié)
本申請(qǐng)公開了語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品,通過(guò)獲取音頻數(shù)據(jù)的音頻特征信息;對(duì)音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;根據(jù)目標(biāo)音頻特征信息確定音頻數(shù)據(jù)是否包含目標(biāo)詞匯,可以從音頻數(shù)據(jù)的音頻特征信息中選擇與目標(biāo)詞匯相關(guān)的特征信息,進(jìn)而可以更加關(guān)注于與目標(biāo)詞匯相關(guān)的特征,準(zhǔn)確識(shí)別音頻數(shù)據(jù)中是否包含目標(biāo)詞匯。

技術(shù)研發(fā)人員:劉弘,葉瓏,王飛,申眾
受保護(hù)的技術(shù)使用者:比亞迪股份有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/6/26
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1