本申請(qǐng)涉及電子,尤其涉及一種語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品,其中,存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),產(chǎn)品為計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、通過(guò)語(yǔ)音喚醒設(shè)備或者控制設(shè)備執(zhí)行相應(yīng)操作,可以提高人機(jī)交互的效率,因此,準(zhǔn)確識(shí)別音頻中是否包含喚醒詞或者其他指定詞語(yǔ)對(duì)人機(jī)交互十分重要。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種語(yǔ)音檢測(cè)方法、裝置、控制器、車輛、存儲(chǔ)介質(zhì)和產(chǎn)品,可以準(zhǔn)確識(shí)別音頻數(shù)據(jù)中的目標(biāo)詞匯。
2、為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的第一方面,提供一種語(yǔ)音檢測(cè)方法,包括:
3、獲取音頻數(shù)據(jù)的音頻特征信息;
4、對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;
5、根據(jù)所述目標(biāo)音頻特征信息確定所述音頻數(shù)據(jù)是否包含所述目標(biāo)詞匯。
6、根據(jù)本申請(qǐng)的第二方面,提供一種語(yǔ)音檢測(cè)裝置,包括:
7、獲取單元,用于獲取音頻數(shù)據(jù)的音頻特征信息;
8、選擇單元,用于對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;
9、確定單元,用于根據(jù)所述目標(biāo)音頻特征信息確定所述音頻數(shù)據(jù)是否包含所述目標(biāo)詞匯。
10、根據(jù)本申請(qǐng)的第三方面,提供一種控制器,包括存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。
11、根據(jù)本申請(qǐng)的第四方面,提供一種車輛,包括控制器;所述車輛通過(guò)所述控制器執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。
12、根據(jù)本申請(qǐng)的第五方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器加載以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。
13、根據(jù)本申請(qǐng)的第六方面,提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序或指令,所述計(jì)算機(jī)程序或指令被處理器加載以執(zhí)行本申請(qǐng)實(shí)施例提供的任一種語(yǔ)音檢測(cè)方法。
14、本申請(qǐng)實(shí)施例通過(guò)獲取音頻數(shù)據(jù)的音頻特征信息;對(duì)音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息;根據(jù)目標(biāo)音頻特征信息確定音頻數(shù)據(jù)是否包含目標(biāo)詞匯,可以從音頻數(shù)據(jù)的音頻特征信息中選擇與目標(biāo)詞匯相關(guān)的特征信息,進(jìn)而可以更加關(guān)注于與目標(biāo)詞匯相關(guān)的特征,準(zhǔn)確識(shí)別音頻數(shù)據(jù)中是否包含目標(biāo)詞匯。
1.一種語(yǔ)音檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述音頻特征信息包括第一音頻特征信息,所述對(duì)所述音頻特征信息中與目標(biāo)詞匯相關(guān)的特征信息進(jìn)行特征選擇處理,得到目標(biāo)音頻特征信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述處理后特征信息中與所述目標(biāo)詞匯相關(guān)的第一特征部分,得到所述目標(biāo)音頻特征信息,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述處理后特征信息包括在不同時(shí)刻采集到的音頻片段對(duì)應(yīng)的特征信息,所述對(duì)所述處理后特征信息中與所述目標(biāo)詞匯相關(guān)的第一特征部分進(jìn)行提取處理,得到第一目標(biāo)音頻特征信息,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述處理后特征信息,確定所述處理后特征信息中每一所述時(shí)刻對(duì)應(yīng)的特征信息的選擇性權(quán)重,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述目標(biāo)模型包括狀態(tài)轉(zhuǎn)移矩陣,所述通過(guò)目標(biāo)模型基于所述選擇性權(quán)重從所述處理后特征信息中提取所述第一特征部分,得到所述第一目標(biāo)音頻特征信息,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述目標(biāo)模型還包括觀測(cè)轉(zhuǎn)移矩陣,所述根據(jù)每一所述時(shí)刻對(duì)應(yīng)的所述隱狀態(tài),從所述處理后特征信息中提取所述第一特征部分,得到所述第一目標(biāo)音頻特征信息,包括:
8.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述音頻特征信息還包括第二音頻特征信息,所述基于所述第一目標(biāo)音頻特征信息得到所述目標(biāo)音頻特征信息,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于所述第一融合后特征信息,確定所述目標(biāo)音頻特征信息,包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述音頻特征信息還包括第三音頻特征信息,所述基于所述第二目標(biāo)音頻特征信息得到所述目標(biāo)音頻特征信息,包括:
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述目標(biāo)模型通過(guò)以下步驟訓(xùn)練得到:
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述音頻數(shù)據(jù)樣本對(duì)應(yīng)有樣本標(biāo)簽,所述根據(jù)所述檢測(cè)結(jié)果和損失權(quán)重對(duì)所述初始模型進(jìn)行訓(xùn)練,以得到所述目標(biāo)模型,包括:
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述初始模型包括用于確定所述損失權(quán)重的超參數(shù),所述根據(jù)所述檢測(cè)結(jié)果確定針對(duì)所述初始模型的損失權(quán)重,包括:
14.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述音頻數(shù)據(jù)樣本通過(guò)以下步驟獲得:
15.根據(jù)權(quán)利要求1-14任一項(xiàng)所述的方法,所述音頻數(shù)據(jù)在載具的座艙內(nèi)采集,所述目標(biāo)詞匯包括所述座艙的喚醒詞。
16.一種語(yǔ)音檢測(cè)裝置,其特征在于,包括:
17.一種控制器,其特征在于,包括存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。
18.一種車輛,其特征在于,包括權(quán)利要求17所述的控制器;所述車輛通過(guò)所述控制器,執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。
19.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器加載,以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。
20.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序或指令,所述計(jì)算機(jī)程序或指令被處理器加載以執(zhí)行權(quán)利要求1至15任一項(xiàng)所述的語(yǔ)音檢測(cè)方法。