本技術(shù)涉及語音識(shí)別,特別是涉及一種語音識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、語音識(shí)別技術(shù),是一種能夠?qū)⒁纛l轉(zhuǎn)換成文本或命令的技術(shù),識(shí)別準(zhǔn)確性是語音識(shí)別技術(shù)的優(yōu)劣評(píng)價(jià)的一個(gè)重要維度。通常情況下,不同業(yè)務(wù)場(chǎng)景下識(shí)別的內(nèi)容領(lǐng)域偏好存在差異,應(yīng)用領(lǐng)域內(nèi)經(jīng)常出現(xiàn)的詞匯或者定制的偏好詞匯,也可以叫做熱詞。實(shí)際應(yīng)用場(chǎng)景中,可以在語音識(shí)別過程中考慮熱詞的影響,提高識(shí)別準(zhǔn)確率。
2、然而,傳統(tǒng)的語音識(shí)別熱詞增強(qiáng)技術(shù)中,由于熱詞識(shí)別效果受限,識(shí)別的準(zhǔn)確率較差。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種語音識(shí)別方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),可以提高識(shí)別準(zhǔn)確率。
2、第一方面,本技術(shù)提供了一種語音識(shí)別方法。所述方法用于對(duì)語音信號(hào)中的語音幀進(jìn)行識(shí)別,包括:
3、根據(jù)所述語音幀的目標(biāo)解碼路徑,對(duì)所述語音幀進(jìn)行解碼,得到所述語音幀的多個(gè)候選路徑及對(duì)應(yīng)的路徑分值,每個(gè)候選路徑對(duì)應(yīng)一個(gè)路徑分值,所述目標(biāo)解碼路徑為與所述語音幀相鄰的上一語音幀的任一目標(biāo)路徑;
4、根據(jù)所述路徑分值和目標(biāo)熱詞,從所述多個(gè)候選路徑中確定保留路徑,所述保留路徑包括路徑分值排名前n的分值匹配路徑以及與所述目標(biāo)熱詞相匹配的熱詞匹配路徑,所述n為正整數(shù),所述目標(biāo)熱詞為根據(jù)所述目標(biāo)解碼路徑從預(yù)設(shè)熱詞庫(kù)中確定得到;
5、根據(jù)所述預(yù)設(shè)熱詞庫(kù)中所述目標(biāo)熱詞的熱詞分值,對(duì)所述保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值;
6、根據(jù)所述更新后的路徑分值,從所述保留路徑中確定所述語音幀的與所述目標(biāo)解碼路徑對(duì)應(yīng)的目標(biāo)路徑。
7、在其中一個(gè)實(shí)施例中,所述熱詞匹配路徑的確定方式,包括:
8、根據(jù)所述目標(biāo)熱詞,從所述多個(gè)候選路徑中確定與所述目標(biāo)熱詞相匹配的初始匹配路徑;
9、根據(jù)所述目標(biāo)熱詞的熱詞分值,對(duì)所述初始匹配路徑的路徑分值進(jìn)行更新,得到更新后的初始匹配路徑的路徑分值;
10、確定所述更新后的初始匹配路徑的路徑分值排名前m的初始匹配路徑作為熱詞匹配路徑,所述m為正整數(shù)。
11、在其中一個(gè)實(shí)施例中,所述目標(biāo)熱詞包括潛在熱詞和同音熱詞中的至少一種,所述熱詞匹配路徑的確定方式,包括:
12、從所述多個(gè)候選路徑中,確定包含所述潛在熱詞的候選路徑為潛在匹配路徑;
13、從所述多個(gè)候選路徑中,確定與所述同音熱詞相匹配的候選路徑為同音匹配路徑;
14、根據(jù)所述潛在匹配路徑和所述同音匹配路徑中的至少一種,得到熱詞匹配路徑。
15、在其中一個(gè)實(shí)施例中,所述同音熱詞的確定方式,包括:
16、針對(duì)所述目標(biāo)解碼路徑,從所述語音幀的除所述目標(biāo)解碼路徑以外的其他解碼路徑中,確定倒數(shù)第二個(gè)詞單元與所述目標(biāo)解碼路徑的最后一個(gè)詞單元相同的路徑,作為同音路徑;
17、從所述預(yù)設(shè)熱詞庫(kù)中,確定與所述同音路徑的最后一個(gè)詞單元同音的目標(biāo)詞單元,并將所述目標(biāo)詞單元對(duì)應(yīng)的熱詞作為同音熱詞。
18、在其中一個(gè)實(shí)施例中,所述潛在熱詞的確定方式,包括:
19、根據(jù)所述目標(biāo)解碼路徑的最后一個(gè)詞單元,從所述預(yù)設(shè)熱詞庫(kù)中確定與所述最后一個(gè)詞單元相匹配的熱詞,作為潛在熱詞。
20、在其中一個(gè)實(shí)施例中,所述從所述預(yù)設(shè)熱詞庫(kù)中確定與所述最后一個(gè)詞單元的熱詞,作為潛在熱詞,包括:
21、從所述預(yù)設(shè)熱詞庫(kù)中確定與所述最后一個(gè)詞單元相匹配的熱詞為候選熱詞;
22、從所述候選熱詞中,確定熱詞分值大于預(yù)設(shè)分值的熱詞為潛在熱詞。
23、第二方面,本技術(shù)還提供了一種語音識(shí)別裝置。所述裝置用于對(duì)語音信號(hào)中的語音幀進(jìn)行識(shí)別,包括:
24、解碼模塊,用于根據(jù)所述語音幀的目標(biāo)解碼路徑,對(duì)所述語音幀進(jìn)行解碼,得到所述語音幀的多個(gè)候選路徑及對(duì)應(yīng)的路徑分值,每個(gè)候選路徑對(duì)應(yīng)一個(gè)路徑分值,所述目標(biāo)解碼路徑為與所述語音幀相鄰的上一語音幀的任一目標(biāo)路徑;
25、第一確定模塊,用于根據(jù)所述路徑分值和目標(biāo)熱詞,從所述多個(gè)候選路徑中確定保留路徑,所述保留路徑包括路徑分值排名前n的分值匹配路徑以及與所述目標(biāo)熱詞相匹配的熱詞匹配路徑,所述n為正整數(shù),所述目標(biāo)熱詞為根據(jù)所述目標(biāo)解碼路徑從預(yù)設(shè)熱詞庫(kù)中確定得到;
26、更新模塊,用于根據(jù)所述預(yù)設(shè)熱詞庫(kù)中所述目標(biāo)熱詞的熱詞分值,對(duì)所述保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值;
27、第二確定模塊,用于根據(jù)所述更新后的路徑分值,從所述保留路徑中確定所述語音幀的與所述目標(biāo)解碼路徑對(duì)應(yīng)的目標(biāo)路徑。
28、在其中一個(gè)實(shí)施例中,所述裝置包括熱詞匹配路徑的確定模塊,所述熱詞匹配路徑的確定模塊,包括:
29、第一確定子模塊,用于根據(jù)所述目標(biāo)熱詞,從所述多個(gè)候選路徑中確定與所述目標(biāo)熱詞相匹配的初始匹配路徑;
30、第一更新子模塊,用于根據(jù)所述目標(biāo)熱詞的熱詞分值,對(duì)所述初始匹配路徑的路徑分值進(jìn)行更新,得到更新后的初始匹配路徑的路徑分值;
31、第二確定子模塊,用于確定所述更新后的初始匹配路徑的路徑分值排名前m的初始匹配路徑作為熱詞匹配路徑,所述m為正整數(shù)。
32、在其中一個(gè)實(shí)施例中,所述目標(biāo)熱詞包括潛在熱詞和同音熱詞中的至少一種,所述裝置包括熱詞匹配路徑的確定模塊,所述熱詞匹配路徑的確定模塊包括:
33、第三確定子模塊,用于從所述多個(gè)候選路徑中,確定包含所述潛在熱詞的候選路徑為潛在匹配路徑;
34、第四確定子模塊,用于從所述多個(gè)候選路徑中,確定與所述同音熱詞相匹配的候選路徑為同音匹配路徑;
35、第五確定子模塊,用于根據(jù)所述潛在匹配路徑和所述同音匹配路徑中的至少一種,得到熱詞匹配路徑。
36、在其中一個(gè)實(shí)施例中,所述裝置還包括同音熱詞的確定模塊,所述同音熱詞的確定模塊包括:
37、第六確定子模塊,用于針對(duì)所述目標(biāo)解碼路徑,從所述語音幀的除所述目標(biāo)解碼路徑以外的其他解碼路徑中,確定倒數(shù)第二個(gè)詞單元與所述目標(biāo)解碼路徑的最后一個(gè)詞單元相同的路徑,作為同音路徑;
38、第七確定子模塊,用于從所述預(yù)設(shè)熱詞庫(kù)中,確定與所述同音路徑的最后一個(gè)詞單元同音的目標(biāo)詞單元,并將所述目標(biāo)詞單元對(duì)應(yīng)的熱詞作為同音熱詞。
39、在其中一個(gè)實(shí)施例中,所述裝置還包括潛在熱詞的確定模塊,所述潛在熱詞的確定模塊包括:
40、第八確定子模塊,用于根據(jù)所述目標(biāo)解碼路徑的最后一個(gè)詞單元,從所述預(yù)設(shè)熱詞庫(kù)中確定與所述最后一個(gè)詞單元相匹配的熱詞,作為潛在熱詞。
41、在其中一個(gè)實(shí)施例中,所述第八確定子模塊,包括:
42、第一確定單元,用于從所述預(yù)設(shè)熱詞庫(kù)中確定與所述最后一個(gè)詞單元相匹配的熱詞為候選熱詞;
43、第二確定單元,用于從所述候選熱詞中,確定熱詞分值大于預(yù)設(shè)分值的熱詞為潛在熱詞。
44、第三方面,本技術(shù)還提供了一種電子設(shè)備。所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本公開實(shí)施例中任一項(xiàng)所述的方法的步驟。
45、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開實(shí)施例中任一項(xiàng)所述的方法的步驟。
46、第五方面,本技術(shù)還提供了一種計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開實(shí)施例中任一項(xiàng)所述的方法的步驟。
47、上述語音識(shí)別方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,用于對(duì)語音信號(hào)的語音幀進(jìn)行識(shí)別,針對(duì)語音幀的目標(biāo)解碼路徑,對(duì)語音幀進(jìn)行解碼,得到多個(gè)候選路徑及對(duì)應(yīng)的路徑分值,并根據(jù)路徑分值和目標(biāo)熱詞確定保留路徑,保留路徑包括路徑分值排名前n的分值匹配路徑和與目標(biāo)熱詞相匹配的熱詞匹配路徑,根據(jù)預(yù)設(shè)熱詞庫(kù)中目標(biāo)熱詞的熱詞分值,對(duì)保留路徑的路徑分值進(jìn)行更新,得到更新后的路徑分值,并根據(jù)更新后的路徑分值,從保留路徑中確定語音幀的與所述目標(biāo)解碼路徑對(duì)應(yīng)的目標(biāo)路徑。由于本方案中在從候選路徑中選擇目標(biāo)路徑時(shí),先根據(jù)路徑分值和目標(biāo)熱詞確定保留路徑,能夠兼顧路徑分值和熱詞對(duì)識(shí)別效果的影響,在路徑分值更新前保留分值匹配路徑和熱詞匹配路徑,降低在保留路徑篩選過程中熱詞分值較高的熱詞匹配路徑被遺漏的概率;再根據(jù)目標(biāo)熱詞的熱詞分值對(duì)路徑分值進(jìn)行更新,根據(jù)更新后的路徑分值從保留路徑中確定目標(biāo)路徑,能夠通過熱詞分值增強(qiáng)熱詞匹配路徑,提高目標(biāo)路徑中熱詞匹配路徑的命中概率,優(yōu)化了熱詞的識(shí)別性能,有效增強(qiáng)語音識(shí)別中的場(chǎng)景定制化能力,保證了每一幀語音幀的識(shí)別準(zhǔn)確率,進(jìn)而有效提高語音信號(hào)的識(shí)別準(zhǔn)確率;且在語音信號(hào)的識(shí)別過程中,對(duì)從候選路徑中確定目標(biāo)路徑的選擇方式進(jìn)行優(yōu)化調(diào)整,無需調(diào)整每一個(gè)語音幀的目標(biāo)路徑組成的識(shí)別結(jié)果搜索空間,平衡了熱詞識(shí)別性能和解碼效率,不額外增加解碼耗時(shí)保證解碼過程效率的同時(shí),有效提高了熱詞識(shí)別效果,進(jìn)而提高了語音信號(hào)識(shí)別結(jié)果的準(zhǔn)確率,有效增強(qiáng)語音識(shí)別中的場(chǎng)景定制化能力。