本發(fā)明涉及擴(kuò)展查詢方法,具體為一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法。
背景技術(shù):
1、擴(kuò)展查詢是計(jì)算機(jī)科學(xué)的技術(shù),是使用在資訊檢索和自然語言處理領(lǐng)域中,擴(kuò)展查詢?yōu)榱烁纳瀑Y訊檢索召回率,而將原來查詢句增加新的關(guān)鍵信息來重新查詢,搜索引擎會(huì)將使用者輸入的查詢句先做一次檢索,根據(jù)檢索出來的文件,選取出適合的關(guān)鍵信息,加到查詢句重新檢索,借此來找出更多的相關(guān)文件,但是用戶提交查詢后,僅通過近義詞等詞匯擴(kuò)展原始查詢,而問答系統(tǒng)是信息檢索系統(tǒng)的高級形式,它能用準(zhǔn)確、簡潔的自然語言回答用戶用自然語言提出的問題,在進(jìn)行擴(kuò)展查詢系統(tǒng)會(huì)提前準(zhǔn)備好近義詞表或?qū)S性~表等,但是現(xiàn)有的擴(kuò)展查詢方法只利用了用戶原始查詢中的信息,但由于大量原始查詢本來就有信息缺失,所以這種簡單的方法無法真正擴(kuò)展出用戶的搜索意圖,影響用戶體驗(yàn),搜索的質(zhì)量和效率較低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,以解決上述背景技術(shù)中提出只利用了用戶原始查詢中的信息,但由于大量原始查詢本來就有信息缺失,無法真正擴(kuò)展出用戶的搜索意圖,影響用戶體驗(yàn),搜索的質(zhì)量和效率較低的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,包括搜索器和問答系統(tǒng),且問答系統(tǒng)包括:表層搜索器與深層搜索器;
3、表層搜索器包括關(guān)鍵字查詢;
4、深層搜索器包括:擴(kuò)展查詢、歷史查詢與因果查詢;
5、其中評分方法包括以下步驟:
6、步驟一:在搜索器的內(nèi)部輸入需要查詢的文字信息,此時(shí)搜索器將信息傳輸給問答系統(tǒng);
7、步驟二:問答系統(tǒng)將信息對文字中的關(guān)鍵信息進(jìn)行提取,將文字信息的關(guān)鍵信息分別傳輸至表層搜索器與深層搜索器;
8、步驟三:表層搜索器將信息傳遞至關(guān)鍵字查詢,通過關(guān)鍵字查詢對語句中的關(guān)鍵詞進(jìn)行查詢,最后將查詢出的信息進(jìn)行整合,形成文檔a;
9、步驟四:深層搜索器將信息傳輸至擴(kuò)展查詢,擴(kuò)展查詢對關(guān)鍵信息類似的擴(kuò)展詞進(jìn)行搜索;
10、步驟五:深層搜索器將信息傳遞至歷史查詢,可以對搜索過的數(shù)據(jù)庫內(nèi)部的信息進(jìn)行搜索;
11、步驟六:深層搜索器將信息傳遞至因果查詢,對與關(guān)鍵詞相關(guān)因果信息進(jìn)行搜尋;
12、步驟七:將擴(kuò)展查詢、歷史查詢與因果查詢搜尋出的信息進(jìn)行整合,形成文檔b;
13、步驟八:將文檔a與文檔b內(nèi)部的內(nèi)容進(jìn)行整合,形成全新的文檔c;
14、步驟九:搜索器將查詢的文字信息傳輸至文檔c,對文檔c的內(nèi)部進(jìn)行二次檢索,最后將查詢結(jié)果導(dǎo)出。
15、優(yōu)選的,所述問答系統(tǒng)將信息同步分別傳輸至表層搜索器與深層搜索器,表層搜索器將信息信息傳輸至關(guān)鍵字查詢。
16、采用上述技術(shù)方案,表層搜索器可以信息中的關(guān)鍵信息進(jìn)行搜索,深層搜索器對信息的關(guān)鍵信息進(jìn)行擴(kuò)展搜索。
17、優(yōu)選的,所述深層搜索器將信息分別同步傳輸至擴(kuò)展查詢、歷史查詢與因果查詢,且步驟四、步驟五與步驟六同步進(jìn)行。
18、采用上述技術(shù)方案,深層搜索器從不同的方向?qū)﹃P(guān)鍵信息的信息進(jìn)行多角度查詢,提高搜索準(zhǔn)確度,增加查詢的效率。
19、優(yōu)選的,所述步驟四與步驟三為同步進(jìn)行,所述表層搜索器與深層搜索器采用統(tǒng)一數(shù)據(jù)庫,且歷史查詢采用歷史搜索數(shù)據(jù)庫。
20、采用上述技術(shù)方案,表層搜索器與深層搜索器同時(shí)對數(shù)據(jù)庫內(nèi)部的內(nèi)容進(jìn)行搜索。
21、優(yōu)選的,所述表層搜索器與深層搜索器均采用textrank算法,可以對數(shù)據(jù)庫文件內(nèi)部的信息進(jìn)行檢索。
22、采用上述技術(shù)方案,textrank可以提取文件內(nèi)部的關(guān)鍵信息,?對數(shù)據(jù)庫內(nèi)部的關(guān)鍵信息穩(wěn)定進(jìn)行提取。
23、優(yōu)選的,所述搜索器采用textrank對文檔c內(nèi)部的信息進(jìn)行檢索,將檢索后的信息導(dǎo)出。
24、采用上述技術(shù)方案,搜索器采用textrank對文檔c進(jìn)行搜索,實(shí)現(xiàn)二次搜索,增加信息搜索的準(zhǔn)確度。
25、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:該一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法:
26、1.設(shè)置了因果查詢,對信息中的關(guān)鍵信息因果關(guān)系進(jìn)行查詢,提高查詢的準(zhǔn)確度,同時(shí)更加精準(zhǔn)的提高文檔與關(guān)鍵信息之間的交互性,提高查詢的效果,同時(shí)設(shè)置了二次檢索,對文檔c內(nèi)部的信息再次進(jìn)行查詢,提高信息查詢的準(zhǔn)確度,查詢擴(kuò)展任務(wù),提高用戶使用的體驗(yàn);
27、2.設(shè)置了深層搜索器與表層搜索器,可以分開對信息進(jìn)行不同方向的檢索,增加對信息檢索的方向,同時(shí)通過歷史查詢對用戶之前使用的數(shù)據(jù)庫內(nèi)部的信息進(jìn)行提取,可以更加了解用戶的搜索意圖,提高搜索的質(zhì)量與搜索的準(zhǔn)確度。
1.一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,包括搜索器和問答系統(tǒng),且問答系統(tǒng)包括:表層搜索器與深層搜索器;
2.根據(jù)權(quán)利要求1所述的一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,其特征在于:所述問答系統(tǒng)將信息同步分別傳輸至表層搜索器與深層搜索器,表層搜索器將信息信息傳輸至關(guān)鍵字查詢。
3.根據(jù)權(quán)利要求1所述的一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,其特征在于:所述深層搜索器將信息分別同步傳輸至擴(kuò)展查詢、歷史查詢與因果查詢,且步驟四、步驟五與步驟六同步進(jìn)行。
4.根據(jù)權(quán)利要求1所述的一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,其特征在于:所述步驟四與步驟三為同步進(jìn)行,所述表層搜索器與深層搜索器采用統(tǒng)一數(shù)據(jù)庫,且歷史查詢采用歷史搜索數(shù)據(jù)庫。
5.根據(jù)權(quán)利要求1所述的一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,其特征在于:所述表層搜索器與深層搜索器均采用textrank算法,可以對數(shù)據(jù)庫文件內(nèi)部的信息進(jìn)行檢索。
6.根據(jù)權(quán)利要求1所述的一種基于問答系統(tǒng)的偽相關(guān)反饋的擴(kuò)展查詢方法,其特征在于:所述搜索器采用textrank對文檔c內(nèi)部的信息進(jìn)行檢索,將檢索后的信息導(dǎo)出。