本技術(shù)涉及數(shù)據(jù)安全領(lǐng)域,特別涉及一種風(fēng)險(xiǎn)檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著信息技術(shù)的迅速發(fā)展,如何解決網(wǎng)絡(luò)安全問題成為各行業(yè)面臨的重大挑戰(zhàn)。由于網(wǎng)絡(luò)攻擊的手段日益復(fù)雜多樣,傳統(tǒng)的安全防護(hù)措施往往難以應(yīng)對(duì)。攻擊者利用復(fù)雜的技術(shù)手段,如結(jié)構(gòu)化查詢語言(structured?query?language,sql)注入、跨站腳本(cross-site?scripting,xss)、惡意軟件等,對(duì)企業(yè)和個(gè)人的數(shù)據(jù)安全構(gòu)成了嚴(yán)重威脅。因此,迫切需要一種高效的風(fēng)險(xiǎn)檢測(cè)與響應(yīng)機(jī)制,以保障信息系統(tǒng)的安全性。
2、傳統(tǒng)的風(fēng)險(xiǎn)檢測(cè)研判方法主要依賴規(guī)則庫(kù)、特征匹配和歷史行為分析。這些方法通過事先定義的黑白名單規(guī)則和特定的攻擊特征對(duì)網(wǎng)絡(luò)流量和日志進(jìn)行判別。然而,隨著攻擊方式的日益復(fù)雜化,這些方法逐漸暴露出以下劣勢(shì):
3、(1)規(guī)則庫(kù)更新滯后,難以應(yīng)對(duì)新型威脅;
4、(2)特征匹配僅限于已知的攻擊行為,對(duì)未知攻擊的檢測(cè)能力不足;
5、(3)傳統(tǒng)方法的響應(yīng)速度較慢,難以在攻擊發(fā)生時(shí)及時(shí)發(fā)出預(yù)警和處理建議,導(dǎo)致網(wǎng)絡(luò)安全風(fēng)險(xiǎn)的擴(kuò)展和深化。
6、綜上,如何提高風(fēng)險(xiǎn)檢測(cè)的準(zhǔn)確率是亟待解決的。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種風(fēng)險(xiǎn)檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以提高風(fēng)險(xiǎn)檢測(cè)的準(zhǔn)確率。
2、第一方面,本技術(shù)實(shí)施例提供了一種風(fēng)險(xiǎn)檢測(cè)方法,包括:
3、收集網(wǎng)絡(luò)系統(tǒng)的風(fēng)險(xiǎn)日志數(shù)據(jù);
4、基于預(yù)設(shè)的黑名單規(guī)則對(duì)所述風(fēng)險(xiǎn)日志數(shù)據(jù)進(jìn)行初步檢測(cè),獲取風(fēng)險(xiǎn)信息;若所述風(fēng)險(xiǎn)信息表征所述風(fēng)險(xiǎn)日志數(shù)據(jù)無風(fēng)險(xiǎn),則通過自然語言處理模型提取所述風(fēng)險(xiǎn)日志數(shù)據(jù)的上下文嵌入特征;所述上下文嵌入特征用于表示所述風(fēng)險(xiǎn)日志數(shù)據(jù)中的詞元在上下文中的語義信息;
5、通過卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)所述上下文嵌入特征進(jìn)行局部特征提取,獲取所述風(fēng)險(xiǎn)日志數(shù)據(jù)所屬的風(fēng)險(xiǎn)類別;
6、通過模型解釋技術(shù),對(duì)所述風(fēng)險(xiǎn)類別進(jìn)行解釋后,確定所述風(fēng)險(xiǎn)日志數(shù)據(jù)中對(duì)所述風(fēng)險(xiǎn)類別產(chǎn)生影響的關(guān)鍵詞元;
7、將所述風(fēng)險(xiǎn)日志數(shù)據(jù)、所述風(fēng)險(xiǎn)信息、所述風(fēng)險(xiǎn)類別和所述關(guān)鍵詞元輸入已訓(xùn)練的生成式預(yù)訓(xùn)練模型,生成風(fēng)險(xiǎn)分析報(bào)告。
8、第二方面,本技術(shù)實(shí)施例提供了一種風(fēng)險(xiǎn)檢測(cè)裝置,包括:
9、收集單元,用于收集網(wǎng)絡(luò)系統(tǒng)的風(fēng)險(xiǎn)日志數(shù)據(jù);
10、風(fēng)險(xiǎn)信息單元,用于基于預(yù)設(shè)的黑名單規(guī)則對(duì)所述風(fēng)險(xiǎn)日志數(shù)據(jù)進(jìn)行初步檢測(cè),獲取風(fēng)險(xiǎn)信息;若所述風(fēng)險(xiǎn)信息表征所述風(fēng)險(xiǎn)日志數(shù)據(jù)無風(fēng)險(xiǎn),則通過自然語言處理模型提取所述風(fēng)險(xiǎn)日志數(shù)據(jù)的上下文嵌入特征;所述上下文嵌入特征用于表示所述風(fēng)險(xiǎn)日志數(shù)據(jù)中的詞元在上下文中的語義信息;
11、風(fēng)險(xiǎn)類別單元,用于通過卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)所述上下文嵌入特征進(jìn)行局部特征提取,獲取所述風(fēng)險(xiǎn)日志數(shù)據(jù)所屬的風(fēng)險(xiǎn)類別;
12、關(guān)鍵詞元單元,用于通過模型解釋技術(shù),對(duì)所述風(fēng)險(xiǎn)類別進(jìn)行解釋后,確定所述風(fēng)險(xiǎn)日志數(shù)據(jù)中對(duì)所述風(fēng)險(xiǎn)類別產(chǎn)生影響的關(guān)鍵詞元;
13、生成單元,用于將所述風(fēng)險(xiǎn)日志數(shù)據(jù)、所述風(fēng)險(xiǎn)信息、所述風(fēng)險(xiǎn)類別和所述關(guān)鍵詞元輸入已訓(xùn)練的生成式預(yù)訓(xùn)練模型,生成風(fēng)險(xiǎn)分析報(bào)告。
14、在一些實(shí)施例中,所述自然語言處理模型為bert模型,所述風(fēng)險(xiǎn)信息單元具體用于:
15、通過所述bert模型的分詞器對(duì)所述風(fēng)險(xiǎn)日志數(shù)據(jù)進(jìn)行分詞,并將得到的各個(gè)詞元映射為索引值,所述詞元與所述索引值一一對(duì)應(yīng);
16、通過所述bert模型的嵌入層將所述索引值映射為詞向量;
17、通過所述bert模型的編碼層,基于所述詞向量構(gòu)建上下文表示,獲取上下文嵌入特征。
18、在一些實(shí)施例中,所述卷積神經(jīng)網(wǎng)絡(luò)模型為cnn模型;所述風(fēng)險(xiǎn)類別單元具體用于:
19、通過所述cnn模型的卷積層對(duì)所述上下文嵌入特征進(jìn)行卷積操作,獲取局部特征;
20、通過所述cnn模型的池化層,對(duì)所述局部特征進(jìn)行降維;
21、通過所述cnn模型的全連接層,將降維后的所述局部特征映射到分類標(biāo)簽空間,獲取所述風(fēng)險(xiǎn)類別。
22、在一些實(shí)施例中,所述關(guān)鍵詞元單元具體用于:
23、基于所述風(fēng)險(xiǎn)日志數(shù)據(jù)獲取至少一個(gè)擾動(dòng)樣本,所述風(fēng)險(xiǎn)日志數(shù)據(jù)包含多個(gè)詞元;所述擾動(dòng)樣本為去除所述風(fēng)險(xiǎn)日志數(shù)據(jù)中的至少一個(gè)詞元得到的;
24、將每個(gè)所述擾動(dòng)樣本依次輸入所述bert模型和所述cnn模型,獲取樣本風(fēng)險(xiǎn)類別;
25、將所述樣本風(fēng)險(xiǎn)類別作為目標(biāo)變量,通過加權(quán)的線性回歸模型擬合所述擾動(dòng)樣本與所述風(fēng)險(xiǎn)類別之間的關(guān)系,獲取所述風(fēng)險(xiǎn)日志數(shù)據(jù)中每個(gè)詞元對(duì)所述風(fēng)險(xiǎn)類別的貢獻(xiàn)系數(shù);
26、根據(jù)各個(gè)所述貢獻(xiàn)系數(shù),從多個(gè)所述詞元中確定關(guān)鍵詞元。
27、在一些實(shí)施例中,所述關(guān)鍵詞元單元具體用于:
28、對(duì)于每個(gè)所述擾動(dòng)樣本,基于所述擾動(dòng)樣本與所述風(fēng)險(xiǎn)日志數(shù)據(jù)之間的距離,確定所述擾動(dòng)樣本的權(quán)重,所述權(quán)重與所述距離呈負(fù)相關(guān);
29、將每個(gè)所述樣本風(fēng)險(xiǎn)類別分別與所述風(fēng)險(xiǎn)類別進(jìn)行比較,評(píng)估每個(gè)所述擾動(dòng)樣本對(duì)所述風(fēng)險(xiǎn)類別的影響;
30、在通過所述加權(quán)的線性回歸模型進(jìn)行擬合時(shí),通過所述權(quán)重為對(duì)應(yīng)的所述擾動(dòng)樣本加權(quán),并將所述樣本風(fēng)險(xiǎn)類別作為目標(biāo)變量,獲取每個(gè)詞元對(duì)所述風(fēng)險(xiǎn)類別的貢獻(xiàn)系數(shù)。
31、在一些實(shí)施例中,所述生成單元具體用于通過如下方式對(duì)所述生成式預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練:
32、獲取已標(biāo)記的歷史風(fēng)險(xiǎn)日志數(shù)據(jù),以及,初始化預(yù)設(shè)長(zhǎng)度的虛擬提示矩陣;
33、將所述歷史風(fēng)險(xiǎn)日志數(shù)據(jù)映射為嵌入矩陣后,與所述虛擬提示矩陣進(jìn)行拼接,生成輸入矩陣;
34、將所述輸入矩陣輸入所述生成式預(yù)訓(xùn)練模型;
35、通過調(diào)整所述輸入矩陣中虛擬提示矩陣的部分,減小所述生成式預(yù)訓(xùn)練模型的輸出與所述歷史風(fēng)險(xiǎn)日志數(shù)據(jù)的標(biāo)簽之間的差異,實(shí)現(xiàn)對(duì)所述生成式預(yù)訓(xùn)練模型的訓(xùn)練。
36、在一些實(shí)施例中,所述裝置還包括:
37、無風(fēng)險(xiǎn)單元,用于若所述風(fēng)險(xiǎn)信息表征所述風(fēng)險(xiǎn)日志數(shù)據(jù)存在風(fēng)險(xiǎn),則將所述風(fēng)險(xiǎn)日志數(shù)據(jù)和所述風(fēng)險(xiǎn)信息輸入所述生成式預(yù)訓(xùn)練模型,生成風(fēng)險(xiǎn)分析報(bào)告。
38、第三方面,本技術(shù)實(shí)施例提供一種電子設(shè)備,包括:
39、存儲(chǔ)器,用于存儲(chǔ)程序指令;
40、處理器,用于調(diào)用所述存儲(chǔ)器中存儲(chǔ)的程序指令,按照獲得的程序指令執(zhí)行上述風(fēng)險(xiǎn)檢測(cè)方法。
41、第四方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)上述風(fēng)險(xiǎn)檢測(cè)方法。
42、第五方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;當(dāng)電子設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)程序時(shí),所述處理器執(zhí)行所述計(jì)算機(jī)程序,使得所述電子設(shè)備執(zhí)行上述風(fēng)險(xiǎn)檢測(cè)方法。
43、本技術(shù)實(shí)施例提供了一種風(fēng)險(xiǎn)檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。首先,通過預(yù)設(shè)的黑名單規(guī)則初步檢測(cè)風(fēng)險(xiǎn)日志數(shù)據(jù)是否存在風(fēng)險(xiǎn)。其次,利用自然語言處理模型和卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)風(fēng)險(xiǎn)進(jìn)行進(jìn)一步的分類和分析,確定風(fēng)險(xiǎn)類別,提升了風(fēng)險(xiǎn)檢測(cè)的精度。最后,將分類結(jié)果和模型解釋技術(shù)得到的關(guān)鍵詞元輸入到已訓(xùn)練的生成式預(yù)訓(xùn)練模型中,自動(dòng)生成詳盡的風(fēng)險(xiǎn)分析報(bào)告,不僅增強(qiáng)了檢測(cè)的全面性,還提高了風(fēng)險(xiǎn)處置的自動(dòng)化和報(bào)告生成的效率。