本申請涉及風(fēng)險預(yù)測和大模型預(yù)測,尤其是一種基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng)和方法。
背景技術(shù):
1、自然流產(chǎn)是指自然狀態(tài)下(非人為目的造成),發(fā)生在孕28周前且胎兒體重不足1000g的妊娠終止結(jié)局。研究表明,自然流產(chǎn)在所有臨床妊娠中占比約為10%~20%。自然流產(chǎn)不僅會給育齡女性身體造成嚴(yán)重傷害,還會增加其再次妊娠的心理負(fù)擔(dān)和再次流產(chǎn)的風(fēng)險,影響家庭和諧,增加經(jīng)濟和社會負(fù)擔(dān)。在生理方面的影響主要包括陰道流血、胚胎殘留等,嚴(yán)重時可能會危及患者生命;在心理方面的影響主要是增加患者心理疾患的風(fēng)險,包括抑郁、焦慮、壓力,甚至產(chǎn)生酗酒、自殺等行為。因此,積極探索自然流產(chǎn)的危險因素,從而采取針對性防治措施,對預(yù)防孕期女性發(fā)生自然流產(chǎn)具有重大意義。
2、國內(nèi)外研究表明自然流產(chǎn)與許多日常行為因素有關(guān),包括飲酒、飲食和睡眠時間等因素。目前,對于自然流產(chǎn)的預(yù)測主要依賴于醫(yī)生的經(jīng)驗和有限的醫(yī)學(xué)檢查。大多數(shù)育齡夫婦在尋求生殖健康服務(wù)時只能求助于醫(yī)院或社區(qū)醫(yī)療服務(wù)站,然而由于資源有限且專家很難做到24小時不間斷服務(wù),無法滿足育齡夫婦的需要。因此,隨著大模型預(yù)測算法的推廣,業(yè)內(nèi)開始探索適用于普通育齡夫婦自我測評且無需依賴專業(yè)醫(yī)學(xué)檢查的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng)。
3、目前在自然流產(chǎn)風(fēng)險預(yù)測上,主要從優(yōu)化指標(biāo)和模型選擇上進行研究。當(dāng)前在自然流產(chǎn)因素上,大多數(shù)專家更加關(guān)注女性生理狀況和作息,模型多采用現(xiàn)有算法模型,但是在預(yù)測精度上并不理想。
技術(shù)實現(xiàn)思路
1、為了克服上述現(xiàn)有技術(shù)中缺乏高精度的自然流產(chǎn)風(fēng)險預(yù)測技術(shù)的缺陷,本申請?zhí)岢隽艘环N基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),可結(jié)合已知行為信息高精度預(yù)測自然流產(chǎn)風(fēng)險。
2、本發(fā)明提出的一種基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),包括:輸入裝置,用于輸入影響參數(shù),影響參數(shù)包括:男方/女方年齡、男方/女方久坐時間、男方/女方社會時差和男方/女方夜間睡眠時間;社會時差指的是工作日睡眠與休息日睡眠的時差;
3、預(yù)測裝置,包括兩部分;第一部分使用多種模型分別基于輸入裝置輸入的影響參數(shù)預(yù)測自然流產(chǎn)風(fēng)險指標(biāo);第二部分結(jié)合第一部分各模型輸出的自然流產(chǎn)風(fēng)險指標(biāo)得到自然流產(chǎn)風(fēng)險最終預(yù)測值;
4、輸出裝置,用于獲取自然流產(chǎn)風(fēng)險最終預(yù)測值并輸出。
5、優(yōu)選的,預(yù)測裝置的第一部分采用的模型為分類模型或者概率預(yù)測模型。
6、優(yōu)選的,影響因素還包括女方bmi、女方腰圍和女方臀圍。
7、本發(fā)明提出的一種基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,首先構(gòu)建并訓(xùn)練由兩部分構(gòu)成的自然流產(chǎn)預(yù)測模型,模型第一部分包含多個子模型,子模型基于自然流產(chǎn)預(yù)測模型輸入的影響因素生成自然流產(chǎn)風(fēng)險預(yù)測值;模型第二部分結(jié)合各子模型輸出的自然流產(chǎn)風(fēng)險預(yù)測值得到自然流產(chǎn)風(fēng)險最終預(yù)測值;影響參數(shù)包括:男方/女方年齡、男方/女方久坐時間、男方/女方社會時差和男方/女方夜間睡眠時間;社會時差指的是工作日睡眠與休息日睡眠的時差;
8、然后收集男女雙方信息,提取影響因素并輸入訓(xùn)練完成的自然流產(chǎn)預(yù)測模型,得到自然流產(chǎn)風(fēng)險最終預(yù)測值。
9、優(yōu)選的,自然流產(chǎn)預(yù)測模型采用機器學(xué)習(xí)方法進行訓(xùn)練,數(shù)據(jù)集的獲取方式為:首先結(jié)合育齡夫婦跟蹤信息構(gòu)建數(shù)據(jù)集樣本{影響因素,自然流產(chǎn)標(biāo)簽};然后進行數(shù)據(jù)集更新,數(shù)據(jù)集更新方式為:結(jié)合已知流產(chǎn)樣本衍生新的流產(chǎn)樣本并補入數(shù)據(jù)集;新的流產(chǎn)樣本的生成公式為:
10、
11、其中,xi為已有的流產(chǎn)樣本;為xi的近鄰樣本,距離相等情況下,近鄰樣本優(yōu)選流產(chǎn)樣本;xnew為新的流產(chǎn)樣本;rand(0,1)表示在0-1之間取隨機數(shù)。
12、優(yōu)選的,數(shù)據(jù)集更新方式還包括刪減未流產(chǎn)樣本;刪減方式為:抽取部分未流產(chǎn)樣本計算對應(yīng)的冗余樣本并刪除;冗余樣本為與抽取樣本距離最遠(yuǎn)的樣本,且距離相等的情況下,冗余樣本優(yōu)選未流產(chǎn)樣本。
13、優(yōu)選的,子模型設(shè)有至少四個,子模型互不相同。
14、優(yōu)選的,子模型采用:隨機森林模型、樸素貝葉斯模型、極度梯度提升機和自適應(yīng)提升機。
15、優(yōu)選的,自然流產(chǎn)預(yù)測模型第二部分采用極度梯度提升機。
16、本發(fā)明提出的一種存儲介質(zhì),存儲有計算機程序,所述計算機程序被執(zhí)行時用于實現(xiàn)所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法。
17、本申請的優(yōu)點在于:
18、(1)本申請?zhí)岢龅幕诩蓪W(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),結(jié)合男女雙方的信息通過大模型進行自然流產(chǎn)風(fēng)險的預(yù)測。本申請給出的影響因素從生理、行為習(xí)慣、睡眠等多方面進行健康評估,通過較少的指標(biāo)高度概括使用者情況,結(jié)合大數(shù)據(jù)訓(xùn)練,大大提高了自然流產(chǎn)風(fēng)險預(yù)測精確性和高效性。
19、(2)通過本申請使用者只需要簡單地輸入相關(guān)影響參數(shù),即可以快速、便捷地獲得預(yù)測結(jié)果。這一方面便于使用者進行簡單的自我測評;另一方面使用者在預(yù)測結(jié)果不利時,可以去醫(yī)院或咨詢專家進行進一步的診斷。
20、(3)本申請給出的影響因素既考慮了男女雙方因素,也考慮了女性特有關(guān)鍵因素,例如女方bmi、女方腰圍、女方臀圍等,從而從醫(yī)學(xué)層面上提高了關(guān)鍵因素的提取效率,為最終預(yù)測結(jié)果地給出提供了關(guān)鍵依據(jù)。
21、(4)本申請采用兩段式的模型結(jié)構(gòu),第一部分通過不同子模型關(guān)注不同因素以給出預(yù)測結(jié)果;第二部分結(jié)合第一部分的預(yù)測值進行綜合判斷,從而實現(xiàn)了對影響因素特征的全面關(guān)注,實現(xiàn)了無偏向的概率預(yù)測,從算法上提高了預(yù)測結(jié)果的精度。
22、(5)本申請在模型訓(xùn)練過程中,通過數(shù)據(jù)集更新提高了數(shù)據(jù)平衡性,從而進一步提高了模型訓(xùn)練的精度。
1.一種基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),其特征在于,包括:輸入裝置,用于輸入影響參數(shù),影響參數(shù)包括:男方/女方年齡、男方/女方久坐時間、男方/女方社會時差和男方/女方夜間睡眠時間;社會時差指的是工作日睡眠與休息日睡眠的時差;
2.如權(quán)利要求1所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),其特征在于,預(yù)測裝置的第一部分采用的模型為分類模型或者概率預(yù)測模型。
3.如權(quán)利要求1所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測系統(tǒng),其特征在于,影響因素還包括女方bmi、女方腰圍和女方臀圍。
4.一種基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,首先構(gòu)建并訓(xùn)練由兩部分構(gòu)成的自然流產(chǎn)預(yù)測模型,模型第一部分包含多個子模型,子模型基于自然流產(chǎn)預(yù)測模型輸入的影響因素生成自然流產(chǎn)風(fēng)險預(yù)測值;模型第二部分結(jié)合各子模型輸出的自然流產(chǎn)風(fēng)險預(yù)測值得到自然流產(chǎn)風(fēng)險最終預(yù)測值;影響參數(shù)包括:男方/女方年齡、男方/女方久坐時間、男方/女方社會時差和男方/女方夜間睡眠時間;社會時差指的是工作日睡眠與休息日睡眠的時差;
5.如權(quán)利要求4所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,自然流產(chǎn)預(yù)測模型采用機器學(xué)習(xí)方法進行訓(xùn)練,數(shù)據(jù)集的獲取方式為:首先結(jié)合育齡夫婦跟蹤信息構(gòu)建數(shù)據(jù)集樣本{影響因素,自然流產(chǎn)標(biāo)簽};然后進行數(shù)據(jù)集更新,數(shù)據(jù)集更新方式為:結(jié)合已知流產(chǎn)樣本衍生新的流產(chǎn)樣本并補入數(shù)據(jù)集;新的流產(chǎn)樣本的生成公式為:
6.如權(quán)利要求4所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,數(shù)據(jù)集更新方式還包括刪減未流產(chǎn)樣本;刪減方式為:抽取部分未流產(chǎn)樣本計算對應(yīng)的冗余樣本并刪除;冗余樣本為與抽取樣本距離最遠(yuǎn)的樣本,且距離相等的情況下,冗余樣本優(yōu)選未流產(chǎn)樣本。
7.如權(quán)利要求4所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,子模型設(shè)有至少四個,子模型互不相同。
8.如權(quán)利要求6所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,子模型采用:隨機森林模型、樸素貝葉斯模型、極度梯度提升機和自適應(yīng)提升機。
9.如權(quán)利要求7所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法,其特征在于,自然流產(chǎn)預(yù)測模型第二部分采用極度梯度提升機。
10.一種存儲介質(zhì),其特征在于,存儲有計算機程序,所述計算機程序被執(zhí)行時用于實現(xiàn)如權(quán)利要求4-8任一項所述的基于集成學(xué)習(xí)和可防控行為的自然流產(chǎn)風(fēng)險預(yù)測方法。