本發(fā)明涉及圖像識別,具體涉及一種基于視覺技術的多目標識別方法及系統(tǒng)。
背景技術:
1、隨著計算機視覺技術的不斷進步,基于深度學習的目標檢測技術在多個領域得到了廣泛應用,如視頻監(jiān)控、自動駕駛、智能農業(yè)等。特別是在自動化牧場管理中,準確識別和分類羊群中的每只羊具有重要意義。例如在內蒙古,有牧民使用無人機進行放牧,并將這一過程通過直播平臺分享給網(wǎng)友,這種新型的放牧方式不僅提高了效率,也吸引了網(wǎng)友的興趣;然而,在實際直播應用過程中,由于羊群中的羊通常緊挨且大小不一,容易導致目標識別不準確,可能會造成個別羊丟失,從而為牧民帶來經濟損失。而在密集放牧場景中,羊群常呈現(xiàn)以下特征:羊只個體空間分布緊密,羊只目標重疊率高;羊只因年齡、姿態(tài)差異導致尺度變化顯著;小羊目標在遠距離拍攝時像素占比低;因此在對羊群進行多目標識別時,會導致將多只羊誤識別為一只羊,進而影響到識別結果的精度和可靠性。
技術實現(xiàn)思路
1、本發(fā)明提供一種基于視覺技術的多目標識別方法及系統(tǒng),以解決現(xiàn)有的問題:由于羊只個體空間分布緊密,羊只目標重疊率高,在對羊群進行多目標識別時,會導致將多只羊誤識別為一只羊。
2、本發(fā)明的一種基于視覺技術的多目標識別方法及系統(tǒng)采用如下技術方案:
3、本發(fā)明提出了一種基于視覺技術的多目標識別方法,該方法包括以下步驟:
4、獲取牧場內羊群遙感圖像;
5、獲取牧場內羊群的遙感圖像中若干個連通域;根據(jù)連通域內部分布情況,獲取每個連通域的疑似羊群分布值;根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內的羊群緊挨程度;
6、對連通域進行多目標識別,得到連通域內若干個目標框以及對應的目標概率;根據(jù)連通域進行開運算前后的差異情況,獲取連通域內每個目標框的只羊分割不準確性;根據(jù)目標框與其他目標框之間內部的連通域的邊緣分布情況,以及只羊分割不準確性和目標概率,獲取連通域內每個目標框的誤檢程度值;根據(jù)連通域內的羊群緊挨程度和目標框的誤檢程度值,獲取連通域的綜合羊只識別準確性;基于綜合羊只識別準確性獲取牧場內羊群進行多目標識別的卷積神經網(wǎng)絡的最優(yōu)步長參數(shù);
7、基于最優(yōu)步長的卷積神經網(wǎng)絡對牧場內羊群遙感圖像進行多目標只羊的識別。
8、優(yōu)選的,所述根據(jù)連通域內部分布情況,獲取每個連通域的疑似羊群分布值的具體方法為:
9、對第個連通域進行腐蝕操作,得到第個連通域腐蝕后被劃分為多個連通域;并將第個連通域腐蝕后被劃分為多個連通域的數(shù)量,作為第個連通域內的疑似羊只數(shù);將第個連通域內的疑似羊只數(shù)的歸一化值與第個連通域的面積之間的乘積,作為第個連通域內的疑似羊群分布值。
10、優(yōu)選的,所述根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內的羊群緊挨程度的具體方法為:
11、根據(jù)連通域的形狀,獲取連通域內的羊群之間縫隙顯著度;
12、將第個連通域內的羊群之間縫隙顯著度的反比例歸一化值與第個連通域內的疑似羊群分布值的乘積,作為第個連通域內的羊群緊挨程度。
13、優(yōu)選的,所述根據(jù)連通域的形狀,獲取連通域內的羊群之間縫隙顯著度的具體方法為:
14、第個連通域的凸包面積與面積之間的差值,作為第個連通域的空白區(qū)域面積;將第個連通域的空白區(qū)域面積與凸包面積的比值,作為第個連通域內的羊群之間縫隙顯著度。
15、優(yōu)選的,所述根據(jù)連通域進行開運算前后的差異情況,獲取連通域內每個目標框的只羊分割不準確性的具體方法為:
16、利用開運算對第個連通域內第個目標框內的連通域進行腐蝕膨脹操作,得到開運算后第個目標框內的連通域;將第個目標框內的連通域的面積與開運算后第個目標框內的連通域的差值的絕對值,記為目標差值;
17、在對第個連通域內第個目標框內的連通域進行腐蝕操作,得到腐蝕后被劃分為多個連通域中,將面積最大的連通域的中心位置與第個目標框的中心位置之間的歐氏距離,記為目標距離;將目標差值與目標距離的乘積,作為第個連通域內第個目標框的只羊分割不準確性。
18、優(yōu)選的,所述根據(jù)目標框與其他目標框之間內部的連通域的邊緣分布情況,以及只羊分割不準確性和目標概率,獲取連通域內每個目標框的誤檢程度值的具體方法為:
19、對于第個連通域中任意兩個目標框,選取目標概率大的目標框作為標準目標框,另一個作為對比目標框;利用圖像金字塔技術將對比目標框進行縮放,直至與標準目標框為同等大小;
20、獲取標準目標框與對比目標框之間的最終匹配相似度;
21、獲取第個連通域內第個目標框與所有連通域內每個目標框之間的最終匹配相似度,將最終匹配相似度的最大值的反比例歸一化值與第個連通域內第個目標框的只羊分割不準確性的乘積,作為第個連通域內第個目標框的誤檢程度值。
22、優(yōu)選的,所述獲取標準目標框與對比目標框之間的最終匹配相似度的具體方法為:
23、在標準目標框內選取豎直方向上,以標準目標框內部的連通域的邊緣位置上最高的像素點為起點,順時針獲取標準目標框的鏈碼序列;在對比目標框內選取豎直方向上,以對比目標框內部的連通域的邊緣位置上最高的像素點為起點,順時針獲取對比目標框的鏈碼序列;將標準目標框的鏈碼序列與對比目標框的鏈碼序列之間的dtw值的反比例歸一化值,作為標準目標框與對比目標框之間的匹配相似度;
24、預設一個旋轉參數(shù),將對比目標框每次順時針旋轉,并在每次旋轉后獲取標準目標框與對比目標框之間的匹配相似度;在所有次旋轉對應的標準目標框與對比目標框之間的匹配相似度中,將匹配相似度的最大值作為標準目標框與對比目標框之間的最終匹配相似。
25、優(yōu)選的,所述根據(jù)連通域內的羊群緊挨程度和目標框的誤檢程度值,獲取連通域的綜合羊只識別準確性的具體方法為:
26、將第個連通域的面積與第個連通域內所有目標框內連通域的面積的累加和之間的差值絕對值,記為第一差值;將第個連通域內所有目標框的誤檢程度值的均值與第個連通域內的羊群緊挨程度的比值,記為第一比值;將第一差值與第一比值的乘積的反比例歸一化值,作為第個連通域的綜合羊只識別準確性。
27、優(yōu)選的,所述基于綜合羊只識別準確性獲取牧場內羊群進行多目標識別的卷積神經網(wǎng)絡的最優(yōu)步長參數(shù)的具體方法為:
28、對于任意一個步長參數(shù)的卷積神經網(wǎng)絡,在利用所述任意一個步長參數(shù)的卷積神經網(wǎng)絡對牧場內羊群的遙感圖像進行多目標識別時,將牧場內羊群的遙感圖像中所有連通域的綜合羊只識別準確性的均值,作為所述任意一個步長參數(shù)的卷積神經網(wǎng)絡的優(yōu)選程度;
29、預設一個初始最大步長參數(shù)和一個最小步長參數(shù),將卷積神經網(wǎng)絡的步長參數(shù)從開始逐步減小至,獲取每個步長參數(shù)的卷積神經網(wǎng)絡的優(yōu)選程度;將優(yōu)選程度最大的步長參數(shù),作為牧場內羊群進行多目標識別的卷積神經網(wǎng)絡的最優(yōu)步長參數(shù)。
30、本發(fā)明還提出了一種基于視覺技術的多目標識別系統(tǒng),包括存儲器和處理器,所述處理器執(zhí)行所述存儲器存儲的計算機程序,以實現(xiàn)上述的一種基于視覺技術的多目標識別方法的步驟。
31、本發(fā)明的技術方案的有益效果是:本發(fā)明根據(jù)連通域的形狀,以及疑似羊群分布值,獲取連通域內的羊群緊挨程度;對連通域進行多目標識別,得到連通域內若干個目標框以及對應的目標概率;根據(jù)連通域進行開運算前后的差異情況,獲取連通域內每個目標框的只羊分割不準確性;根據(jù)目標框與其他目標框之間內部的連通域的邊緣分布情況,以及只羊分割不準確性和目標概率,獲取連通域內每個目標框的誤檢程度值;根據(jù)連通域內的羊群緊挨程度和目標框的誤檢程度值,獲取連通域的綜合羊只識別準確性;基于綜合羊只識別準確性獲取牧場內羊群進行多目標識別的卷積神經網(wǎng)絡的最優(yōu)步長參數(shù);基于最優(yōu)步長的卷積神經網(wǎng)絡對牧場內羊群遙感圖像進行多目標只羊的識別;以此通過自適應步長參數(shù)策略,卷積核能夠更精細地掃描圖像,通過分析目標框內羊群的緊挨信息,模型能夠更加精準地確定目標框的位置和大小,提升檢測的準確性;且本發(fā)明能夠適應不同密度的羊群,并且在復雜背景和不同光照條件下,依然能夠保持較高的檢測精度。