卷積在神經網絡中的作用范文
時間:2024-03-29 11:12:39
導語:如何才能寫好一篇卷積在神經網絡中的作用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:深度學習;目標視覺檢測;應用分析
隨著計算機的普及,目標視覺檢測也在計算機的發展中逐漸被應用。人們的生活越來越離不開計算機和電子設備,數據信息充斥著當代人的生活。隨著人們生活質量的提高對電子設備要求越來越高,越來越精準。目標檢測技術在人們的生活中,也發揮著很大的作用和價值。智能監控、機器人、自動定位、人臉聚焦、航拍、衛星等方面都應用了目標視覺檢測的技術。在高層視覺處理和任務分析中,目標視覺檢測技術也是基礎。無論是分析行為、事件還是場景語義的理解都需要運用到目標視覺檢測技術。因此目標視覺檢測在各個方面都發揮著重大的作用,本文就深度學習在目標視覺檢測中的應用和展望進行探討。
一、深度學習在目標視覺檢測中的進展
深度學習最早出自于人工神經網絡。深度學習把多層感知器作為學習結構,組合底層特征進行高層的學習。作為機器研究的一個新領域,模仿人腦組建學習的神經網絡。深度學習可以逐步自主的學習。而目標視覺檢測在近幾年出現了很多的問題,例如,類內和類間存在差異。即使通過訓練也很難包含所有類內的特征描述模型。而且類內和類間的差異大小不一樣這就給目標視覺檢測的發展帶來很大的阻礙。在圖像采集的過程中,由于種種因素會導致目標物體被遮擋,因此,視覺算法的魯棒性也需要進行整改。語義理解也存在著差異,對仿生和類腦角算法有一定的難度。而計算機的復雜和自適應性也比較高,需要設計高效的目標視覺檢測技術,為了確保目標視覺檢測的精準程度,還需要設計出自動更新視覺模型來提高模型在不同環境下的適應能力。隨著深度學習的發展,深度學習對于目標視覺檢測有很大的用處,可以極大地解決目前目標視覺檢測技術出現的問題。因此很多專家開始把深度學習融入到目標視覺檢測的發展當中,并進行研究。
二、目標視覺檢測的流程和順序
估計特定類型目標是目標視覺檢測的關鍵,目標視覺檢測的流程大致分為三步,區域建議、特征表示和區域分類。根據圖一,第一步區域建議。目標檢測需要獲得目標的準確位置和大小尺度,在輸入圖像的時候找到指定的類型目標是其中一種區域建議。還可以通過滑動窗進行區域建議,投票、圖像分割的區域建議也可以使用?;瑒哟靶枰谳斎雸D像的時候在子窗口執行目標來檢測目標所處的位置。投票機制則通過部件的模型找到輸入圖像和模型在局部區域內的最佳位置,并最大限度地讓所有局部區域匹配,利用拓撲的方式來得到最佳匹配。但是投票機制的區域建議計算代價會比較高。圖像分割的區域建議則建立在圖像分割的基礎上面,是一個消耗時間和精力的過程,而且很復雜很難把整個目標分割出來。而深度學習在圖像分類和目標檢測中都有一定得進展,通過深度學習的表征和建模能力可以生成抽象的表示[1]。
圖一,目標視覺檢測流程
三、深度學習在目標視覺檢測當中的作用
深度學習融入目標視覺檢測推動了目標視覺檢測的發展和研究。目標視覺檢測和圖像分類有一定的區分,目標視覺檢測主要關注圖像的局部信息,圖像分類在意圖像的全局表達。但是它們也有一定的互通性。首先從區域建議的方法來探討深度學習在目標視覺檢測中的作用。深度學習在目標視覺檢測中的基本參考方法是Girshick等人提出來的R-CNN方法。R-CNN和CNN相聯系,檢測的精準度達到了53.3%,對比傳統的方法有很大的飛躍。如圖二所示,輸入相關圖像的同時進行選擇性的搜索提取候選區,通過CNN網絡來提取固定長度的向量,圖像經過兩個全連接層和五個積卷層得出一個4096的向量,最后把提取到的向量數據在向量機中進行分配。但是這樣的方式還是存在很多的不足和弊端,因此Girshick對R-CNN和SPP-net進行了進一步的改進,圖像進行一次卷積在特征圖上進行映射送入Rol池化層,最后通過全連接層輸出。同一幅畫像的Rol共同相同計算機的內存效率更加高。通過softmax 的分類不僅省去特征的存儲還提高了利用率。近年來,kin等人又提出了PVANET網絡,數據的檢測精準度達到了82.5%,在確保精準度的情況下還能使通道數減少,可以增加對細節的提取。
圖二,R-NN的計算流程
早期還提出過無區域建議的方式,例如,DPM模型可以在目標的內部進行結構化的建模,不僅提高了檢測的性能,也能很好地適應非剛體的形變。但是DPM模型的構建條件復雜,模型訓練也比較繁瑣,所以sermanet又進行研究提出了Overfeat的模型,避免圖像塊的操作出錯,也能提高算法的效率。但是關于尺寸的識別還是存在著一定的問題,因此無區域建議還在不斷的探索過程中。redmom提出了關于改進yolo模型的方法,成為yolov2,可以確保精準度和定位,提升了檢測率。專家們還研制出一種新的訓練算法,用數據來找到物體的準確定位,yolo模型通過這樣的方式課題檢測超過九千種物體[2]。
四、結束語
未來深度學習在目標視覺檢測中都會得到繼續的應用和進展,深度學習在目標視覺測試中依舊是主流的方向。深度學習通過它的優勢可以獲得高層次抽象的表達。但是深度學習的理論還不是特別的完善,模型的可解釋性還不夠強。因此深度學習模式還需要得到進一步的改進和完善,對模型的結構,訓練等多加指導。大規模多樣性數據集也比較匱乏,現在很多的目標視覺檢測都在imagenet上進行訓練,但是目標檢測技術還需要進一步的完善和提高,達到最好的效果。深度學習在目標視覺檢測技術中的應用還不夠完善,任重而道遠,還需要進一步的完善理論提高精準度。在未來,深度學習和目標視覺檢測一定能夠得到極大的進展。
參考文獻