卷積神經網絡實現過程范文
時間:2024-04-02 18:05:00
導語:如何才能寫好一篇卷積神經網絡實現過程,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0209-03
Research and Implementation of Image Classification Based on Convolution Neural Network
WANG Chao
(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)
Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.
Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network
S著計算機與互聯網技術的快速發展,我們已經進入了一個以圖像構建的世界。但是面臨有海量圖像信息卻找不到所需要的數據的困境,因而圖像分類技術應運而生。通過各種機器學習算法使計算機自動將各類圖像進行有效管理和分類,但是由于圖像內容包含著大量復雜且難以描述的信息,圖像特征提取和相識度匹配技術也存在一定的難題,要使得計算機能夠像人類一樣進行分類還是有很大的困難。
深度學習是近十年來人工智能領域取得的重要突破,在圖像識別中的應用取得了巨大的進步,傳統的機器學習模型屬于神經網絡模型,神經網絡有大量的參數,經常會出現過擬合問題,因而對目標檢測準確率上比較低。本文采用卷積神經網絡框架,圖像特征是從大數據中自動學習得到,而且神經網絡的結構深由很多層組成,通過重復利用中間層的計算單元來減少參數,在特征匯聚階段引入圖像中目標的顯著信信息,增強了圖像的特征表達能力。通過在圖像層次稀疏表示中引入圖像顯著信息,加強了圖像特征的語義信息,得到圖像顯著特征表示,通過實驗測試,效果比傳統的圖像分類算法預測的準確度有明顯的提升。
1 基于卷積神經網絡的圖像分類方法
1.1 人工神經網絡
人工神經網絡(Artificial Neural Network, ANN)是描述生物神經網絡運行機理和工作過程的抽象和簡化了的數學物理模型,使用路徑權值的有向圖來表示模型中的人工神經元節點和神經元之間的連接關系,之后通過硬件或軟件程序實現上述有向圖的運行[1]。目前最典型的人工神經網絡算法包括:目前最典型的人工神經網絡有BP網絡 [2]Hopfield網絡[3]Boltzmann機[4]SOFM網絡[5]以及ART網絡人工神經網絡[6],算法流程圖如圖1所示[7]。
1.2 卷積神經網絡框架的架構
Caffe是Convolutional Architecture for Fast Feature Embedding的縮寫[8],意為快速特征嵌入的卷積結構,包含最先進的深度學習算法以及一系列的參考模型,圖2表示的是卷積神經網絡結構圖。Caffe深度學習框架主要依賴CUDA,IntelMKL,OpenCV,glog軟件以及caffe文件。本文使用的各個軟件版本說明,如表1所示。
Caffe深度學習框架提供了多個經典的卷積神經網絡模型,卷積神經網絡是一種多層的監督學習神經網絡,利用隱含層的卷積層和池采樣層是實現卷積神經網絡特征提取功能,卷積神經網絡模型通過采取梯度下降法最小化損失函數對網絡中的權重參數逐層反向調節,通過頻繁的迭代訓練來提高網絡的精度。卷積神經網絡使用權值共享,這一結構類似于生物神經網絡,從而使網絡的復雜程度明顯降低,并且權值的數量也有大幅度的減少,本文使用這些模型直接進行訓練,和傳統的圖像分類算法對比,性能有很大的提升,框架系統訓練識別基本流程如圖3表示。
1.3 圖像分類特征提取
卷積神經網絡的結構層次相比傳統的淺層的神經網絡來說,要復雜得多,每兩層的神經元使用了局部連接的方式進行連接、神經元共享連接權重以及時間或空間上使用降采樣充分利用數據本身的特征,因此決定了卷積神經網絡與傳統神經網絡相比維度大幅度降低,從而降低計算時間的復雜度。卷積神經網絡主要分為兩個過程,分為卷積和采樣,分別的對上層數據進行提取抽象和對數據進行降維的作用。
本文以Caffe深度學習框架中的 CIFAR-10數據集的貓的網絡模型為例,如圖4所示,對卷積神經網絡模型進行訓練。CIFAR-10是一個標準圖像圖像訓練集,由六萬張圖像組成,共有10類(分為飛機,小汽車,鳥,貓,鹿,狗,青蛙,馬,船,卡車),每個圖片都是32×32像素的RGB彩色圖像。通過對數據進行提取和降維的方法來提取圖像數據的特征。
2 實驗分析
將貓的圖像訓練集放在train的文件夾下,并統一修改成256×256像素大小,并對貓的圖像訓練集進行標記,標簽為1,運行選擇cpu進行訓練,每進行10次迭代進行一次測試,測試間隔為10次,初始化學習率為0.001,每20次迭代顯示一次信息,最大迭代次數為200次,網絡訓練的動量為0.9,權重衰退為0.0005,5000次進行一次當前狀態的記錄,記錄顯示如下圖5所示,預測的準度在98%以上。而相比傳統的圖像分類算法BP神經網絡網絡的收斂性慢,訓練時間長的,網絡的學習和記憶具有不穩定性,因而卷e神經網絡框架在訓練時間和預測準度上具有非常大的優勢。
3 結束語
本文使用Caffe深度學習框架,以CIFAR-10數據集中貓的網絡模型為例,構建小型貓的數據集,提取貓的圖象特征信息,最后和目標貓圖像進行預測,并和傳統的圖像分類算法進行對比,預測的準確率有很大的提升。
參考文獻:
[1] 楊錚, 吳陳沭, 劉云浩. 位置計算: 無線網絡定位與可定位性[M]. 北京: 清華大學出版社, 2014.
[2] 丁士折. 人工神經網絡基礎[M]. 哈爾濱: 哈爾濱工程大學出版社, 2008.
[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.
[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.
[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.
[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.
篇2
關鍵詞:卷積神經網絡;圖像分類;空間變換;可變形卷積
DOIDOI:10.11907/rjdk.171863
中圖分類號:TP317.4
文獻標識碼:A 文章編號:1672-7800(2017)006-0198-04
0 引言
圖像分類一直是計算機視覺領域的一個基礎而重要的核心問題,具有大量的實際應用場景和案例。很多典型的計算機視覺問題(如物體檢測、圖像分割)都可以演化為圖像分類問題。圖像分類問題有很多難點需要解決,觀測角度、光照條件的變化、物體自身形變、部分遮擋、背景雜波影響、類內差異等問題都會導致被觀測物體的計算機表示(二維或三維數值數組)發生劇烈變化。一個良好的圖像分類模型應當對上述情況(以及不同情況的組合)不敏感。使用深度學習尤其是深度卷積神經網絡,用大量圖像數據進行訓練后可以處理十分復雜的分類問題。
卷積神經網絡是為識別二維形狀而專門設計的一個多層感知器,這種網絡結構對平移、縮放、傾斜等擾動具有高度不變性,并且具有強大的特征學習與抽象表達能力,可以通過網絡訓練獲得圖像特征,避免了復雜的特征提取與數據重建過程。通過網絡層的堆疊,集成了低、中、高層特征表示。AlexNet等網絡模型的出F,也推動了卷積網絡在海量圖像分類領域的蓬勃發展。
1 卷積神經網絡
卷積神經網絡是人工神經網絡的一種,其“局部感知”“權值共享”[1]等特性使之更類似于生物神經網絡,網絡模型復雜度大大降低,網絡訓練更容易,多層的網絡結構有更好的抽象表達能力,可以直接將圖像作為網絡輸入,通過網絡訓練自動學習圖像特征,從而避免了復雜的特征提取過程。
Yann LeCun等[2]設計的LeNet-5是當前廣泛使用的卷積網絡結構原型,它包含了卷積層、下采樣層(池化層)、全連接層以及輸出層,構成了現代卷積神經網絡的基本組件,后續復雜的模型都離不開這些基本組件。LeNet-5對手寫數字識別率較高,但在大數據量、復雜的物體圖片分類方面不足,過擬合也導致其泛化能力較弱。網絡訓練開銷大且受制于計算機性能。
2012年,在ILSVRC競賽中AlexNet模型[3]贏得冠軍,將錯誤率降低了10個百分點。擁有5層卷積結構的AlexNet模型證明了卷積神經網絡在復雜模型下的有效性,并將GPU訓練引入研究領域,使得大數據訓練時間縮短,具有里程碑意義。AlexNet還有如下創新點:①采用局部響應歸一化算法(Local Response Normalization,LRN),增強了模型的泛化能力,有效降低了分類錯誤率;②使用Dropout技術,降低了神經元復雜的互適應關系,有效避免了過擬合;③為了獲得更快的收斂速度,AlexNet使用非線性激活函數ReLU(Rectified Linear Units)來代替傳統的Sigmoid激活函數。
Karen等[4]在AlexNet的基礎上使用更小尺寸的卷積核級聯替代大卷積核,提出了VGG網絡。雖然VGG網絡層數和參數都比AlexNet多,但得益于更深的網絡和較小的卷積核尺寸,使之具有隱式規則作用,只需很少的迭代次數就能達到收斂目的。
復雜的網絡結構能表達更高維的抽象特征。然而,隨著網絡層數增加,參數量也急劇增加,導致過擬合及計算量大增,解決這兩個缺陷的根本辦法是將全連接甚至一般的卷積轉化為稀疏連接。為此,Google團隊提出了Inception結構[5],以將稀疏矩陣聚類為較為密集的子矩陣來提高計算性能。以Inception結構構造的22層網絡GoogLeNet,用均值池化代替后端的全連接層,使得參數量只有7M,極大增強了泛化能力,并增加了兩個輔助的Softmax用于向前傳導梯度,避免梯度消失。GoogLeNet在2014年的ILSVRC競賽中以Top-5錯誤率僅6.66%的成績摘得桂冠。
網絡層數的增加并非永無止境。隨著網絡層數的增加,將導致訓練誤差增大等所謂退化問題。為此,微軟提出了一種深度殘差學習框架[6],利用多層網絡擬合一個殘差映射,成功構造出152層的ResNet-152,并在2015年的ILSVRC分類問題競賽中取得Top-5錯誤率僅5.71%的成績。隨后,對現有的瓶頸式殘差結構進行改進,提出了一種直通結構[7],并基于此搭建出驚人的1001層網絡,在CIFAR-10分類錯誤率僅4.92%。至此,卷積神經網絡在越來越“深”的道路上一往直前。
2 可變形的卷積神經網絡
2.1 空間變換網絡
空間變換網絡(Spatial Transformer Network,STN)[8]主要由定位網絡(Localisation net)、網格生成器(Grid generator)和可微圖像采樣(Differentiable Image Sampling)3部分構成,如圖1所示。
定位網絡將輸入的特征圖U放入一個子網絡(由卷積、全連接等構成的若干層子網絡),生成空間變換參數θ。θ的形式可以多樣,如需要實現2D仿射變換,那么θ就是一個2×3的向量。
2.3 本文模型
本文以自建的3層卷積網絡C3K5(如圖6所示)和VGG-16作為基準網絡,分別引入空間變換網絡、可變形卷積和可變形池化,構造出8個卷積神經網絡,用以驗證可變形模塊對淺層網絡和深層網絡的影響,如表1所示。
圖6中C3K5網絡模型包含3個帶有ReLU層、LRN層和池化層的卷積模塊,卷積層采用步長為1的5×5卷積核,輸出保持原大小,池化層采用步長為2核為2×2的最大值池化,即每經過一個卷積模塊,特征圖縮小為原來的一半。
3 實驗與分析
3.1 實驗設置
本文實驗環境:CPU為Intel i5-7400,8G內存,顯卡為GTX1060,采用Cuda8+CuDNN6.0加速。
實驗數據集包括公共圖像數據集mnist、cifar-10、cifar-100和自建圖像數據集pen-7。公共數據集分別有50 000張訓練樣本圖像和10 000張測試樣本圖像。自建數據集pen-7為京東商城的七類筆圖像庫,每類有600張圖片,圖像分辨率為200×200,總計訓練樣本數3 360,測試樣本數840, 圖7為其中的14個樣本。
3.2 結果與分析
分別將表1中的10個卷積網絡應用到mnist、cifar-10、cifar-100和pen-7四個數據集進行訓練,batch-size設置100,即每次傳入100張圖片進行訓練,每訓練100次測試一次(記為一次迭代),總共迭代100次,取最后10次迭代的準確率計算平均值,得各網絡應用在不同數據集的分類結果,如表2所示。
實驗結果表明,在卷積網絡中引入空間變換網絡、用可變形的卷積層和可變形的池化層替換傳統的卷積層和池化層,不管是在淺層網絡還是在深層網絡,都能獲得更高的分類準確率,這驗證了空間變換網絡和可變形卷積(池化)結構,豐富了卷積神經網絡的空間特征表達能力,提升了卷積網絡對樣本的空間多樣性變化的魯棒性。包含3種模塊的網絡獲得了最高的分類精度,使空間變換網絡、可變形卷積層和可變形池化層在更多應用場景中并駕齊驅成為可能。
4 結語
通過在現有卷積神經網絡中引入空間變換網絡、可變形的卷積層和可變形的池化層,使得卷積網絡在mnist、cifar-10、cifar-100及自建的pen-7數據集中獲得了更高的分類精度,包含3種模塊的網絡獲得了最高分類精度,證明了空間變換網絡、可變形的卷積層和可變形池化層都能豐富網絡的空間特征表達能力,協同應用于圖像分類工作,這為后續研究打下了堅實的基礎。
參考文獻:
[1]BOUVRIE J. Notes on convolutional neural networks[J].Neural Nets,2006(1):159-164.
[2]Y LECUN,L BOTTOU,Y BENGIO,et al.Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[3]KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C]. International Conference on Neural Information Processing Systems. Curran Associates Inc,2012:1097-1105.
[4]SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[J]. Computer Science, 2014(6):1211-1220.
[5]SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions[J]. CVPR, 2015(3):1-9.
[6]HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]. Computer Vision and Pattern Recognition. IEEE, 2015:770-778.
[7]HE K, ZHANG X, REN S, et al. Identity mappings in deep residual networks[J]. arXiv,2016(1603):5-27.
[8]JADERBERG M, SIMONYAN K, ZISSERMAN A, et al. Spatial transformer networks[J].Computer Science, 2015(5):1041-1050.
[9]DAI J, QI H, XIONG Y, et al. Deformable convolutional networks[J]. arXiv: 2017(1703):62-111.
篇3
關鍵詞:深度學習;行為識別;神經網絡
1 概述
動作行為識別是計算機視覺領域中的一個研究熱點,已經廣泛應用于智能監控、人機交互、視頻檢索等領域中[1]。動作行為識別技術是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達圖像(視頻)中的實際目標和場景內容是最基本,最核心的問題。因此,對于特征的構建和選擇得到廣泛關注,例如STIP、SIFT、MSER等。但是,能通過無監督方式讓機器自動從樣本中學習到表征樣本的特征,會讓人們更好地利用計算機來實現人的視覺功能。而深度學習作為神經網絡的延伸和發展,是通過逐層構建一個多層網絡來使得機器自動學習到隱含在數據內部的關系,從而讓學習到的特征更加準確性。
文章旨在探討深度學習與機器學習(神經網絡)之間的關系,并且介紹深度學習的由來、概念和原理;同時介紹目前深度學習在計算機視覺中的應用。最后提出深度學習目前發展所面臨的問題,以及對未來的展望。
2 深度學習
2.1 深度學習概述
深度學習源于人工神經網絡的研究,是機器學習的拓展。深度學習是經過組合低層特征來形成更加抽象的屬性類別和特征,從中發現原始數據的特征表征[2]?,F在用于動作行為識別的技術是通過“動作表征”+“動作分類器”的框架來進行行為識別的。其中“動作表征”是人們手動設計特征獲取到的,也就是在目前識別框架內存在一個對動作圖像(視頻)的預處理過程。
深度學習和淺層學習相對。目前許多學習算法是淺層網絡學習方法,具有一定的局限性,例如在樣本有限的狀況下,表示復雜函數的能力有限制,且對復雜分類問題的泛化能力也會受到一定約束[3]。而深度學習通過學習深層非線性網絡結構,達到復雜函數逼近,又能在樣本少的情況下學習原始數據的特征。BP算法作為傳統神經網絡的典型算法,雖然訓練多層網絡,但僅含幾層網絡,訓練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網絡誤差函數形成含多個極小點的非線性空間,因而經常收斂到局部最小,且隨著網絡層數的增加,容易過擬合。而深度學習可以獲得分布式表示,通過逐層學習算法來得到原始輸入數據的主要變量。通過深度學習的非監督訓練完成,同時利用生成性訓練避免因函數表達能力過強而出現過擬合情況。
2.2 深度學習原理
傳統機器學習僅含單層非線性變換的淺層網絡結構,而且淺層模型單一。這對于深度網絡來說易造成陷入最優或產生梯度分散等問題。因此,Hinton等人在基于深度置信網(DBNs)的情況下提出非監督貪婪逐層訓練算法,隨后提出了多層次自動編碼器深層結構,這給解決深層網絡結構相關的優化難題帶來了希望。此外Lecun等人提出的卷積神經網絡是第一個多層次結構的學習算法。同時深度學習還出現了許多結構:多層感知機、去噪自動編碼器、稀疏編碼等。
卷積神經網絡是第一個真正采用多層次網絡結構,具有魯棒性的深度學習算法,通過探究數據在空間上的相關性,減少訓練參數的數量。而且卷積神經網絡(CNN)適應性強,善于發現數據的局部特征。它的權重共享結構降低了網絡模型的復雜度,減少了權值的數量,使得卷積神經網絡在模式識別中取得了很好的結果。
自動編碼器的核心關鍵是將原始圖像(視頻)輸入信號進行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達原始圖像(視頻)的特征。
3 深度學習的應用
3.1 語音識別
從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術框架。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。
3.2 視頻中的動作行為識別
準確迅速識別視頻中人的動作行為對于視頻搜索和視頻監控具有劃時代的意義。最近幾年,深度學習技術被應用于視頻動作行為識別中。如Ji等人[4]提出多層網絡的3D卷積神經網絡來學習視頻中的時空特征,并通過卷積來實現對整個視頻特征的學習,從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數據庫上進行的實驗取得了不錯效果。
4 結束語
文章對深度學習的主要概念進行了全面闡述,包括其由來、原理、研究進展和相應的應用等。在很多領域中,深度學習都表現了潛在的巨大價值,但深度學習作為淺層學習的延伸,仍處于發展階段,還有很多問題值得我們深入探討:
(1)我們需要了解深度學習的樣本復雜度,需要多少訓練樣本才能學習到足夠的深度模型。
(2)在推進深度學習的學習理論和計算理論的同時,我們是否可以建立一個通用的深度學習網絡模型,作為統一的框架來處理語音、圖像和語言。
(3)神經網絡具有前饋性連接和反饋性連接,可是我們研究的深度網絡中還沒有加入反饋連接,這些都給深度學習的研究帶來了嚴峻的挑戰。
參考文獻
[1]王亮,胡衛明,譚鐵牛.人運動的視覺分析綜述[J].計算機學報,2002,25(3):225-237.
[2]余凱,賈磊,陳雨強.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(9):1799-1804.
篇4
摘要:
針對帶鋼表面缺陷檢測系統的速度滯后,精度偏低等問題,在分析成像理論和圖像檢測理論的基礎上,設計并實現了一種帶鋼表面缺陷高速高精度在線檢測系統.該系統首先采用大功率半導體均勻發光激光器技術、高速線掃描成像技術和基于圖形處理器的Gabor紋理濾波技術實現了高速高分辨率的圖像采集和處理,然后采用基于嵌套循環的K-折交叉驗證、信息增益率和BP神經網絡方法構建了高準確率的分類器,以達到對帶鋼表面缺陷高速高精度在線檢測.實驗結果表明,該系統滿足了現有帶鋼生產速度的要求,具有較高的精度和準確率.
關鍵詞:
圖像采集和處理;圖像檢測;Gabor紋理濾波;神經網絡
0引言
鋼鐵企業為了提高競爭力,對帶鋼的生產提出了新的要求,也對帶鋼表面檢測系統提出了更高的要求,既要有更高的檢測速度還要有更加準確的檢測精度[1].而與此同時,跟隨機器視覺技術的發展,帶鋼表面檢測系統也得到了廣泛的研究與應用[2].主要研究包括:①光源技術.由于帶鋼檢測對光源要求頻度高、體積小,這限制了傳統光源在其應用[3],激光具有方向性好、亮度高、體積小等優點,被廣泛應用于帶鋼檢測應用中,國內的徐科等[4]提出熱軋鋼檢測中用綠光作為激光光源,但激光照明需解決均勻性問題.②掃描技術.由于電荷耦合元件能夠實現實時檢測,成為目前研究和應用的主流技術[5].但是,CCD電荷耦合器需在同步時鐘的控制下,以行為單位一位一位地輸出信息,速度較慢,而互補金屬氧化物半導體光電傳感器采集光信號的同時就可以取出電信號,還能同時處理各單元的圖像信息,速度比CCD電荷耦合器快很多[6].③圖像處理算法.受限于帶鋼加工過程的特性,帶鋼表面呈現出隨機紋理的特點,對于隨機紋理圖像的處理分析,目前常用的方法有共生矩陣法、頻域濾波法、分形法等.作為頻域濾波法的代表,二維Gabor濾波器有著與生物視覺系統相近的特點[7],廣泛應用于紋理圖像的處理分析.但是,CPU很難滿足現在的帶鋼檢測的實時要求[8].④分類算法.特征選擇的主流算法是主成分分析和信息增益.主成分分析存在特征向量方向不一致的問題,而且如何確定主成分存在主觀性[9].信息增益可以衡量特征的優劣,利用它可對特征進行排序,方便后面的特征選擇,但信息增益適用于離散特征,信息增益率既適用于離散特征也適用于連續特征[10],被廣泛應用于特征選擇的過程中.圖像分類算法主流算法包括支持向量機和BP神經網絡.支持向量機不適用于大樣本的分類問題[11].BP神經網絡方法具有能夠解決非線性分類問題,對噪聲不敏感等優點,被廣泛應用于帶鋼檢測中,如王成明等[12]提出的基于BP神經網絡的帶鋼表面質量檢測方法等,但是BP神經網絡的超參的設定往往具有隨機性,這嚴重影響了分類效果[13].本文首先介紹了帶鋼表面缺陷高速高分辨率成像系統的設計,針對光源的不均勻性、圖像處理速度慢等問題,提出改進方法,然后介紹了分類器的構建,針對樣本劃分的隨機性、特征選擇的隨機性以及BP神經網絡超參設定的隨機性問題,做出改進,最后介紹試驗結果.
1帶鋼表面缺陷高速高分辨率的成像系統的設計
1)大功率半導體均勻發光激光器技術.激光能夠保證帶鋼表面缺陷的檢出率[14],本系統選用808nm半導體激光器作為照明源,出光功率可達30W,亮度可達1500流明.激光照明需解決均勻性的問題,本文采用了基于鮑威爾棱鏡的激光線發生辦法,解決了激光照明的均勻性問題,其光路如圖1所示.該方法首先在激光聚焦位置放置圓形球面透鏡,負責將發散的激光束匯聚成準平行光,同時控制光柱的粗細,然后,利用鮑威爾棱鏡的擴散效果對圓柱的一個方向進行擴束,最終形成激光線.為保證亮度及寬度的適應性,激光器出光口距離圓透鏡、鮑威爾棱鏡的距離可以精密調整.為了降低反射亮度損失,在透鏡表面鍍上808±5nm的T≥99%的增透膜.
2)基于GPU的Gabor紋理濾波技術.二維Ga-bor濾波器具有易于調諧方向、徑向頻率帶寬及中心頻率等特征,本文采用該方法來進行圖像處理,二維Gabor函數為guv(x,y)=k2σ2exp-N2(x2+y2)2σ[]2×expi(k•()xy[])-exp-σ2{()}2(1)其中:k=kxk()y=kvcosψμkvsinψ()μ;kv=2-v+22π;ψμ=μπN;v的取值決定了Gabor濾波的波長;μ的取值表示Gabor核函數的方向;N為總的方向數.設f(x,y)為圖像函數,guv(x,y)為卷積函數,則卷積輸出N(u,v)可表示為N(u,v)=f(x,y)*guv(x,y)(2)二維Gabor濾波算法計算量較大,為了保證了帶鋼表面缺陷檢測的實時性,采用基于GPU的并行處理架構,其計算流程如圖2所示.GPU的算法分為兩個流程:訓練過程主要針對無缺陷圖像進行,通過訓練完成紋理圖像的背景建模,一方面消除背景變化帶來的干擾,另一方面形成有效的Gabor卷積參數,以便在檢測過程中得到最優的檢出效果.檢測過程對實際拍攝的缺陷圖像進行分析,首先按照GPU的核心數和緩存大小對圖像進行分解,本文所有GPU的核心數為1024,顯存2G,因此將原始圖像分解為1000塊,分別加載到1000個核心中,同時并發運行卷積運算.最后將各個窗口的卷積結果合并到一起,得到完成的濾波結果,最后借助于背景模式,將背景的干擾消除,得到干凈的缺陷區域.
3)成像系統.根據缺陷檢測的精度要求(1800m/min的檢測速度,0.25mm的精度),帶鋼的規格要求(1900mm規格),對帶鋼進行成像系統設計.基于互補金屬氧化物半導體(CMOS)的成像芯片具有速度快,用電低等優勢.選用兩個4K線掃描CMOS相機作為成像核心器件,選用CameraLinkFull接口作為數據輸出.兩個4K掃描中間重疊100mm作為圖像拼接區.兩組線激光光源與線掃描組成系統的主要成像模塊.成像系統結構如圖3所示.
2構建分類器
檢測缺陷類別及其特征描述如表1所示.
1)訓練集和樣本集劃分.主要缺陷類別有5個,每個類別收集樣本7000,共計35000個樣本.為了避免訓練集和樣本集劃分的盲目性,采用10-折交叉驗證的方式劃分訓練集和測試集,即將樣本集分成10份,從中選1份為測試集,剩下的為訓練集,如圖4所示,究竟選擇哪一份作為測試集,需在后面的嵌套循環中實現.
2)特征選擇.缺陷區域的長度、寬度、面積、區域對比度等共計138個特征形成初始特征集合,利用信息增益率來對各個特征排序.設樣本集T的某個特征子集S中,相異值構成集合A,集合A把特征子集S劃分為多個子集{S1,S2,Sv,…},|Sv|、|S|為集和大小,信息增益率的公式為Gainration(S,A)=Gain(S,A)Intrinsiclnfo(S,A)(3)式中Gain(S,A)為信息增益,是分裂前的信息減去分裂后的信息,公式為Gain(S,A)=InfoBefore(S)-InfoAfter(S)=Entropy(S)-∑v∈Values(A)|Sv||S|Entropy(Sv)(4)式中Entropy(S)為集合S的熵,公式為Entropy(S)=Entropy(p1,p2,…,pm)=-∑mi=1pilogpi(5)式中pi為第i個類別的概率.式(3)中,Intrinsiclnfo(S,A)為內在信息,公式為Intrinsiclnfo(S,A)=∑v∈Values(A)|Sv||S|log(|Sv||S|)(6)利用信息增益率對特征進行排序,再利用循環(從1到138循環)實現最優的特征個數的確定.
3)BP神經網絡隱含層節點數的確定.BP神經網絡應用到帶鋼表面質量檢測上具有很多優勢,但也存在一些問題,主要體現在隱含層節點數選取的盲目性和初始權值選取的隨機性.對于隱含層節點數確定問題,利用隱含層節點數常用計算公式[15](2(m+n)+1,n+槡m+a,log2n,n為輸入層節點數,m為輸出層節點數,a為的[1,10]常數)求得節點數的可能取值集合n1,求得該集合最大值n1-max和最小值n1-min,從n1-min開始到n1-max,利用循環,節點數逐個增加,確定最優的隱含層節點數[16];
4)BP神經網絡初始權值的選取.當隱含層節點數確定后,需要確定輸入層和隱含層之間、隱含層和輸出層之間的初始權值.首先生成10組隨機數數組,利用循環確定最優的隨機數數組.
5)判別標準和嵌套循環.上述各循環中,分類效果好與壞的判別標準是分類的總體精度,公式為OA=∑niin(7)式中:nii為樣本被預測為類別i,n為樣本個數.上述各循環組合在一起就是一個嵌套循環,其N-S盒圖如圖5所示,最外層是測試集和訓練集的10折交叉驗證,第1層是確定最優的特征數,第3層是確定最優的隱含層節點數,第4、5層是確定最優的輸入層和隱含層、隱含層和輸出層的初始權值[17-20].經以上循環,確定D3作為測試集,最優特征數為23個,最優的隱含層節點數是46個,同時也確定了最優的初始權值,對應的3層BP神經網絡的網絡模型如圖6所示.
3實驗結果
1)鮑威爾棱鏡與柱透鏡進行對比在實際工作距離1.5m處,采用0.1m為間隔使用光功率計測試光源功率,如圖7所示,橫軸為測試點,縱軸為測試點的光功率.實驗表明,鮑威爾棱鏡均勻性優于柱透鏡.
2)Gabor濾波方法與其他方法比較將動態閾值法+Blob分析法(方法A)和灰度共生矩陣紋理背景消除法(方法B)兩種方法與Gabor濾波方法進行比較,如圖8所示.由于缺陷與背景灰度相近(圖(a)),致使方法A缺陷丟失(圖(b)),由于缺陷與背景紋理相近(圖(d)),致使方法B產生噪聲(圖(e)),Gabor方法取得了不錯的效果(圖(e)、(圖(f))).
3)GPU與CPU比較以4096×4096的圖像為例,選10幅有代表性圖像,利用CPU(最新的inteli7-2600處理器,4核8線程,2.6GHz,內存8G)和GPU(nVidiaGTX970,4G緩存顯卡)進行Ga-bor運算,計算時間如表2所示,GPU計算效率明顯優于CPU,其中CPU的平均耗時為290.4ms,而GPU的平均耗時為31.7ms.
4)檢測效果在產線速度為1775m/min,最小檢測缺陷的尺寸為0.25mm的檢測系統中,對帶鋼的主要4種類型缺陷進行檢測統計,檢測結果如表3所示.可計算出整體檢出率99.9%,檢測準確率99.4%.
4結論
本文提出將基于鮑威爾棱鏡的大功率激光器應用到光源的設計中,保證光源光照的均勻性;提出了新的帶鋼表面缺陷檢測系統的成像系統結構設計,保證了快速、高精度的生成圖像;提出了基于GPU的二維Gabor濾波圖像處理的算法,滿足了實時處理的要求;提出了基于嵌套循環的分類器擇優算法,避免了樣本集選擇、特征選擇和BP神經網絡參數設定的盲目性.借助上述技術,系統實現了較好的效果,滿足當前帶鋼生產的檢測需求.
參考文獻:
[1]張長富.中國鋼鐵工業運行情況和發展展望[J].中國鋼鐵業,2013(4):5-8.
[2]劉彩章.基于機器視覺的帶鋼表面缺陷成像系統理論與實驗研究[D].武漢:武漢科技大學,2012:2-4.
[3]高瑀含,安志勇,李娜娜等.高斯光束整形系統的光學設計[J].光學精密工程,2011,19(7):1464-1471.
[4]徐科,楊朝霖,周鵬.熱軋帶鋼表面缺陷在線檢測的方法與工業應用[J].機械工程學報,2009,45(4):111-114.
[5]李霞.基于CCD的鋼板測寬儀系統設計[D].秦皇島:燕山大學,2014:5-10.
[6]石東新,傅新宇,張遠.CMOS與CCD性能及高清應用比較[J].通訊技術,2010,43(12):174-179.
[7]高梓瑞.Gabor濾波器在紋理分析中的應用研究[D].武漢:武漢理工大學,2012:6-10.
[8]王成順.表面缺陷檢測GPU并行圖像處理技術[D].合肥:合肥工業大學,2012:3-6.
[9]徐永智,華慧川.對主成分分析三點不足的改進[J].科技管理研究,2009(6):128-130.
[10]李佳龍,閻威武,白曉慧,等.基于數據驅動與信息增益率多指標決策模型的生活飲用水水質評估[J].大連理工大學學報,2016,56(1):92-96.
[11]張曉雷.支持向量機若干問題的研究[D].北京:清華大學,2012:1-20.
[12]王成明,顏云輝,李駿,等.基于BP神經網絡的冷軋帶鋼表面質量檢測研究[J].機械設計與制造,2007(6):106-108.
[13]高正中,張曉燕,龔群英.基于BP神經網絡的超聲波流量計的設計[J].現代電子技術,2016,39(16):6-9.
[14]周洋,何平安,蔣千年等.激光束整形光學系統的設計與研究[J].光學與光電技術,2006,4(2):26-28.
[15]飛思科技產品研發中心.神經網絡理論與Matlab7實現[M].北京:電子工業出版社,2005.
[16]沈花玉,王兆霞,高成耀等.BP神經網絡隱含層單元數的確定[J].天津理工大學學報,2008,24(5):13-15.
[17]文冬林.BP神經網絡中一種逃離局部極小點的方法研究[D].貴陽:貴州大學,2008.
[18]甘勝豐.帶鋼表面缺陷圖像檢測與分類方法研究[D].北京:中國地質大學,2013:3-20.
[19]吳彬彬.機器視覺方法在帶鋼表面缺陷檢測中的應用研究[D].武漢:武漢科技大學,2015:4-50.
篇5
關鍵詞:BP神經網絡;Morlet小波;決策理論;Hilbert變換
中圖分類號:TP18文獻標識碼:A文章編號:1009-3044(2009)32-9050-02
Wireless Signal Simulation Algorithm for Automatic Identification
ZHANG Meng
(Purchasing, China Railway Communication Co., Ltd., Beijing 100140, China)
Abstract: We have firstly discussed the modulation distinguishing method based on rational budgeting theory through the method of comparing Tine-Frequency analysis of the analysis signals formed by Hibert Transform . And on the basic of analyzing the fault of this method ,we put forward the distinguishing method based on NN. When NN is distinguishing signals, it mainly depends on the different positions of peak. Wavelet Transform here equals a mathematic microscope .it reflects the inexorable links between the signal categories and the positions of peak. Taking advantage Wavelet Transform and the simple three-layer BP NN, the more accurate Time-Frequency characteristics of signals to be distinguishing can be drawn.
Keywords: BP ANN; Morlet Wavelet; BudgetingTheory; Hibert Transform
在軍事電子對抗等多方面的重要應用,通信信號調制的自動識別分類問題也相繼發展起來。無線電信號調制實識別就是要判斷截獲信號的調制種類。為此,需要事先對其特征進行選定,并確定它們與相應調制種類相聯系的取值范圍,然后再對信號進行特征測量,并根據測量結果對信號的調制進行分類判決。
如果把無線電信號的調制識別與分類視為一種模式識別問題,那末,從模式識別理論來看,模式分類是模式識別的一個子系統。因此,在模式識別理論框架下,無線電信號的調制識別是一個總體概念。而調制分類則只是調制識別的一個分支[1]。
1 基于決策理論的模擬調制方式識別方法
此算法主要實現區分AM、FM、DSB、LSB、USB、VSB、AM-FM等七種調制樣式,所分析的對象序列s(n)是由接收機中頻輸出并經過采樣得到的,這樣s(n)的采樣頻率和載頻都已知,分別記做Fs和Fc。算法分兩個步驟:
第一步,根據信號的包絡特征將AM、USB、LSB與FM區分開,因為前三種信號的包絡不為恒定值,而FM的包絡理論上是恒定值(實際中接近恒定)。因而可以從中提取一個特征參數R。參數R反映了零中心歸一化包絡的功率譜特征,FM的零中心歸一化包絡接近零,因其參數R應遠遠小于前三種信號。實際中若R
第二步,根據信號頻譜的對稱性,將AM與USB與LSB區分開,因為AM的單邊頻譜關于載頻是近似對稱的,USB和LSB的單邊頻譜對于載頻來說分別只有上邊頻和下邊頻。因而可以從中提取另一個特征參數 。理論上,由于AM的上下邊頻對稱,所以AM的P接近零,而LSB和USB的P分別接近1和-1。實際中若|P|< 0.5,判為AM信號,若P>0.5,判為LSB,P
第三步,零中心非弱信號段瞬時相位非線性分量絕對值的標準偏差:σap 。
σap由下式定義:
(1)
式中,at是判斷弱信號段的一個幅度判決門限電平,c是在全部取樣數據Ns中屬于非弱信號值的個數,?準NL(i)是經零中心化處理后瞬時相位的非線性分量,在載波完全同步時,有:?準NL(i)= φ(i)-φ0
式中:,φ(i)為瞬時相位。用σap來區分是DSB信號還是AM-FM信號。
第四步,零中心非弱信號段瞬時相位非線性分量的標準偏差:σdp。
σdp由下式定義:
(2)
σdp主要用來區別不含直接相位信息的AM、VSB信號類和含直接相位信息的DSB、LSB、USB、AM-FM信號類,其判決門限設為t(σdp) 。
2 決策論方法的改進
前面介紹的基于決策理論的模擬調制方式識別方法存在缺陷針對上述問題,人們又提出了基于神經網絡(NN)的識別方法。
2.1 BP網絡作為分類器的模擬調制方式識別方法
該算法用基于有監督訓練的神經網絡模型BP網絡作為分類器,用BP模型多層感知網絡與反向傳播學習算法相結合,通過不斷比較網絡的實際輸出與指定期望輸出間的差異來不斷的調整權值,直到全局(或局部)輸出差異極小值,不難想象該神經網絡對模型細節中的諸多問題均有良好效果。
基于NN的模擬信號調制識別框圖[2]如圖1所示,該NN采用三層結構即,1個輸入層,1個輸出層,1個中間層。中間層可采用多層。但由于受到計算復雜性的限制,目前采用單層或雙層中間層的NN比較多見。本圖中間層采用單層25個節點,輸入層和輸出層的節點數取決于信號特征參數的個數和信號的分類數,因而分別為4和7。
神經網絡具有信息分布式存儲、大規模自適應并行處理和高度容錯特性,適用于模式識別的基礎。其學習能力和容錯特性對不確定性模式識別具有獨到之處[3]。通信信號在傳播過程中受到信道噪聲的污染,接受到的信號是時變的、非穩定的,而小波變換特別適用于非穩定信號的分析,其作為一種信息提取的工具已得到較廣泛的應用。小波變換具有時頻局部性和變焦特性,而神經網絡具有自學習、自適應、魯棒性、容錯性和推廣能力,兩者優勢的結合可以得到良好的信號模式自動識別特性,從而形成各種處理方法。
2.2 基于小波的特征提取和識別方法
小波特別適用于非穩定信號的分析,作為一種特征提取的工具已得到較為廣泛的應用。小波的重要特點是它能夠提供一個信號局部化的頻域信息。小波變換能夠將各種交織在一起的不同頻率組成的混合信號分解成不同頻率的塊信號,它對不同的時間和頻率有不同的解釋,因此,對調制信號進行小波分解,得到不同水平下的細節信息,這些信息對于不同類別的調制信號來說是有差別的[4]。
在實際應用中,小波變換常用的定義有下列兩種:
(3)
(4)
式中,星號*表示共軛。式(3)表示小波變換是輸入信號想x(t)和小波函數φα, τ(t)的相關積分;式(4)用卷積代替了相關積分。兩種定義在本質上是一致的。本為采用后者。
將式(4)中的τ和t離散化,即令τ=kTs,及t=iTs,得連續小波變換公式(4)的離散形式,又稱小波系數:
(5)
Morlet小波是一種單頻復正弦調制高斯波,也是最常用的復值小波。其實、頻兩域都具有很好的局部性,它的時域形式如下:
(6)
雖然信號特征有很多種,神經網絡在進行信號識別時,主要是依據譜峰位置的不同,因此提取信號特征主要任務就是尋找信號類別與譜峰位置間的必然聯系。而小波變換在這里則相當于一個數學顯微鏡,通過它,可以詳細了解各類信號在不同低頻段上的頻譜構成。
整個系統在PC機上進行仿真,采用Windows2000操作系統和Matlab6.1和Cool Edit2.0進行聲音錄制。
在仿真中,采用44K的采樣率,錄制了一段歌聲和一段笑聲,用Matlab生成22K的正弦載波,并根據第二章的各調制樣式的定義,生成了各個仿真的調制波形。并轉化成.wav文件錄在電腦中。
3 結束語
本文僅限于理論理論研究,用MatLab仿真實現,沒有用DSP芯片等物理電路實現,僅為實際實現提供理論指導。
參考文獻:
[1] 羅利春.無線電偵察信號分析與處理[M].北京:國防工業出版社,2003.
[2] 楊小牛,樓才義,徐建良.軟件無線電原理與應用[M].北京:電子工業出版社,2001.
篇6
關鍵詞:智能科學與技術;興趣導向;逆向教學
0引言
智能科學與技術是信息科學與技術的核心、前沿與制高點,也是整個現代科學技術體系的頭腦中樞,是現代科學技術創新的引領和示范,是現代社會(包括經濟、社會、文化、民生、國防等)走向智能化的主導技術支柱。在越來越激烈尖銳的國際競爭環境中,智能科學與技術水平已經成為一個國家綜合國力與科技實力的標志。智能科學與技術的發展和智能科學與技術學科的人才培養,不僅僅是智能科學與技術研究與教育本身的事情,更是關系到整個社會智能化發展優劣的大事情,也是關系到整個國家強弱興衰的大事情。
科技發展,關鍵在于人才。在新的發展機遇下,國家對智能科學與技術專門人才的需求更加旺盛。因此,如何促進智能科學與技術教學方式的改革是培養厚基礎、高層次的智能科學與技術人才的基本途徑。智能科學與技術教學方式的改革,不僅發展智能科學與技術本身,而且對受教育者創新能力的提高也至關重要。
目前,網絡的普及與全社會信息化程度的提高,對我國人才培養提出了更高的要求,特別是高校在課堂教學方面,部分原有教材及培養模式亟待調整。以智能科學與技術為代表的前沿新興學科,在學科發展途徑、應用技術轉化及從業人員年齡、成長環境等方面,均與很多傳統學科存在較大的差異,而使用傳統教學方式進行人才培養,也出現了一些水土不服的現象。
1教學理念的改變
相對于傳統學科,智能科學與技術從業人員平均年齡顯現出年輕化的特點,且由于從業人員及學生普遍年齡較輕,在他們的成長過程中,外在環境相對寬松,自由、平等的理念在他們的成長過程中不斷被提及和強化。傳統“教師講、學生聽”的演講式講授方式雖然能夠在一定時間內讓學生了解大量信息,但學生接收到的大部分信息只停留在記憶層面,很難上升到理解層面,導致學生只是被動的“填鴨式”接受。
在科技發達、網絡互聯的今天,人們不是自投羅網就是被網羅其中,知識獲取的渠道不再局限于紙質媒介和言傳身教,更多來自于電子資源及網絡媒介,教師和學生獲取知識的途徑及資源差異越來越小,在知識量、閱歷等方面縮小了師生間的差距,師生之間傳統的信息不對稱差距逐步縮小,導致教師在知識積淀上沒有了絕對優勢。
與此同時,逐步深入青年學生內心的自由、平等觀念對中國傳統的尊師重道思想帶來了不小的沖擊。在當今開放的網絡環境下,針對新興時代的學生,傳統習俗中的師長觀念由于知識獲取渠道的平等化而缺乏強有力的現實支撐,教師的身份權威性和知識權威性都受到了不同程度的質疑,繼續使用“填鴨式”“訓導式”教學方式,將會事倍功半。
因此,針對新興學科,一線教師需要進行教學理念上的修正,特別是教師應順應培養對象的整體特點,基于自由和平等的觀念進行自我定位,以交流討論式代替居高臨下布施式的教學觀念,充分與學生打成一片,以便更好地調動學生的思維,引導學生進行主動思考和主動學習。
2教學素材的改進與提高
當今時代是知識爆炸的時代,科學技術日新月異,新知識、新成果層出不窮,特別是智能科學與技術這一前沿學科,正在向理論創新和大規模實際應用發展,新理論、新方法不斷被提出并驗證,新模型、新實例、新應用不斷產出。
“教學素材對教育理念的滲透發揮著重要作用,它已經成為促進或阻礙教學模式轉變的活躍而關鍵的要素。隨著新時代知識的快速更新換代和知識面的不斷拓寬,教學素材是否優秀的標準不僅僅是包含多少知識,更重要的是包含多少最新的知識;不僅僅是傳遞解決問題的方法,更重要的是傳遞超前、新穎的解決問題的方法。
當今學生知識涉獵面廣,現有的網絡環境也為他們提供了很好的平臺,如果他們已經獲取的知識及應用的先進程度遠遠超過課本素材羅列的知識,將會極大地削弱他們對本學科的興趣,進而影響課堂教學效果。
此外,作為智能科學與技術這一前沿學科的教學素材,必須體現出時代性、開放性、多元性與全面性。因此,教學過程中所采用素材的改進和提高,應該向著不斷更新、與時俱進的方向靠攏,教師應該不斷將最新理論、最新方法、最新應用融合于一線基礎教學過程中,使學生在學習過程中始終緊跟前沿技術的發展,在未來工作中能更快、更好地融入行業中。
3教學方式的轉變
目前,學生群體主要為90后,高校即將迎來00后,他們成長過程中的家庭環境和社會環境與早期學生相比更為平等和寬松,他們的學習需求也由目標導向型逐步演化為興趣導向型。因此,如何激發學生的興趣,進而以興趣為基礎激發學生自主學習的動力,將是教學效果事半功倍的途徑。
青年學生正處于思維高度活躍的階段,他們往往對新興成果和前沿熱點有著超過常人的關注,如何巧妙而有效地將這種關注轉化為針對本學科的興趣,進而反向推導出基礎理論并讓學生消化、吸收,就成為一線教師面臨的重要問題。
從1997年國際象棋大師卡斯帕羅夫和電腦“深藍”第一次人機大戰開始,智能科學與技術迅速躋身科技前沿熱點,且經久不衰。2016年3月,Alpha Go再次燃起人工智能之火,經過媒體的推波助瀾,成為社會關注的焦點,大大增強了智能科學與技術的關注度。而青年學生作為最容易追趕潮流的群體,自然對此類熱點趨之若鶩。
作為智能科學與技術學科的一線教師,應把握和利用社會輿論的潮流以及學生心理的律動,及時以此熱點為突破口,吸引學生的興趣,引起共鳴,進而進行反向推導相關基礎理論并加以詳解。
例如,教師以Alpha Go為課堂開篇討論,引導學生思考,并說明Alpha Go的核心原理是深度學習。在這個實例中,Alpha Go模擬人類下棋的推理與思考過程,其中推理過程通過搜索樹來搜索可能的棋局,思考過程通過兩個深度神經網絡確定可能的搜索方向和評估棋局,這兩個神經網絡包括:
(1)落子選擇器(policy network),這是一種深度卷積神經網絡,主要通過當前棋盤布局預測下一步走棋位置的概率。
(2)棋局評估器(value network),與落子選擇器具有相似的結構,主要在給定棋子位置的情況下,輸出雙方棋手獲勝的可能性,從而對棋局進行評估。
如此,教師可以帶領學生了解搜索樹及搜索算法,也可以從深度卷積神經網絡到普通神經網絡,講解神經網絡的基礎知識,分析神經網絡到深度學習的發展過程。這樣就可以將學生對Alpha Go本身的興趣,巧妙地引導到對神經網絡等基礎概念和原理方面,以此強化學生對基礎知識的掌握。
同時,開放式的考核方式也是促進學生創新、使教學方法適應新時代的一種有效途徑。對于本學科感興趣的話題,教師應鼓勵學生多談自己的思路和想法;對于開放式課題,應給學生提供展示的舞臺,鼓勵學生分享自己在查找資料、解決難點、編程過程中的心得體會,充分調動學生的積極性和主動性;將這些考核成績按比例計入學生課業總成績中,充分肯定學生的創新能力。
4結語
教學成效是設計和構建教學方式的基本出發點,教師應該結合學生需求從學習成效、教學技巧、教學內容上總體把握教學方式閣,采用不同于傳統講授方式的逆向教學(如圖1所示),使其滿足和順應新一代青年學生的心理認同需求和學習需求,將新理論、新應用不斷融入基礎教學中,達到更好的教學效果。
篇7
關鍵詞:車牌識別系統; 智能交通; 技術
中圖分類號: TP391.4文獻標識碼:A文章編號:1009-3044(2008)18-20ppp-0c
Research on Licence Plate Recognition System
YI Lian-jie
(Loudi Vocational and Technical College Loudi Huanan417000)
Abstract: The licence plate recognition system has an importantrole of morden intelligent traffic system. This paper narrated the key technology ofthe licence plate recognition system and discussed the existing problems and development of the licence plate recognition system.
Keywords: the licence plate recognition system; intelligent traffic system; technology
車牌識別系統是智能交通系統的關鍵部分,可廣泛應用于交通管理、監控和電子收費等場合。車牌識別系統就是以車牌作為車輛的唯一標識,采用計算機視覺和模式識別技術對汽車車牌的自動識別。
1 車牌識別系統的組成
典型的車牌識別系統由車輛檢測、圖像采集、車牌識別等部分組成(圖1)。車輛檢測就是使用車輛傳感器或紅外線檢測等來判斷車輛是否通過某一位置。當車輛駛過探測部位時,CCD攝像機拍攝車輛圖像,由圖像采集卡采集圖像并輸入計算機。車牌識別部分由計算機和識別軟件組成,從由CCD攝像機采集的圖像中自動尋找車牌,然后對找到的車牌進行字符切分和識別,最后獲得車牌號碼,并將識別結果送至監控中心等場合。
圖1車牌識別系統的組成
在整個識別系統中,以車牌識別最為關鍵。識別過程有兩個步驟,首先從圖像中找出確切的車牌位置,即車牌定位,然后對找出的車牌進行字符切分和識別。車牌識別過程包含兩大關鍵技術:1.車牌區域定位技術;2.車牌字符切分和識別技術。
2 車牌定位技術
圖像輸入計算機后,系統要自動找出車牌的準確位置。車牌區域定位是車牌字符切分和識別的基礎,是提高系統識別率的關鍵。車牌定位過程包括三個步驟:圖像預處理、車牌搜索和車牌糾偏。
2.1 圖像預處理
圖像預處理的作用:平滑去噪和車牌特征增強。
平滑去噪就是消除圖像上由于光照、車牌污損等產生的噪聲干擾。平滑方法主要有平均濾波、中值濾波和指數函數濾波等方法。中值濾波和指數濾波平滑效果好且能較好保持牌照和字符邊緣,但在平滑效果和處理速度方面不如平均濾波。
通常的車牌定位算法是依據車牌特征從圖像中找出車牌,因此必須使車牌區域顯示出與非車牌區域不同的獨有的特征,車牌特征增強使圖像中車牌區域明顯突出。通常有下述增強方法:邊緣檢測法、二值化法、量化法、數學形態學法。
具有不同灰度的相鄰區域之間存在邊緣,在車牌區域存在車牌邊框邊緣和車牌字符邊緣。邊緣檢測法就是要檢測出這些邊緣。有關邊緣檢測的算法很多,考慮實時性要求,采用簡單的微分算子,如一階微分算等。這些算子采用小區域模板與圖像卷積實現邊緣檢測。文獻[1]提出一種牌照字符邊緣特征增強的方法,該方法使用線性濾波器函數將每一行中多個連續的水平方向梯度值相加,使得字符的垂直邊緣增強。微分算子對噪聲較為敏感,因此在使用之前需要平滑去噪。LOG算子是高斯指數平滑法與Laplacian算子相結合的邊緣檢測方法,既能消除噪聲又能很好的突出車牌字符的邊緣。
二值化增強法先確定一個閾值,然后將圖像中各個像素的灰度值都與這個閾值比較,根據比較結果將整個圖像的像素點分為兩類,車牌區域歸為一類,便于車牌搜索。為了滿足實時性要求,采用簡單、快速的二值化法,如平均閾值法,反積分自適應閾值法等。
文獻[3]使用神經網絡來對彩色圖像量化,使得車牌區域的字符為一種特定的顏色,然后進行顏色過濾或線掃描,借此提取車牌。該方法首先必須選取車牌樣本圖像,并且要把RGB顏色模式轉換為HSI模式,以HSI各分量值作為輸入對神經網絡進行訓練,再以訓練好的神經網絡對圖像的各像素點量化分類,該方法抗干擾能力強,量化前可不要求平滑,
數學形態學表示以形態為基礎對圖像進行分析的數學工具,它的基本思想使用具有一定形態的結構元素去量度和提取圖像中的對應形狀以達到對圖像分析和識別的目的。數學形態學有四種基本的運算:膨脹,腐蝕,開啟和閉合。出于以下兩個意圖而使用形態學方法:1.將開啟和閉合結合起來,消除二值化后的車牌區域中存在的細小空洞;2.采用水平線段的結構元素膨脹,使二值化后的車牌區域成為一連通區域。
需要說明的是,上述方法往往不是單獨使用,如二值化法是對邊緣檢測后的圖像進行,而形態學方法是在二值化圖上實現。不能簡單的評價圖像預處理方法的優劣,因為這與所對應的車牌搜索方法緊密相關。
2.2 車牌搜索
車牌搜索就是根據車牌區域特征在圖像中尋找車牌的過程。根據搜索的方式可把車牌搜索方法分為以下幾種:投影統計法、線掃描法、模板匹配法和反Hough變換法等。車牌搜索法要與相應的車牌增強法配合使用(見表2)。
表2車牌增強法用于不同搜索法的情況
投影統計法對邊緣化或二值化圖像進行水平和垂直累加投影,根據投影直方圖呈現的連續峰、谷、峰的分布的特征來提取車牌,或對由形態學膨脹運算后的圖像水平和垂直投影,在投影圖上尋找波峰和波谷而確定車牌位置。文獻[24]提出的采用高斯指數函數對投影圖平滑,能有效消除投影圖的毛刺,使車牌位置為明顯的波峰,提高車牌定位的精度。
線掃描搜索法則是對邊緣化或二值化后的圖像逐行水平掃描,穿過車牌區域的掃描線因為字符邊緣的存在,灰度呈現起伏的峰、谷、峰的變化,或頻繁交替出現亮基元、暗基元的特征,以提取車牌。文獻[3]用神經網絡對彩色圖像量化之后,再逐行水平掃描,分別獲取顏色向量和長度向量,能與標準車牌區域的顏色向量和長度向量匹配的為車牌區域。
模板匹配搜索法是以特定的模板在圖像區域滑動,以與模板匹配的局部區域為車牌。使用的模板有線模板、倒”L”角模板、矩形框模板。線模板以水平線段或垂直線段為模板,來檢測車牌的邊框角點;倒“L”模板以倒“L”結構為模板來尋找車牌邊框的左上角;矩形框模板以一個與車牌長寬比例相當的矩形框作為模板,在整個圖像區域滑動,以符合某一判別函數值的區域作為車牌區域。
反Hough變換搜索法是基于車牌形狀特征的方法,先對圖像進行Hough變換,然后在Hough參數空間尋找車牌的四個端點。
上述搜索法可以結合使用,如文獻[25]提出的自適應邊界搜索法,先用倒”L”模板尋找車牌邊框的左上角,然后用水平線掃描和垂直線掃描找出下邊框和右邊框。投影統計搜索法和線掃描搜索法處理速度快,能對大小不同的車牌識別,但定位精度不高和出現虛假車牌的情況,需要提高定位精度和去除虛假車牌的后續工作。模板匹配搜索法能比較準確的找到車牌位置,但難以滿足實時性要求,可以采用神經網絡或遺傳算法來加快搜索進程。反Hough變換搜索法除了能準確找到車牌位置,還能確定車牌的傾斜角度,對噪聲、輪廓線中斷不敏感,但在有直線干擾下可能實效,文獻[28]提出的快速Hough變換的策略能滿足實時性要求。
2.3 車牌糾偏
由于車輛運行軌跡不定、攝像機位置偏斜等原因,使得圖像中車牌扭曲,為了后續正確的車牌字符切分和識別,就須對車牌糾偏,使車牌達到規范的位置和大小。采用的糾偏方法通常先是用Hough變換確定水平邊框傾斜角度和垂直邊框傾斜角度,然后糾偏。文獻[22]提出使用Rodan 變換可用來確定傾斜角度。
3 車牌字符識別技術
車牌定位之后就要對車牌字符識別。這一過程包含下列幾個步驟(見圖2):車牌二值化,字符切分,字符特征提取和字符識別。這里只討論后三個步驟。
圖2 車牌字符識別步驟
3.1 字符切分
字符切分把車牌上的字符分開,得到一個個的字符圖像。常用的字符切分方法有投影法、模板匹配法、區域生長法、聚類分析法等。
投影法把車牌圖像垂直累加投影,形成峰谷交替的投影直方圖,找到投影圖的各個谷就能把字符分開。模板匹配法以字符大小的矩形作為模板,根據字符的寬度初步確定每個字符的起始位置,然后以此模板在初定位置附近滑動,找到最佳匹配位置而切分字符。區域生長法對每個需要分割的字符找一個像素作為生長起點的種子,將種子像素周圍鄰域中與之相同或相近性質的像素合并到種子像素所在的區域,然后將這些新像素當作新的種子繼續進行上述過程,直到再沒有滿足條件的像素可被包含進來?;诰垲惙治龅姆椒▽嚺茍D像從上到下逐行掃描,如屬于字符類的兩像素間距離小于閾值,可認為兩像素為同一字符,由此而得字符像素的聚類。
3.2 字符特征提取和車牌字符識別
目前使用的車牌字符特征提取的方法可歸納為下述三種:1.基于字符統計特征。計算字符圖像的多階原點矩,多階中心矩以及中心慣性矩,以中心矩與中心慣性矩的比值作為字符特征向量,這樣提取的特征量具有平移,旋轉和尺度不變性,但運算量大;也有把字符在多個方向上的投影(如水平方向,垂直方向,右斜方向,左斜方向)和二階中心矩的比值作為特征向量。2.基于結構特征。輪廓特征,粗網格特征,層次輪廓特征以及字符特征點.這類特征提取計算量較少,但對噪聲和位置變化比較敏感,需要去噪和對字符歸一化。3.基于變換。對原始特征(像素點矩陣)進行傅里葉變換、K-L變換或小波變換等,提取的特征向量反映字符的結構特征和統計特征,相似字符的特征矢量距離較大,效果較好。實際應用中往往是多種特征的提取,多種特征提取方法的使用。
對車牌字符特征提取之后,就把相應的特征值輸入分類器識別,目前對于車牌字符的分類識別方法歸納為下列幾種。(1)模板匹配。該方法首先對待識字符進行二值化并將其縮放為字符數據庫中模板大小,然后與所有的字符模板比較匹配,計算相似度,以最大相似度者為識別結果。(2)PCA子空間分類器。子空間分類器由訓練樣本相關矩陣的特征向量構成,單個模式的子空間建立彼此獨立,相互之間沒有聯系,以待識別字符的特征向量與所對應的子空間距離最小作為結果。(3)基于人工神經網絡。人工神經網絡有抗噪聲、容錯、自適應、自學習能力強的特點。多隱含層的BP神經網絡,BAM(Bidirectional association memories)神經網絡方法,自諧振ART神經網絡識別等是此方法的典范。(4)基于邏輯規則推理的識別方法。文獻[18]提出基于歸納推理的字符識別,該方法在訓練時自動生成識別規則。(5)基于隨機場圖像模擬的識別方法。該方法識別率高,并且可對灰度圖像直接提取字符特征,抗干擾性強。另外使用感知器的識別,通常感知器只用于相似字符對的識別,作為其他識別方法的補充。
4 總結與展望
從已有車牌識別系統的性能分析來看,正確識別率和識別速度兩者難以同時兼顧。其中原因包括目前的車牌識別技術還不夠成熟,又受到攝像設備、計算機性能的影響。
現代交通飛速發展,LPR系統的應用范圍不斷擴寬,對車牌識別系統的性能要求將更高。對現有的算法優化或尋找識別精度高、處理速度快、應用于多種場合的算法將是研究的主要任務。
參考文獻:
[1] 廖金周,宣國榮.車輛牌照的自動分割[J].微型電腦應用,1999(7):32-34.
[2] 劉智勇.車牌識別中的圖像提取及分割[J].中文信息文報,2000(3):29-34.
[3] Wu Wei,Mingjun Wang.An Automatic Method of Location for Number_Plate Using Color Features IEEE 2001.
[4] 郭捷,施鵬飛.基于顏色和紋理分析的車牌定位方法[J].中國圖像圖形學報,2002,7(5):473-476.
[5] 章毓晉.圖像工程(上)――圖像處理與分析[M].清華大學出版社.
篇8
關鍵詞:視覺注意;自頂向下;顯著性;對象信息;卷積神經網
中圖分類號:TP391.41
文獻標志碼:A
文章編號:1001-9081(2016)11-3217-05
0 引言
視覺注意機制的研究是探索人眼視覺感知的重要一環。在過去幾十年中,如何用計算模型模擬人眼視覺注意過程一直是核心問題。盡管取得了很大的進步,但是快速準確地在自然場景中預測人眼視覺注意區域仍然具有很高的挑戰性。顯著性是視覺注意的一項重要研究內容,它反映了區域受關注的程度。本文的研究著眼于顯著性計算模型,更多模型對比和模型分類可以參考Borji等[1]的文章。視覺注意存在兩種機制:自底向上(Bottom-up)和自頂向下(Top-down)。過去的研究中,大多數的計算模型是基于自底向上的信息,即直接從圖像像素獲取特征。
自底向上顯著性計算模型開創性工作源自于文獻[2]的Itti模型,該模型是很多其他模型的基礎和對照基準,它通過整合多種低層次特征,如顏色、亮度、方向等,給出一個顯著度的概率分布圖。Harel等[3]在Itti模型的基礎上引入圖算法,通過計算節點間特征值相似性和空間位置距離進行差異性度量獲取顯著圖。近年來隨著深度學習技術在目標識別領域的成功應用[4],研究者們對特征學習產生了更多的興趣。Borji等[5]通過稀疏編碼方法獲取特征,使用圖像塊的稀疏表示結合局部和全局統計特性計算圖像塊的稀有性(rarity),稀有性反映了當前圖像塊中心位置的顯著性。Vig等[6]通過訓練多個神經網絡獲取層次特征,然后自動優化特征組合。特征提取的過程可以看作是一種隱式空間映射,在映射空間中使用簡單的線性模型進行顯著或非顯著的分類。以上學習方法獲得的特征都是一些低層次特征,對圖像中的邊緣和特定紋理結構敏感。此外,部分研究人員希望從數學統計和信號處理的角度來度量顯著性。Bruce等[7]根據最大化信息采樣的原則構建顯著性模型。Li等[8]總結了多種基于頻域的視覺注意研究工作,提出了一種基于超復數傅里葉變換(Hypercomplex Fourier Transform)的視覺注意模型,并展示了其他多種基于頻域的模型在某種程度上都是此模型的特例。
以上模型均為數據驅動的顯著性模型,模擬人眼視覺注意過程中自底向上的機制。由于人眼視覺注意過程中不可避免地受到知識、任務、經驗、情感等因素的影響,因而整合自底向上和自頂向下信息的視覺注意研究受到更多的關注。現有模型整合的自頂向下信息可以分為三類:任務需求、場景上下文和對象特征。
Borji等[9]提出了一種構建任務驅動的視覺注意模型的聯合貝葉斯方法。Zhang等[10]提出了一種使用貝葉斯框架整合自底向上和自頂向下顯著性信息的方法。Siagian等[11]利用多種低層次特征對場景主旨進行建模,使用場景主旨引導視覺注意的轉移。考慮到任務需求和場景上下文建模的復雜性,研究人員將對象特征視為一種高層次的知識表示形式引入視覺注意模型中。Judd等[12]和Zhao等[13]通過將低層次特征和對象特征整合在一個學習框架下來獲得特征整合過程中每張特征圖的疊加權重,但是模型使用的對象特征只有人臉、行人、車輛等有限的幾種。Borji等[14]遵循了同樣的方法,但是在整合過程中添加了更多特征并且結合了其他顯著性模型的結果,最后用回歸、支撐向量機(Support Vector Machine, SVM)、 AdaBoost等多種機器學習算法結合眼動跟蹤數據進行訓練。實驗結果表明對象特征引入較大地提高了模型性能。Xu等[15]將特征劃分為像素級、對象級和語義級三個層次,并重點探索對象信息和語義屬性對視覺注意的作用;然而,模型中的對象級和語義級特征是手工標定的,因而不是一種完全意義上的計算模型。
總的來看,雖然部分模型已經使用對象特征作為自頂向下的引導信息,但是在對象特征的獲取和整合上仍有很大的局限性。首先,對不包含特定對象的場景適應性較差;其次,對象特征描述困難,通常是通過特定目標檢測方法獲取對象特征,計算效率低下;此外,對象特征的簡單整合方式不符合人眼的視覺感知機制。本文提出了一種結合深度學習獲取對象特征的視覺注意計算模型,重點研究了對象級特征的獲取和整合方法。算法結構如1所示,其中像素級突出圖獲取采用現有視覺注意模型的方法,對象級突出圖獲取采用本文提出的基于卷積神經網(Convolutional Neural Network, CNN)的特征學習和基于線性回歸的特征整合方法。實驗結果表明,對象級特征的引入可以明顯提高顯著性預測精度,預測結果更符合人類視覺注意效果。
1 對象信息獲取
1.1 對象特征
大量實驗證據表明對象特征引導視覺注意的轉移。視覺注意中引入對象特征是為了獲得圖像中對象位置等信息,目的與計算機視覺中的目標檢測類似。因而,已有的視覺注意計算模型的對象特征通常是通過特定目標檢測方法獲得。其中,Viola&Jones人臉檢測和Felzenszwalb車輛行人檢測是最常用的方法。文獻[12-14]均使用此類方法引入對象特征。由于這一類特征針對特定對象樣本進行設計和訓練,因而推廣能力不強。
li=fixations(obji)area(obji)(3)
其中: fixations()表示落入當前對象區域的正樣本的數目;area()表示對象區域面積。li衡量當前對象單位面積受關注的程度,對象單位面積受關注程度越高,其在對象整合過程中的權重應越高,因而li與疊加權重成正比。
式(4)通過一個線性回歸模型對已有樣本數據進行訓練,獲得對象整合疊加權重W:
L=WF(4)
其中:F={F1,F2,…,FN}為訓練樣本數據集合;L={l1,l2,…,lN}為訓練樣本標簽集合。
測試時根據式(5)~(6)獲得對象級突出圖:
3 顯著圖生成
視覺注意是自底向上和自頂向下兩種機制作用的結果。完全使用自頂向下的對象特征進行顯著區域預測有一定缺陷,主要表現在以下幾個方面:首先,知識是對訓練樣本數據的抽象表示,由于神經網絡的規模和訓練樣本中對象種類的限制,場景中部分對象對應的特征沒有被抽象在網絡結構中;其次,部分不具有明確語義的區域被錯誤地認為是對象,對視覺注意形成錯誤的引導;另外,人眼視覺注意轉移的生理學機制并不清楚,興趣區可能落在不具有對象特征區域中。因此,使用像素級特征給出低層次顯著性信息是必要的。
視覺注意模型中常用的像素級特征有顏色、亮度、方向等[2-3,12]。本文直接使用GBVS(Graph-Based Visual Saliency)算法[4]整合多種像素級特征獲取像素級突出圖Spixel。式(7)給出了整合的方法:
其中:S(i, j)為最終給出的視覺注意顯著圖;N()為歸一化操作;λ控制對象級突出圖與像素級突出圖的相對權重,通過實驗分析可知λ=0.4時效果較好。當圖像中不存在顯著物體或無法獲得高置信度的對象信息時,圖像任意位置Sobj(i, j)=0,此時完全由像素級特征驅動的視覺注意引導。
4 實驗結果及分析
本次實驗是以Visual Studio 2012為實驗平臺,選取OSIE和MIT數據集作為實驗數據。OSIE數據集包含700張含有一個或多個明顯語義對象的圖片以及15名受試者的眼動跟蹤數據,此外該數據集還提供了語義對象統計及人工標注的精確對象區域。MIT數據集包含1003張自然場景圖片以及15名受試者的眼動跟蹤數據。這兩個數據集是當前視覺注意研究領域中較大的數據集。為了驗證本文方法的準確率,將本文算法與GBVS[4]、 Itti[2]、 Judd[3]、 AIM[10]、LG[8]等視覺注意方法進行對比。
對比實驗中使用的評價指標為ROC(Receiver Operating Characteristic)曲線,實現方法與文獻[12,15]相同。圖6~8為實驗對比結果,顯著區域百分比是通過對歸一化顯著圖作閾值處理獲得,真正率(True Positive Rate)反映當前落入顯著區域的樣本占所有樣本的比例。通過變化顯著區域百分比獲得ROC曲線。為了更直觀比較算法效果,實驗結果圖中標注了每種算法的AUC(Area Under Curve)值,AUC值通過計算ROC曲線下的面積獲得。AUC值越大表示該方法給出的顯著性預測結果越準確。
圖6為利用對象級突出圖作為顯著圖在OSIE數據集上的實驗結果。相對于RCNN算法, fasterRCNN算法使用了更深層次的網絡結構和更多對象類別的訓練樣本,具有較高的對象位置預測準確率和對象檢出率。實驗分析可以看出,使用fasterRCNN算法生成對象級突出圖可以更好進行顯著性預測。同時,人臉特征(FACE)的引入進一步提升了預測準確性,從一個側面說明了對象性信息對視覺注意的轉移具有引導作用。
圖7是多種視覺注意算法在OSIE數據集上的ROC曲線,可以看出本文方法實驗效果明顯好于其他算法。僅次于本文算法的是GBVS和Judd,Itti的準確率較差。圖中對象級特征曲線為使用fasterRCNN結合人臉特征生成對象級突出圖獲得,由于該方法完全使用自頂向下的對象特征,顯著性預測準確率明顯弱于其他方法,因而證明了引入像素級特征必要性。圖8為MIT數據集上的實驗結果,本文方法和Judd算法為最好的兩種方法,實驗結果相差不大。AIM和LG方法效果較差。本文方法和Judd方法均使用了對象特征,可以看出整合了對象特征的方法相對于完全自底向上模型有明顯優勢。
圖9中給出了多種算法顯著圖的直觀對比。與其他方法強調對象邊緣不同,本文結合了對象信息的方法可以有效突出圖像中的完整對象區域。
5 結語
本文提出一種結合對象信息的視覺注意方法。與傳統的視覺注意整合對象方法相比,該方法利用卷積神經網學到的對象特征,獲取圖像中對象位置等信息;然后通過一個線性回歸模型將同一幅圖像的多個對象加權整合,獲得對象級突出圖;最后,根據視覺注意的層次整合機制,將低層次特征和對象特征進行融合形成最終的顯著圖。本文方法在不同數據集上的準確率要高于現有模型。針對包含明顯對象的圖像,本文方法克服了部分現有模型由于邊緣強化效果導致的顯著區域預測不準的問題。本文方法仍然存在一定局限性,未來的工作將嘗試非線性對象整合以及增大訓練樣本數量和網絡規模以獲取更多種對象特征。
參考文獻:
篇9
2.輸流管道參數共振的試驗研究梁峰,金基鐸,楊曉東,聞邦椿,LiangFeng,JinJiduo,YangXiaodong,WenBangchun
3.非接觸式超聲馬達的聲流及聲壓分析鄒楠,魏守水,姜春香,ZouNan,WeiShoushui,JiangChunxiang
4.基于核函數Fisher鑒別分析的特征提取方法胡金海,謝壽生,駱廣琦,李應紅,楊帆,HuJinhai,XieShousheng,LuoGuangqi,LiYinghong,YangFan
5.光纖機敏結構振動形態感知及其SMA致動控制朱曉錦,陸美玉,趙曉瑜,張合生,ZhuXiaojin,LuMeiyu,ZhaoXiaoyu,ZhangHesheng
6.虛擬式零件尺寸檢測儀的研制郭明青,秦樹人,王見,GuoMingqing,QinShuren,WangJian
7.一種基于支持向量機的齒輪箱故障診斷方法會,WuDehui
8.超聲電機多定子同步驅動技術的研究李亭,張鐵民,劉瀟建,LiTing,ZhangTiemin,LiuXiaojian
9.阻尼材料動態力學參數自動測試系統的設計胡衛強,王敏慶,劉志宏,馬少璞,周赤奇,HuWeiqiang,WangMinqing,LiuZhihong,MaShaopu,ZhouChiqi
10.減振裝置過油孔對阻尼閥水擊的影響研究陳軼杰,顧亮,黃華,張中生,王亞軍,ChenYijie,GuLiang,HuangHua,ZhangZhongsheng,WangYajun
11.點蝕與剝落對齒輪扭轉嚙合剛度影響的分析安春雷,韓振南,AnChunlei,HanZhennan
12.基于EKF訓練的RBF神經網絡及其故障診斷應用王璐,潘紫微,葉金杰,WangLu,PanZiwei,YeJinjie
13.液壓脈振注射機塑化過程螺桿動態特性分析王權,瞿金平,WangQuan,QuJinping
14.最佳小波包基改進軟閾值的消噪方法及應用侯新國,劉開培,魏建華,HouXinguo,LiuKaipei,WeiJianhua
15.新型多軸旋轉超聲電機原理金家楣,張建輝,趙淳生,JinJiamei,ZhangJianhui,ZhaoChunsheng
16.百萬等級汽輪發電機基礎動力特性優化研究代澤兵,劉寶泉,吉曄,王樹嶺,朱祝兵,DaiZebing,LiuBaoquan,JiYe,WangShuling,ZhuZhubing
17.CSP軋機扭振與垂振耦合研究閆曉強,史燦,曹曦,劉麗娜,YanXiaoqiang,ShiCan,CaoXi,LiuLina
18.抖晃對振動脈沖頻響特性估計的影響黃迪山,HuangDishan
19.剛架拱橋病害與損傷識別的動力學研究李枝軍,李愛群,繆長青,LiZhijun,LiAiqun,MiaoChangqing
20.大型船閘人字閘門工作模態試驗分析蔣建國,李勤,JiangJianguo,LiQin
21.CSP軋機振動的振源研究王永濤,臧勇,吳迪平,范小彬,WangYongtao,ZangYong,WuDiping,FanXiaobin
22.基于遺傳編程的發動機滑油系統故障診斷侯勝利,王威,胡金海,周根娜,HouShengli,WangWei,HuJinhai,ZhouGenna
23.低功耗頂板離層儀研究閻學文,吳波,廉自生
1.航空發動機轉子振動信號的分離測試技術馬建倉,石慶斌,程存虎,趙述元,MaJiancang,ShiQingbin,ChengCunhu,ZhaoShuyuan
2.刀具磨損監測及破損模式的識別康晶,馮長建,胡紅英,KangJing,FengChangjian,HuHongying
3.用最大重疊離散小波包變換的Hilbert譜時頻分析楊宇,何怡剛,程軍圣,于德介,YangYu,HeYigang,ChenJunsheng,YuDejie
4.柴油發動機曲軸軸承振動信號的雙譜分析趙慧敏,夏超英,肖云魁,李會梁,夏天,ZhaoHuimin,XiaChaoying,XiaoYunkui,LiHuiliang,XiaTian
5.動態·信息
6.基于能量的振動信號經驗模態分解終止條件胡勁松,楊世錫,HuJingsong,YangShixi
7.金屬橡膠材料阻尼性能的影響參數李宇燕,黃協清,LiYuyan,HuangXieqing
8.應用變精度粗糙集獲取柴油機故障有效監測點劉軍,LiuJun
9.反饋回路系統診斷策略優化技術研究楊鵬,邱靜,劉冠軍,YangPeng,QiuJing,LiuGuanjun
10.獨立分量分析在機械振動信號分離中的應用劉婷婷,任興民,LiuTingting,RenXingmin
11.基于KPCA-SVM的柴油機狀態識別方法的研究振動、測試與診斷 李宏坤,馬孝江,LiHongkun,MaXiaojiang
12.運用希爾伯特黃變換的橋梁顫振導數識別宋斌華,黃方林,王學敏,SongBinhua,HuangFanglin,WangXuemin
13.小波包時頻分析及其特性鐘佑明,ZhongYouming
14.基于EI及MAC混合算法的斜拉橋傳感器優化布置袁愛民,戴航,孫大松,YuanAimin,DaiHang,SunDasong
15.利用倒階次譜和經驗模態分解的軸承故障診斷康海英,祁彥潔,王虹,欒軍英,鄭海起,KangHaiying,QiYanjie,WangHong,LuanJunying,ZhengHaiqi
16.鋼混簡支梁加載損傷后耗能特征試驗研究王卓,閆維明,秦棟濤,劉昌鵬,WangZhuo,YanWeiming,QinDongtao,LiuChangpeng
17.三級同心液壓溢流閥噪聲特性的CFD分析陳青,許惠,權龍,ChenQing,XuHui,QuanLong
18.基于故障原因-征兆矩陣的故障診斷專家系統姚劍飛,江志農,趙慶亮,張雪,YaoJianfei,JiangZhinong,ZhaoQingliang,ZhangXue
19.往復式壓縮機氣缸壓力模擬曲線提取趙俊龍,,郭正剛,李宏坤,王奉濤,ZhaoJunlong,ZhangZhixin,GuoZhenggang,LiHongkun,WangFengtao
20.基于類間可分性度量和SVM的多故障分類算法李敏,楊潔明,張曉平,LiMin,YangJieming,ZhangXiaoping
21.磁通量法在預應力懸掛結構拉索施工中的應用宋杰,陳魯,張其林,陳國棟,SongJie,ChenLu,ZhangQilin,ChenGuodong
22.框架在脈沖位移作用下的回傳波射矩陣法解范志華,孫國鈞,繆馥星,FanZhihua,SunGuojun,MiuFuxing
23.改進的主成分分析方法在磁浮系統中的應用鄒東升,佘龍華,ZouDongsheng,YuLonghua
24.高速列車垂向振動的模擬器再現方法研究王小亮,李立,張衛華,WangXiaoliang,LiLi,ZhangWeihua
25.裝甲車輛動力傳動系統載荷譜測試方法研究潘宏俠,黃晉英,郭彥青,孫黎明,PanHongxia,HuangJinying,GuoYanqing,SunLiming
26.撓性接頭剛度測量中傳感器的研究王廣林,王慧峰,詹捷,陶崇德,孫國光,盧澤生,WangGuanglin,WangHuifeng,ZhanJie,TaoChongde,SunGuoguang,LuZesheng
1.橡膠V帶式無級變速器性能的測試與試驗研究上官文斌,王江濤,王小莉,ShangguanWenbin,WangJiangtao,WangXiaoli
2.一種新型孔式模態轉換型超聲電機楊淋,金家楣,趙淳生,YangLin,JinJiamei,ZhaoChunsheng
3.基于瞬態聲與階次倒譜的齒輪箱故障診斷田昊,唐力偉,陳紅,楊通強,張磊,TianHao,TangLiwei,ChenHong,YangTongqiang,ZhangLei
4.軸心軌跡自動識別及其在旋機診斷中的應用許飛云,鐘秉林,黃仁,XuFeiyun,ZhongBinglin,HuangRen
5.多傳感器主元方向和神經網絡的狀態識別方法張金萍,李允公,劉杰,ZhangJinping,LiYungong,LiuJie
6.多分支扭轉振動建模方法與分析軟件的研究袁清珂,曹廣忠,YuanQingke,CaoGuangzhong
7.基于EMD和球結構SVM的滾動軸承故障診斷楊潔明,田英,YangJieming,TianYing
8.新型氣浮聯合軸承轉子系統啟動過程振動特性張占一,應懷樵,劉杰,楊金福,李磊,ZhangZhanyi,YingHuaiqiao,LiuJie,YangJinfu,LiLei
9.基于粒子群優化的核主元分析特征的提取技術魏秀業,潘宏俠,王福杰,WeiXiuye,PanHongxia,WangFujie
10.齒輪箱起動過程故障診斷李輝,鄭海起,楊紹普,LiHui,ZhengHaiqi,YangShaopu
11.采用像素編碼技術的感應電機定子故障診斷侯新國,劉開培,夏立,胡煊,HouXinguo,LiuKaipei,XiaLi,HuXuanHtTp://
12.高架路交通誘發的地面振動測試與分析常樂,閆維明,任珉,周福霖,ChangLe,YanWeiming,RenMin,ZhouFulin
13.基于相關函數的多振動信號數據融合方法李學軍,李萍,褚福磊,LiXuejun,LiPing,ChuFulei
14.軸承-轉子系統在弱控制作用下的動力學行為孫保蒼,鐘曉波,陳威,駱英,馮耀嶺,SunBaocang,ZhongXiaobo,ChenWei,LuoYing,FengYaoling
15.振動、測試與診斷 海邊山坡場地爆破地震波的衰減測試與分析吳小波,WuXiaobo
16.雙圖同軸光纖束位移傳感器研究楊亮,張小棟,YangLiang,ZhangXiaodong
17.利用小波去噪和HHT的模態參數識別湯寶平,何啟源,蔣恒恒,陸冬,TangBaoping,HeQiyuan,JiangHengheng,LuDong
18.應用小波包和包絡分析的滾動軸承故障診斷唐貴基,蔡偉,TangGuiji,CaiWei
19.小波變換的流體壓力信號自適應濾波方法研究谷立臣,閆小樂,劉澤華,GuLichen,YanXiaole,LiuZehua
20.CSP軋機扭振中"偽拍振"的研究王永濤,臧勇,吳迪平,秦勤,范小彬,WangYongtao,ZangYong,WuDiping,QinQin,FanXiaobin
21.動態·信息
22.直升機旋翼不平衡故障診斷試驗研究高亞東,張曾锠,GaoYadong,ZhangZengchang
23.梁橋上移動荷載識別中的測點優化陳鋒,李忠獻,ChenFeng,LiZhongXian
24.基于遺傳小波神經網絡的雙余度電機故障診斷李世超,石秀華,崔海英,許暉,LiShichao,ShiXiuhua,CuiHaiying,XuHui
25.某型工業叉車護頂架的振動診斷楊義,李志遠,馬慶豐,YangYi,LiZhiyuan,MaQingfeng
26.銀基合金摩擦振動與噪聲特性的分析與控制陳傳海,楊世錫,鄭傳榮,ChenChuanhai,YangShixi,ZhengChuanrong
27.橢圓振動修整超聲磨削ZrO2溫度試驗研究陳東海,劉春孝,ChenDonghai,LiuChunxiao
1.超聲電機接觸界面的兩種簡化有限元模型周盛強,趙淳生
2.基于特征參數的旋轉機械智能故障診斷方法張征凱,薛松,張優云
3.《振動、測試與診斷》編委會會議紀要
4.燃料電池車氫氣輔助系統結構動態特性分析申秀敏,左曙光,蔡建江,張靜芬,李林,張世煒
5.鐵路貨車側墻制造過程建模與變形規律預測盧碧紅,李亞娜,聶春戈,兆文忠
6.改進支持向量機模型的旋轉機械故障診斷方法曹沖鋒,楊世錫,周曉峰,楊將新
7.基于小波神經網絡的木質材料缺陷模式識別孫建平,王逢瑚,曹軍,胡英成
8.旋轉機械故障診斷中的振動信號自適應分形壓縮算法唐貴基,張杏娟,杜必強
9.距離函數分類法在制粉系統故障診斷中的應用陳蔚,賈民平
10.基于模態綜合技術的結構有限元模型修正劉洋,段忠東,周道成
11.循環平穩度在發電機組故障趨勢分析中的應用左云波,王西彬,徐小力
12.900t級架橋機多軟件協同仿真平臺試驗研究凌正陽,曹恒,王瑜,張振雄,商偉軍
13.岸橋前大梁鉸支座支承對其橫向振動的影響邱惠清,盧凱良,李雪,歸正,曾怡
14.車輛發動機懸置處的動態剛度仿真研究蘭鳳崇,謝然,陳吉清
15.拉索平面內自由振動影響因素分析姜健,李國強,郝坤超
16.基于小波和自組織網絡的電纜故障識別汪梅,曲立娜
17.非庫侖摩擦轉子試驗臺碰摩分叉行為振動、測試與診斷 王正浩,王景愚
18.小波包與改進BP神經網絡相結合的齒輪箱故障識別時建峰,程珩,許征程,史少輝,時偉,鈕效鹍
19.基于奇異值分解的頻響函數降噪方法孫鑫暉,張令彌,王彤
20.球磨機料位電聲檢測系統的研制楊數強,余成波,全曉莉,崔焱喆
21.上臥式閘門水彈性振動試驗研究顧云,嚴根華,趙建平
22.抖晃初相在振動頻響估計誤差中的作用黃迪山
23.大型鋁電解槽針振信號深層特征提取方法研究周孑民,單峰,唐騫,李賀松,蔣科進,郭潔
24.非穩態信號計算階次分析中的重采樣率研究汪偉,楊通強,王紅,王平,鄧士杰
25.基于無傳感器檢測方法的機械系統扭振試驗研究時獻江,郭華,邵俊鵬
26.運用小波變換檢測汽車后橋總成故障余德平,王寶強,史延楓,任德均,姚進
27.基于AR模型和神經網絡的柴油機故障診斷黃泉水,江國和,肖建昆
1.運用改進殘余力向量法的結構損傷識別研究何偉,陳淮,王博,李靜斌,HeWei,ChenHuai,WangBo,LiJingbin
2.交通荷載作用下橋梁結構參數識別方法吳子燕,易文迪,趙宇,WuZiyan,YiWendi,ZhaoYu
3.行波超聲電機定、轉子接觸狀態試驗分析姚志遠,吳辛,趙淳生,YaoZhiyuan,WuXin,ZhaoChunsheng
4.伺服閥滑閥疊合量測量方法潘旭東,王廣林,邵東向,韓俊偉,PanXudong,WangGuanglin,ShaoDongxiang,HanJunwei
5.基于CAN總線遠程振動監測系統研究何青,李紅,何子睿,HeQing,LiHong,HeZirui
6.縱向脈沖作用下壓電層合桿的動力分析彭亮,羅松南,鄧慶田,PengLiang,LuoSongnan,DengQingtian
7.超臨界600MW機組檢修后振動分析及處理劉石,劉興久,馮永新,劉永生,朱軍,肖小清,王棟,LiuShi,LiuXinjiu,FengYongxin,LiuYongsheng,ZhuJun,XiaoXiaoqing,WangDong
8.虛擬式流體參量集成測試系統及其實現季忠,陳青,秦樹人,溫海松,JiZhong,ChenQing,QinShuren,WenHaisong
9.彈性支承雙跨碰摩故障轉子系統非線性特性李東,袁惠群,吳立明,LiDong,YuanHuiqun,WuLiming
10.盲解卷積的機械振動信號分離技術劉婷婷,任興民,楊永鋒,郭峰,LiuTingting,RenXingmin,YangYongfeng,GuoFeng
11.基于壓電元件的懸臂梁半主動振動控制研究趙永春,季宏麗,裘進浩,朱孔軍,ZhaoYongchun,JiHongli,QiuJinhao,ZhuKongjun
12.凸輪軸加工的誤差在線測量方法研究周傳德,賀澤龍,吳宏剛,張彩芳,ZhouChuande,HeZelong,WuHonggang,ZhangCaifang
13.振動、測試與診斷 一種仿真數字人步態規劃優化算法曹恒,凌正陽,王瑜,龍勇波,朱鈞,CaoHeng,LingZhengyang,WangYu,longYongbo,ZhuJun
篇10
技術快速進步確保安全
人臉識別是基于人的臉部特征信息,應用人工智能模式識別和計算機視覺技術鑒別個體身份的一種生物識別技術。從人工智能的角度來看,人臉識別其實是機器視覺的一個分支。曠視科技智能商業產品線資深總監宋晨表示,人臉識別實際上就是給機器賦能,讓它具備一雙眼睛的能力,讓它像人一樣去想、去看,從而“學會”各種檢測、判斷、識別和測量。
人們看好人臉識別,因為作為生物可識別技術,人臉識別有其獨特的優勢。一方面,人臉識別具有非接觸性和非侵擾性,不接觸人體就可以直接通過攝像頭在一定距離內進行識別,從而實現更大范圍、更多方位的信息采集,不需要被采集者配合,更易被大眾接受。另一方面,人臉識別的硬件門檻更低,指紋識別需要特定采集芯片,但人臉識別只需要攝像頭,智能手機上的相機和城市視頻監控體系中的高清攝像頭已足夠滿足需要。
但人臉識別應用的快速推進,仍來自于技術的快速提升?!拔覀冏钤缭谏钲诘某売嬎銠C上做人臉識別,要花28天進行迭代,但現在同樣的工作在6塊GPU芯片上只需要6個小時,這就是硬件提升帶來的瓶頸突破?!鄙虦萍糃EO徐立告訴記者。宋晨則對此解釋說,人臉識別所需要的圖像處理和深度學習能力,是基于GPU的訓練來產生的,它代表著高速和價廉的計算能力。
而在硬件之外,卷積神經網絡則在算法上大幅提升了人臉識別的精度。2014年前,在人臉檢測評測平臺FDDB上,學術界獲得的最好檢測精度是84%,但在2015年以后,通過使用卷積神經網絡算法,眾多人臉檢測應用的準確率提升到90%以上,現在最高正確率已經超過99%。北京大學信息科學技術學院智能科學系教授徐超表示,考慮到人眼識別的正確率僅有97%多,人臉識別技術已經超過了人的識別能力,在識別效率上更是遠超人類。
但對于人臉識別技術來說,“認得準”只是第一步,還需要足夠安全,能夠抵抗各種攻擊,比如偽造面具、使用照片或者3D軟件“換臉”等方式。螞蟻金服生物識別負責人陳繼東告訴記者,活體檢測是其中最核心的技術,“我們通過一系列軟件算法來判斷攝像頭前的是不是‘活人’,一是基于動作交互的識別模型,所以用戶會被要求做出眨眼、搖頭、張嘴等動作,通過檢測過程中動作的連續性,以此讓照片難以通過。但對于會模擬動作的視頻,或者預先制作好的動作視頻,我們還需要圖像的分析,比如說區分正常的圖像和通過軟件模擬、視頻剪輯的圖像之間有多大的差異”。曠視科技公司則表示,合成臉在圖形特征上會與真人有很大的差異,并不容易通過框體檢測和對翻拍的圖形特征分析檢測。
判斷“你是你”和“你是誰”
“臨川區榮耀網吧43號機器,一位17歲男性未成年人正在上網!”江西省撫州市文化綜合執法支隊的工作人員手機上接到這樣一條彈窗報警信息。“這正是應用了人臉識別技術,用戶在網吧上網時要拍照,這張照片會與上網者的身份證照片比對,一旦發現是未成年人,我們的技術監管平臺就會報警?!睋嶂菔形幕C合執法支隊支隊長胡光斌表示。
在沈陽地鐵,人臉識別系統同樣成為話題。在短短11天內,這套系統連續抓獲了3名網上逃犯。這是沈陽警方首次應用智能人臉識別系統追逃,在包括沈陽站等3個地鐵站,有人從高清攝像頭前經過,就會被連續拍攝20到30張角度不同的照片并與警方數據庫比對,一旦相似度評分超過83分,系統就會自動報警,并對目標拍攝一條10秒鐘的即時視頻。
在中科院自動化研究所雷震博士看來,這兩個應用場景正對應了人臉識別應用的兩個方向:用來確定“你是你”的1:1確認和用來判斷“你是誰”的1:N辨認?!?比1確認是將人臉圖像與圖片庫中的圖像進行比對,是目前比較成功的應用,精準度已經很高;1比N人臉搜索,先要在視頻中確認人臉的位置,然后抽取一適合進行人臉識別的圖片,最后則將這張圖片與N張照片比對,看是否有相符的一張,技術上講要難得多。”雷震說。
“在身份確認上,以前是人來做,現在交給機器,流程沒有變,只是效率大大提升,因此在各個傳統行業中滲透得最為迅速。”徐立表示。
的確,如果說“1比N人臉搜索”目前基本還集中于安防領域“試水”,那么在“1:1確認”方向,人臉識別應用則成熟得多。拿金融領域來說,陳繼東介紹,目前支付寶在高風險支付、修改密碼、實名認證等48個場景使用刷臉驗證,在支付寶的4.5億實名用戶中,有三分之一“刷過臉”。今年2月,螞蟻金服的“刷臉支付”還被知名科技雜志《麻省理工科技評論》評為全球十大突破性技術之一。
“做到從實名到實人,人臉識別起了非常重要的作用。在金融領域的人臉識別技術應用,除了準確度和安全級別之外,還需要極高的穩定性、可靠性和極低的實時響應?!标惱^東說。而在金融領域之外,證明“你是你”還在智能門禁、智能考勤、刷臉安檢、個稅申報、養老金領取資格認證等場景被廣泛使用。
防攻擊能力需不斷提升
如果說在確認“你是你”和搜索“你是誰”兩個方向上,人臉識別技術還都是“把人能做的事做得更好”,那么人臉識別技術還能完成“人無法完成的事情”。
今年年初,廈門的一些珠寶店在貨架上裝上了人臉識別系統,能夠分析每個用戶在柜臺前停留的時間?!癡IP客戶一到店,人臉識別系統就能將消息推送到店員手機上,同時還能顯示出這些客戶以往的購買記錄。如果記錄到一個客戶上次在哪個貨架停留的時間久,下次這一信息也會推送給店員?!睆B門瑞為信息技術有限公司負責人詹東暉說。人臉識別技術與線下商業的“親密接觸”,被視為是“互聯網+線下零售”的一個全新方向。
- 上一篇:企業信息化管理概述
- 下一篇:觸電應急演練培訓方案