卷積神經網絡概述范文
時間:2024-03-29 18:16:54
導語:如何才能寫好一篇卷積神經網絡概述,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
1概述
深度學習(Deep Learning)是人工智能、圖像建模、模式識別、神經網絡、最優化理論和信號處理等領域的交叉學科,主要構建和模擬人腦進行分析學習,它屬于機器學習的新興領域。
2大數據與深度學習
目前,光學檢測、互聯網、用戶數據、互聯網、金融公司等許多領域都出現了海量數據,采用BP算法對于訓練神經網絡出現了梯度越來越稀疏、收斂到局部最小值只能用有標簽的數據來訓練等缺點。Hinton于2006年提出了深度學習的概念,Lecun等人提出了卷積神經網絡,卷積神經網絡利用空間關系減少參數數目以提高訓練性能。
CPU和GPU計算能力大幅提升,為深度學習提供了硬件平臺和技術手段,在海量大數據處理技術上解決了早期神經網絡訓練不足出現的過擬合、泛化能力差等問題。
大數據和深度學習必將互相支撐,推動科技發展。
3深度學習模型
深度學習模型實際上是一個包含多個隱藏層的神經網絡,目前主要有卷積神經網絡,深深度置信神經網絡,循環神經網絡。
1)卷積神經網絡
在機器學習領域,卷積神經網絡屬于前饋神經網絡的一種,神經元不再是全連接的模式,而是應用了局部感受區域的策略。然而傳統的神經網絡使用神經元間全連接的網絡結構來處理圖像任務,因此,出現了很多缺陷,導致模型⑹急劇增加,及其容易過擬合。
在卷積神經網絡中,網絡中的神經元只與前一層的部分神經元連接,利用圖像數據的空間結構,鄰近像素間具有更強的相關性,單個神經元僅對局部信息進行響應,相鄰神經元感受區域存在重疊,因此,綜合所有神經元可以得到全局信息的感知。
另外,一個卷積層中的所有神經元均由同一個卷積核對不同區域數據響應而得到,即共享同一個卷積核,使得卷積層訓練參數的數量急劇減少,提高了網絡的泛化能力。
一般在卷積層后面會進行降采樣操作,對卷積層提取的特征進行聚合統計。降采樣區域一般不存在重疊現象。降采樣簡化了卷積層的輸出信息,進一步減少了訓練參數的數量,增強了網絡的泛化能力。
卷積神經網絡實現了局部特征的自動提取,使得特征提取與模式分類同步進行,適用于處理高分辨率的圖像數據。目前,卷積神經網絡在圖像分類、自然語言處理等領域得到廣泛應用。
2)深度置信網絡
深度置信網絡是一種生成模型,網絡中有若干隱藏層,同一隱藏層內的神經元沒有連接,隱藏層間的神經元全連接。神經網絡經過“反向運行”得到輸入數據。
深度置信網絡可以用做生成模型,通過前期的逐層無監督學習,神經網絡可以較好的對輸入數據進行描述,然后把訓練好的神經網絡看作深度神經網絡,最后得到分類任務的深度神經網絡。
深度置信網絡可以用于圖像識別、圖像生成等領域,深度置信網絡可以進行無監督或半監督的學習,利用無標記數據進行預訓練,提高神經網絡性能。但近幾年由于卷積神經網絡的飛速發展,深度置信網絡已經很少被提及。
3)循環神經網絡
循環神經網絡是一種專門用于處理時序數據的神經網絡,它與典型的前饋型神經網絡最大區別在于網絡中存在環形結構,隱藏層內部的神經元是互相連接的,可以存儲網絡的內部狀態,其中包含序列輸入的歷史信息,實現了對時序動態行為的描述。這里的時序并非僅僅指代時間概念上的順序,也可以理解為序列化數據間的相對位置。如語音中的發音順序,某個英語單詞的拼寫順序等。序列化輸入的任務都可以用循環神經網絡來處理。如語音、視頻、文本等。對于序列化數據,每次處理時輸入為序列中的一個元素,比如單個字符、單詞、音節,期望輸出為該輸入在序列數據中的后續元素。循環神經網絡可以處理任意長度的序列化數據。
循環神經網絡可以用于機器翻譯、連寫字識別、語音識別等。循環神經網絡和卷積網絡結合,將卷積神經網絡用于檢測并識別圖像中的物體,循環神經網絡用于識別出物體的名稱為輸入,生成合理的語句,從而實現對圖像內容的描述。
4深度學習應用
1)語音識別
語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。其應用領域主要有語音輸入系統、語音控制系統和智能對話查詢系統,語音識別極大地推動了人工智能的快速發展。1952年Davis等人研究了世界上第一個能識別10個英文數字發音的實驗系統。大規模的語音識別研究是在20世紀70年代以后,在小詞匯量、孤立詞的識別方面取得了實質性的進展。2012年,微軟研究院使用深度神經網絡應用在語音識別上將識別錯誤率降低了20%,取得了突破性的進展。2015年11月17日,浪潮集團聯合全球可編程芯片巨頭Altera,以及中國最大的智能語音技術提供商科大訊飛,共同了一套DNN語音識別方案。
2)圖像分析
圖像是深度學習最早嘗試的應用領域。1989年,LeCun和他的同事們就發表了卷積神經網絡的工作。2012年10月,Hinton和他的兩個學生用更深的CNN在ImageNet挑戰上獲得了第一名,使圖像識別向前躍進了一大步。
自2012年以來,深度學習應用于圖像識別使得準確率大大上升,避免了消耗人工特征抽取的時間,極大地提升了效率,目前逐漸成為主流的圖像識別與檢測方法。
篇2
關鍵詞:PCA算法;人臉識別;五級并行PCA模型;權重計算;均值濾波
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)19-0147-02
Research on Face Recognition System Based on Parallel PCA Algorithm
ZHAO Ya-peng
(College of Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China )
Abstract:In order to solve the problem of fast and accurate face recognition, a face recognition method based on parallel PCA algorithm is proposed. Using principal component analysis (PCA) method can reduce the dimension of features, easy to implement, training time is short, the design and implementation of a parallel algorithm for PCA, first of all according to the whole image to extract the 4 part of face images, then the whole image and 4 partial images at the same time by the same structure of the PCA model of learning, face feature vector extraction, the Euclidean distance for matching calculation of the test images and training images, finally through the test image with the five level parallel PCA model identification results are weighted decision, in order to achieve face recognition. Using the image data of the ORL face database , the simulation results in Matlab show that the method has a great degree of improvement in accuracy, the recognition speed is relatively fast, with a high degree of robustness.
Key words:PCA algorithm;Face recognition;Five level parallel PCA model;Weight calculation;Mean filter
1 概述
隨著智能終端設備(手機、Pad、門禁等)的不斷發展,身份識別已經成為我們日常生活的重要組成部分,身份驗證技術被廣泛應用于各個領域,特別是人們對于個人隱私信息的保護,使得身份識別再次成為關注的焦點。人臉識別作為身份識別的重要手段之一,因其具有識別率高、采集性強、接受性高等特點,在身份識別的各類方法中具有獨特的優勢,成為了目前比較熱門的研究領域。
目前,卷積神經網絡(Convolutional Neural Networks)是圖像識別領域最重要的研究熱點,而且在語音識別領域也取得了不錯的效果,但是卷積神經網絡的整個訓練過程比較費時,而且實現相對復雜,而基于PCA算法的人臉識別技術因其自身存在的許多缺陷,一直沒有被廣泛應用,但該方法實現簡單、學習速度較快,因此,本文主要研究改進的并行PCA算法,以彌補傳統PCA算法在人臉識別領域的不足。
本文提出的基于并行PCA算法的人臉識別技術,首先對原始圖像進行預處理,如灰度歸一化和中值濾波等操作,以消除圖像噪聲、光照等因素造成的影響,使得特征提取更加準確可靠。然后,通過5級并行PCA模型獲取數據的不同特征矩陣,然后將訓練圖像和測試圖像分別進行子空間的投影,利用歐氏徑向基函數(Euclidean Radial Basis Function)進行人臉的匹配,最后根據訓練得到的權值向量進行加權決策。本文通過ORL人臉數據庫的仿真實驗證明,該算法的效果明顯好于PCA算法。
2 并行PCA算法
PCA(Principal Component Analysis)即主成分分析技術,PCA是基于K-L變換的統計學分析方法,是多元分析中常用的方法,其基本思想是將高維數據投影到低維空間,主要過程在于特征值的計算和矩陣的降維。將PCA應用于人臉識別時,首先將圖像轉化成矩陣向量,然后進行矩陣的奇異值分解(Singular Value Decomposition),將高維向量通過計算得到的特征向量矩陣投影到低維的向量空間,從而減少數據的計算量。
2.1 基于并行PCA算法的人臉識別流程
本文中提出的并行PCA算法,正是基于上述的PCA算法,通過建立5級的PCA算法模型同時進行數據特征的學習,使得最終的人臉識別準確率得到進一步的提高,具體的人臉識別流程如圖1所示。
2.2 并行PCA算法的實現的步驟
2.2.1 人臉圖像的預處理
首先,需要把ORL人臉數據數據庫的所有訓練圖像大小進行歸一化,并轉化為像素矩陣,矩陣大小記為,為矩陣的行數,為矩陣的列數。之后利用均值濾波和灰度歸一化進行圖像的去噪處理,以消除光線等問題對圖像造成的影響,以方便后期的特征提取等操作。
2.2.2 人臉圖像的PCA降維
根據PCA的原理,可以將每一張圖像看成是一個高維的向量,所有的圖像可以看成是這個高維空間中的一點,PCA要做的就是找出另外一個盡可能多的反應圖像特征的低維空間。
假如樣本由n張大小為p*q的人臉圖像組成,那么每一張圖像可以保存為一列向量,向量維數是p*q,真個樣本可以看成是一個行數為n,列數為p*q的矩陣記為矩陣A。
根據上述過程,首先求出矩陣A的協方差矩陣,然后求出協方差矩陣的特征值,選取前m個最大的特征值,然后求出對應的特征向量,組成一個特征矩陣。通常所說的“特征臉”就是這些特征向量,而特種功能矩陣就是“特征臉”空間或者說子空間。然后可以將每一張圖片投影到該子空間,得到了每一張圖像的投影矩陣(l*m)。
2.2.3 人臉圖像的識別
對于待識別的圖像,也可以看成是一列向量,投影到子空間得到一個投影矩陣,然后一一求出這個投影矩陣與樣本圖像投影矩陣最相似的。然而有可能該人臉不是人臉庫中的,所以最相似的人臉也不一定是同一個人臉,還需要設置一個閾值來判斷待識別人臉是否是人臉庫中的。
人臉識別部分正是基于上述的PCA算法,在本文所提出的并行PCA模型中,是由5級的PCA模型同時進行人臉識別這一操作,最后根據訓練得到的權值向量進行決策,通過使用多個PCA模型,從而使得整個識別過程的準確率得到進一步的提升。
3 系統設計及實現
3.1 系統總體設計
本文中所提出的基于并行PCA算法的人臉識別系統,包括人臉圖像采集模塊、圖像預處理模塊、識別模塊。人臉圖像采集模塊主要是采集訓練圖像數據和測試圖像數據,并由原始圖像提取出4幅與之對應的部分圖像;圖像預處理模塊主要就是進行圖像歸一化和圖像的去噪工作,圖像的歸一化包括大小歸一化和灰度歸一化,可以使用比較常見的直方圖均衡化等技術,而圖像的去噪可以使用中值濾波技術,以去除比較常見的高斯噪聲等;人臉識別模塊是基于5級相互獨立的PCA模型進行特征值的學習和比對,而且通過訓練得到的權值向量進行最終的是臉識別決策。整個系統的實現是基于Matlab進行仿真實驗的,實驗數據來自劍橋大學AT&T實驗室創建的ORL人臉數據庫。
3.2系統功能模塊實現
3.2.1人臉圖像采集實現
圖像采集模塊主要就是將存儲在本地的圖像文件通過Matlab的imread函數讀入矩陣中,以方便后期的PCA操作,其核心語句為Image{t}=imread([[filepath,FilDir(ii).name],'\',ImDir{ii}(jj).name]);
使用上述語句即可讀入訓練數據和測試數據文件。
3.2.2 圖像預處理模塊
該模塊的主要任務就是利用中值濾波和直方圖均衡化進行圖像的去噪工作,以消除不同光照和圖像噪聲的影響,提高準確率。其核心代碼為:
S1=zeros(1,256);
for i=1:256
for j=1:i
S1(i)=GP(j)+S1(i);
end
end
S2=round((S1*256)+0.5);
for i=1:256
GPeq(i)=sum(GP(find(S2==i)));
end
3.2.3 識別模塊
圖像經過之前的預處理之后,需要將圖像矩陣轉化為列向量,一幅圖像就是一列向量,整個訓練圖像構成了整個特征空間矩陣,測試圖像也會轉化為一列向量,之后會利用矩陣之間的運算進行圖像的分析計算。識別模塊的工作就是根據測試圖像和之前所有的訓練數據進行對比,查找到與之最相似的圖像,實驗的結果如圖2所示。
4 結論
PCA算法作為傳統的人臉識別算法,因其自身存在的許多缺陷而沒能發揮較好的作用,但是其自身具有其他算法所不具有的特點,本文設計的并行PCA算法雖然是基于PCA算法,但是借鑒了卷積神經網絡的多層結構,而且使用加權操作進行最終人臉識別的決策。基于ORL人臉數據庫的測試結果表明,該并行PCA算法的準確率和魯棒性均得到了進一步的提升,與其他的單獨PCA算法具有十分明顯的優勢。
參考文獻:
[1] 張利芳. 基于PCA算法的人臉識別系統研究[D].太原:中北大學,2015.
[2] 楊海燕,蔣新華. 基于并行卷積神經網絡的人臉關鍵點定位方法研究[J]. 計算機應用研究, 2015, 32(8): 2517-2519.
[3] 楊穎嫻. 基于PCA算法和小波變換的人臉識別技術[J]. 微電子與計算機, 2011, 28(1): 92-94.
[4] 段寶彬,韓立新. 改進的卷積神經網絡及在碎紙拼接中的應用[J]. 計算機工程與應用, 2014, 50(9): 176-181.
篇3
關鍵詞:人工智能;科技情報;自動感知
中圖分類號:TP18文獻標志碼:A文章編號:2095-2945(2020)32-0057-02
Abstract:Fromtheperspectiveofartificialintelligence,peoplerequireasignificantimprovementintheaccuracyofscientificandtechnologicalinformationservices,sothatitsvaluecontinuestorise,bringingchallengesandopportunitiesforintelligencework.Bysummarizingthecontentsofartificialintelligenceandscientificandtechnologicalinformation,combinedwithartificialintelligencetechnology,thispaperstudiestheautomaticperceptionofscientificandtechnologicalinformationneedsconcerningthekeypoints,contentperceptionandotheraspects,highlightingthewisdom,intelligenceandefficiencyofscientificandtechnologicalinformationwork,andoptimizingtheautomaticperceptionscheme.
Keywords:artificialintelligence;scientificandtechnologicalinformation;automaticperception
前言
當前科技情報服務對象不僅局限于特定的行業和領域,已經逐漸滲透至某一技術和個人,情報機構只有提升情報分析和反應能力才可以滿足新需求。因此,機構有必要加強對用戶需求的感知度,依托人工智能技術構建科技情報的感知框架,提升感知工作的合理性和高效性,進而挖掘科技情報感知領域的價值。
1人工智能及科技情報感知概述
1.1人工智能分析
人工智能又稱AI,伴隨著計算速度、核心算法的優化,該技術已經在神經網絡、自然語言、機器學習等方面趨于成熟。當前人工智能技術可以定制個性化任務,結合不同的環境響應個體需求,制定解決方案[1]。因此,人工智能技術能夠快速處理海量數據,若人類智力水平已無法滿足嚴苛工作要求,可以借助人工智能技術處理復雜工作。同時,科技情報感知模塊屬于綜合預測過程,因此有必要結合人工智能技術制定科技情報感知方案,實現情報工作向智慧化、個性化、精準化方向發展。
1.2情報感知分析
科技情報感知主要是工作人員針對采集到的數據完成處理、分析,進而滿足受眾對于情報的需求,并對今后其發展過程進行預測。學者劉記曾指出,依托科技情報感知工作可以為實現國家治理體系和治理能力現代化提供支持,加快情報刻畫、情報感知以及情報響應能力的建設進程。其中,情境感知的研究具有一定復雜度,G.Chen通過調查情境信息、情境類型、情境傳播等模型和系統,分析情境感知的應用程序,得出情境感知是領域普適學習的關鍵。例如,借助情境感知可以為用戶提供體溫、運動路徑、溫度等方面的服務。
因此,科技情報感知工作對于我國情報治理、預先感知等方面影響較大,結合人工智能技術創新科技情報感知模塊已是大勢所趨。當前大數據時代科技情報已經不僅停留于文獻領域,正逐漸向多種數據源模式發展,要求科技情報軟硬件不斷升級優化,數據存儲和處理水平逐漸升級,進而滿足社會對情報數據的需求。
2人工智能視域下科技情報需求自動感知研究
2.1融合關鍵點
(1)創新驅動。當前科技情報需求逐漸向科技創新領域發展,依托我國創新驅動的發展戰略,基于科學技術完成升級和發展。將科學技術和科技情報相結合后,情報工作的創新性較強,具有數字化和智慧化優勢,并突出情報工作的個性化和精準性。因此,依托人工智能技術完成科技情報的自動感知十分關鍵,是當前科技發展的必經之路。
(2)前瞻性定位。新時期資源的網絡化和數字化發展為科技情報研究工作提供大數據支持,可以在海量數據的收集、分析、處理方面發揮優勢。傳統的數據研究方式很難在大量數據的基礎上提升情報研究質量,同時會增加研究人員的任務量。且每位工作人員自身的專業知識、情報敏感度、知識狀態存在差異性,導致最終得出的情報結果不同甚至差異化較大。應用人工智能技術完成科技情報的自動感知十分重要,可以突出工作的準確性、高效性和穩定性。因此,將新興人工智能技術和傳統情報服務工作相融合是現代情報領域的關鍵,如自動獲取和加工情報、高速處理文本信息、人工智能決策平臺、依托語義內容的科研成果評價等[2]。
2.2內容感知
(1)感知系統分析。大數據背景下,科技情報預測和傳播功能受到重視和應用,屬于科技領域的研究熱點,可以對競爭、合作、研究方面進行正確的價值判斷。科技情報感知主要依托可靠、豐富的數據,借助“互聯網+大數據”模式獲取信息,在多種資料中得到關鍵的信息和數據,進而完成科技情報的感知工作。同時,數據源具有冗余度高、形式多樣、存儲量大的優勢,因此能夠落實科技情報感知工作,篩選數據源、除去冗余數據、分析剩余有效信息。借助數據集模式與知識儲備庫、感知數據庫一同為感知過程提供信息支持。內容感知系統內的數據源并非固定不變,且信息的更新速度較快、技術淘汰時間較短,因此內容感知是實時更新、持續變化的數據系統。基于相關輔助項目,幫助用戶了解工作內容。例如,借助“科技情報產品報告”為感知系統研究和應用提供支持,該報告可以幫助用戶了解系統,提前評估系統實際能力,便于用戶針對性提出情報需求。
(2)系統實現模式。a.數據源存儲。若想發揮科技情報的自動感知作用,系統內需要具備大容量數據集合,進而為感知產品提供分析支持。同時,數據處理過程中對于信息查詢、存儲挑戰較大。因此,本課題結合Neo4j數據庫、互聯網技術提升數據處理和存儲效率,提高系統適應水平,保證其良好的查詢效率。Neo4j數據庫主要劃分為兩類應用模式:服務器模式、內嵌模式。本課題利用內嵌模式,借助Java-API,將Neo4j數據庫和圖模型相互整合。由于API的特點是數據結構靈活,因此可以通過直接編碼的模式和圖數據庫完成交互操作。b.數據源分類。若想對數據源完成自動分類,建議識別數據源的結構功能。例如,利用機器學習、詞匯特征等方式劃分數據源的功能及結構。依托數據源要素、類型詞匯特點、詞匯分布特征等方面,依托神經網絡內分類器訓練模式,圍繞領域技術、專題、情報報告、組織數據庫等方面對數據源進行分類[3]。c.構建任務抽取模型。結合用戶需求抽取目標任務可以充分發揮科技情報的自動感知優勢,優化RNN模塊。在研究階段利用Bi-LSTM-CRF、卷積網絡模型抽取數據源,并借助長短時雙向記憶模型化解RNN梯度爆炸、消失情況。抽取模型內的輸入數據是卷積,包含知識元素、句子、詞等特征向量,而輸出數據則依托(Conditionalrandomfield)條件隨機得到結果完成預測。此模型借助多元組的方式展示數據源抽取結果,圍繞數據源性質、事項、主體、依據、對象等要素進行連接。
2.3情境感知
(1)情境感知系統。情境感知系統內部因素種類較多,且科技情報感知階段需要依據情境完成,并對感知結果造成影響。因此,在開展科技情報感知工作時,建議對特定用戶完成重新評估。同時,情境感知在情報感知工作中十分關鍵,若忽視結果會對外部情境產生較大影響,使預測工作喪失精準度。因此,應基于外部情境條件定位事物發展方向,得到精準感知結果,發揮情報前瞻性優勢。其中在獲取情境數據時應關注“小數據”,即初始結構化數據,此類資源雖數量較小,但是內部包含價值信息,可以獲取歷史情境信息。此外,問題情境應圍繞橫向和縱向兩個層面分析,橫向維度是梳理本層實際情況,針對性選擇研究方法和處理方式;縱向維度則依托時間節點理清情境信息。
(2)系統執行方案。情境感知系統建設主要內容是借助科技手段獲取某一情境內的數據并完成融合。因此,情境感知技術實際上是借助人工智能中傳感器等技術,依托計算機感知當前情境,完成感知應用、智能識別、決策支持,具有無干擾的優勢。情境感知包含情境獲取、處理、應用三個階段。其中,情境獲取主要依靠傳感器終端獲取設備關聯、用戶關聯、資源關聯、環境關聯情境,并將上述情境信息轉變為數字信號,利用嵌入系統完成判斷和處理;情境處理過程則借助建模的方式控制情境信息,構建信息數據庫。整合情境感知信息并協調對應的組合,控制資源分布并將其嵌入至感知數據庫內;服務應用階段相當于人工智能處理模塊,可以結合用戶需求提供合理服務。
2.4需求-反饋機制
(1)工作過程。需求-反饋機制實際上可以體現用戶和人工智能間的關聯性,屬于科技情報感知的關鍵環節,包含自動感知信息、數據、產品模塊。依托人工智能技術,通過AI方式減輕工作人員任務量。其中,AI能夠智能化處理多領域工作,如醫療、教育、駕駛、金融、安防等。在科技情報感知領域引入人工智能技術可以準確、高效、及時地開展情報工作,提升工作效率、減少決策偶然性、加快數據分析處理速度。同時,科技情報感知工作的主體是用戶,首先需要將其對產品的需求發送至AI處,其次借助人工智能模塊分析、整合內外感知數據庫信息,最后向用戶反饋情報產品和相關結果。
(2)情報感知產品。情報感知產品主要結合用戶產品需求,依據感知數據庫內的條件因素預測今后用戶對于情報產品的需求,進而在后續工作中有針對性地向用戶推送產品信息,為科技情報工作的可持續發展提供支持。因此,人工智能和科技情報感知工作相結合可以充分發揮自動感知優勢,降低對工作人員決策的依賴性。專業人員依據多種數據源進行分析與評估,最終得出精準的感知結果。同時,人工智能技術的應用可以自動形成情報感知產品,并向用戶推送反饋數據,由主動感知向自動感知發展,契合新時期情報3.0的發展趨勢,加快國家科技決策和科技創新發展進程。
- 上一篇:農村建筑垃圾管理辦法
- 下一篇:餐廚垃圾回收