產經 > 科技

深度學習:人工智慧進入應用階段

中国证券网
2017-03-31 10:31

已收藏


深度學習是機器學習研究中的一個新領域,其過程是建立和模擬人腦進行分析學習的神經網路,從而模仿人腦的機制來讀取和分析資料。深度學習被視為當前最接近人工智慧的機器學習方法。

  2016年初,採用神經網路與深度學習的AlphaGo戰勝人類圍棋高手,2016年末2017年初,化名Master的AlphaGo在網路平臺上橫掃中日韓棋壇,取得60連勝輝煌戰績。

  在AlphaGo之前,深度學習已開始應用於圖像、聲音和文本的識別以及機器翻譯。在人工智慧被提出半個世紀之後,人們終於看到了人工智慧進入應用階段的曙光。

  □鄧 洲

  從人機大戰說起

  從體力上看,機器早早就超過人類,但驕傲的人類覺得在智力上更勝一籌。這種情況似乎正在發生變化,在人機智力對抗中,人類開始處於下風。

  第一回合:人類險勝

  人與電腦的對抗可以上溯至20世紀70年代,最早是電腦技術人員在實驗室一種休閒娛樂。隨著電腦速度的不斷提高,在整個20世紀80年代和90年代的家用電視遊戲機和電腦遊戲中都有很多與電腦對抗的棋牌遊戲,普通玩家和電腦的對決有輸有贏,而在職業選手或者業餘高手面前,虛擬對手不堪一擊。

  1996年2月,由IBM開發的超級電腦深藍(Deep Blue)挑戰國際象棋世界冠軍卡斯帕羅夫,在經過7天的比賽之後,深藍以2:4告負。這是歷史上第一次由人工智慧挑戰世界頂級棋類選手,深藍輸了比賽卻引起全球對人工智慧發展的高度關注,這台冷冰冰的機器在比賽中並沒有讓世界冠軍好受,卡斯帕羅夫雖然最終贏得比賽,但也宣告了人機對抗中人類勝利的歷史的結束。

  第二回合:人類完敗

  1996年到2016年的二十年,人類與機器之間進行了三次標誌性的競賽,均已人類失敗告終。

  1997年,IBM深藍再次挑戰卡斯帕羅夫,雖然離上一次比賽僅僅一年的時間,但世界冠軍這次招架不住了。最終,深藍以3.5:2.5贏得比賽,成為首個在標準比賽時限內擊敗國際象棋世界冠軍的電腦系統,同時也標誌著人機智力對抗中,機器已經實現逆轉。

  2011年,IBM開發的由90台Power 750伺服器組成的集成伺服器沃森(Watson)參加了美國著名綜藝答題節目《危險邊緣》。在三天的比賽裡,沃森最終擊敗最高獎金得主魯特爾和連勝紀錄保持者詹寧斯,獲得了100萬美元的獎金。這是人工智慧在綜藝節目上第一次擊敗人類選手獲得最高獎金。相對于深藍,沃森需要處理的資訊更加複雜,在一些提示資訊相對較少的問題面前表現確實不如人類,但是依靠強大資料處理能力和運算速度上的優勢,人類冠軍最終不敵沃森。

  如果說1997年深藍的勝利和2011年沃森的勝利主要依靠機器高速的運算能力,人類仍然在模糊資料識別和處理、交流、情感表達等方面勝過機器,特別是,人類的學習能力仍然是機器難以掌握的技能。然而到2016年,這一切都發生了改變。2016年伊始,穀歌宣佈其倫敦子公司DeepMind開發的AlphaGo機器人以5:0大勝歐洲圍棋冠軍樊麾,隨後又以4:1比分戰勝世界冠軍韓國圍棋國手李世石。

  從2016年底開始,穀歌給世界開了個一個大玩笑,AlphGo化名Master在圍棋網路平臺上所向披靡,將中日韓的一個個頂尖棋手斬于馬下,取得了60連勝輝煌戰果。圍棋是迄今為止最複雜的棋類遊戲,如果機器能夠在圍棋上戰勝人類頂尖選手則意味著至少在棋類遊戲上實現了對人類的全面超越。

  加入神經網路的AlphaGo與前輩深藍、沃森的顯著區別是:深藍和沃森都是“教”出來的,IBM的設計員和程式師們從國際象棋大師那裡獲得象棋的各種資訊,通過一系列演算法提煉出特定的規律,再通過預程式設計灌輸給深藍;沃森也是通過預先設置的邏輯運算理解題目含義並給出可能正確的答案。

  相比較,AlphaGo是自己“學”出來的——DeepMind的程式師為它灌輸的不是邏輯規則和方法,而是類比人腦的學習能力,AlphaGo通過自己不斷的訓練和研究學會圍棋並掌握各種技巧,在比賽中也是根據對手的棋路判斷最優的策略,這一過程和人類學習圍棋並成為高手是相同的。

  第三回合:休戰、共贏

  今後,人與機器的比賽還會以更加喜聞樂見的形式出現在各種場合,但AlphaGo已經讓絕大多數人認識到人工智慧時代即將到來,以及承認機器終將超越人類智慧的現實,人與機器之間不需要再繼續比賽,合作才是人與機器關係的未來。

  無論是深藍、沃森還是AlphaGo,其研發的目的遠不止贏得一場比賽。IBM早將深藍和沃森系統應用於藥物研發、金融風險計算等領域。至於輸給深藍的卡斯帕羅夫,並沒有因為失敗而一蹶不振,後來他又拿下了幾乎所有著名國際象棋比賽的冠軍,最後退出國際象棋界後又進軍政界。輸給AlphaGo的李世石人氣大漲,參加各種訪談和綜藝節目,圍棋在韓國年輕人中進一步升溫。人機大戰在比分上表現為人類的完敗,但最終的結果是大家都從中獲利。

  電腦怎樣思考:控制派vs仿生派

  AlphaGo與深藍、沃森的區別是採用了神經網路,實現了深度學習。那麼神經網路與深度學習到底是什麼?它們的出現對電腦和人工智慧的發展到底起到了多大的作用呢?

  要瞭解電腦怎樣思考,不得不提到人工智慧之父——阿蘭·麥席森·圖靈,這位生於20世紀初,直到42歲英年早逝時也沒有看到一台真正意義上電腦的數學天才,提出了著名的“圖靈實驗”,即如果第三者無法辨別人類與人工智慧機器反應的差別,則可以論斷該機器具備人工智慧。

  圖靈之後,對人工智慧的研究分化為兩大派別:一是強調思路模擬的控制派;二是強調自我意識的仿生派。簡單而言,控制派認為人工智慧就如同一個專家會議,希望通過完美無缺的邏輯來實現思考;而仿生派認為人工智慧就是人腦,人腦怎樣思考,電腦大腦就怎麼思考。

  1948年,美國應用數學家諾伯特·維納的著作《控制論》出版,他開啟的控制論(cybernetics)被稱作20世紀最偉大的科學成就之一,同時也被尊為人工智慧中控制派的鼻祖。維納的學生邁克爾·阿比蔔出版了控制論的科普讀物《大腦、機器和數學》,並隨後創辦了麻省理工大學電腦系。

  1951年,後來獲得第一屆圖靈獎的美國科學家馬文·明斯基創造了一台學習機——Snare,從中發現了在當時看來神經網路致命的弱點。明斯基的另一個重大貢獻是與另兩位元在電腦領域聲名顯赫的人物——麥卡錫、香農創辦了第一個人工智慧學術性團體“達特茅斯會議”。2016年初,明斯基去世,享年89歲,三天以後,穀歌宣佈採用深度學習的AlphaGo戰勝歐洲圍棋冠軍。

  如果要追溯仿生派的起源,則早在圖靈實驗提出之前的1943年,美國科學家麥卡洛可和皮茨就發表了類比神經網路的論文。1949年,加拿大心理學家赫布提出了著名的“赫布理論”,即突觸前神經元向突觸後神經元的持續重複的刺激可以導致突觸傳遞效能的增加,這一理論直到2000年才在動物實驗中被證實。1958年,美國實驗心靈學家羅森布拉特在電腦上成功類比了被稱為“感知機”的神經網路模型。感知機能夠處理一些簡單的視覺信號,雖然還非常粗糙和初級,但可以說第一次實現了對人腦的成功模擬。

  可惜的是,在羅森布拉特發明“感知機”後長達20多年的時間裡,神經科學和資訊科學並沒有很好的結合,兩者各有成就,但仿生派始終不敵控制派。直到20世紀80年代,仿生派才進入一個繁榮時期,其中以1982年霍普菲爾德提出了遞迴神經網路,和1986年魯姆哈特和麥克萊蘭提出了具有里程碑意義的BP神經網路為代表。

  在20世紀90年代,互聯網興起和普及,大批電腦科學家投入到有巨大市場和經濟效益的互聯網相關研究中,無論是控制派還是仿生派取得的成就都被互聯網的高速發展所掩蓋,當然,互聯網作為新的信息技術手段也對人工智慧的進步提供了全新的平臺。

  2006年,傑佛瑞·辛頓提出了反向傳播演算法和對比散度演算法,即“深度學習”,突破了明斯基在半個世紀前提出的神經網路存在的局限。2012年,斯坦福大學和穀歌秘密X實驗室用1000台電腦構建了全球最大的電子類比神經網路,該網路擁有10億個連接的人工神經網路“穀歌大腦”。實驗人員向神經網路展示1000萬斷(張)從YouTube上隨機提取的圖像,最後,系統在沒有任何外界干預的情況下,認識到了“貓”是什麼並成功分辨出貓的照片,準確率超過80%,這一事件為人工智慧發展翻開嶄新一頁,標誌著以“深度學習”為代表的人工智慧發展即將進入應用階段。

  開掛的機器學霸

  要真正理解神經網路、深度學習的原理需要高深的生物學、數學和電子資訊方面的知識,在很多專業性很強的書籍、文章中能找到答案。這裡,我們希望通過簡單的語言對神經網路、深度學習等相關概念進行通俗易懂的描述。

  1.對人腦的仿生:人工神經網路的構建

  人腦的神經元(神經細胞)由三個主要部分組成:樹突負責資訊的輸入、細胞體負責處理資訊、軸突則負責處理後資訊的輸出。當神經元接受到外界刺激時,經過內部的資訊處理,將結果輸出,這個過程看起來非常簡單,但卻是人腦思維形成的最基本過程。如果將演算法賦予電子元件(例如CPU),並通過信號通道將這些電子元件與感測器、輸入裝置以及相互之間進行連結可以類比出人腦的神經網路。電腦的硬體技術飛速發展,使得構建大規模的人工神經網路成為可能,在未來出現能夠比擬甚至超過人腦的人工神經網路是完全有可能的。

  以一個最簡單的對蘋果還是梨的判斷來說明神經網路工作的原理。顏色、形狀和氣味是判斷一個水果是蘋果還是梨所需要的最基本的特徵,當這些資訊通過視覺、味覺或者感測器進入神經元,人腦(或者電腦)根據以往的經驗,如果資訊表現為紅色、圓形、蘋果味,那麼最後的結果就是蘋果。

  這個過程看起來非常簡單,但對於一個未加訓練的人工神經網路來說,發生錯誤是難免的。例如,並不是所有的蘋果都是紅色,有的蘋果是黃色,和梨的顏色非常接近;有的梨的形狀和蘋果也很接近;嫁接的新品種蘋果梨到底算蘋果還是梨,等等。當這些因素出現時,對人工神經網路來說是巨大考驗,很容易給出錯誤的答案。

  如何減少上述情況出現導致的錯誤呢,這就需要深度學習的説明。

  2.對學習的仿生:深度學習如何開展

  在一系列殘酷的動物實驗之後,生物學家發現了人腦對外界刺激的識別是一個抽象和反覆運算的過程。例如,對一個靜止圖像的識別,最開始是對圖像主體物邊緣的識別,然後抽象到一些具體特徵,最後才是對各種特徵抽象和概念化以得到準確的意義。這一生物學發現意義重大,促成了人工智慧在21世紀有了突破性的發展。

  如果人腦的工作原理是從“淺層”的識別開始的,並將淺層識別的結果作為更高一層識別的輸入資訊,那麼電腦搭建的人工神經網路是不是也可以仿效人腦進行工作呢?答案是肯定的。1996年,康奈爾大學在收集的大量黑白風景照片中每張隨機提取16×16圖元的方格,然後從任意一張風景照片中再提取一個16×16圖元的方格進行比較,結果發現,包含物體邊緣的方格是最容易找到非常接近的方格的。換句話說,“邊緣”是識別一張風景圖片的起點。這一實驗證明對複雜事物的識別了從最基本“淺層”資訊入手是有效和可行的。類似的實驗後來被應用於語音辨識,同樣,“邊緣”是識別一條語音最基本的“淺層”信息。

  在一個單個神經網路,從資訊輸入到資訊輸出中間雖然有多個神經元,但都處於同一“層次”上,我們暫且稱之為“淺層神經網路”,以區別於“深層神經網路”。識別蘋果和梨貌似很簡單,但對於人工神經網路則需經歷一個複雜的過程。如果想讓一個單層次的神經網路發揮作用,一個方法是由人來告訴電腦形狀、顏色和味道資訊,神經網路只做最後的一次判斷。這樣的做法似乎很可笑,但並非完全無用。

  資訊管理和資料採擷中經常會使用到淺層神經網路,但前提是由資訊管理專業的學生手工或使用軟體將資料採擷的材料準備好,這就如同由人來説明人工神經網路判斷水果形狀、顏色和味道,通過人工參與彌補淺層神經網路局限性的方法。當人工智慧的應用範圍擴大,越來越多需要借助人工智慧説明的人員並非資訊管理專業的學生,淺層神經網路已經跟不上形勢和需要了。2006年,人工神經網路發展有了轉捩點,辛頓等研究人員提出了深度信念網路(Deep Belief Network,DBN),實現了對人腦多層神經網路資訊處理、分析和學習的模擬,這推動了人工智慧研究和應用向前邁進了一大步。

  多層次的神經網路是實現深度學習的基礎,那麼與傳統的神經網路比較,深層神經網路又哪些特點呢?深度學習又是如何在深層神經網路上展開的呢?

  與傳統的神經網路相同的是,深層神經網路也包括輸入層、隱層和輸出層,也只有相鄰層級之間的神經元有連結通道,同一層及跨層之間是沒有連結的。區別在於,深層神經網路具有更多層級數量,並且具有更有效的演算法,更加接近人腦的結構,這使得深層神經網路能夠處理更加複雜的輸入資訊,深度學習就是在這個多層級的人工神經網路上進行的。

  在搞清楚深層神經網路如何進行深度學習之前,還要區別兩個重要的概念:監督學習和非監督學習。簡單而言,監督學習就是有人指出學習結果正確與否的學習。想像一下,當幼兒第一次看到蘋果的時候,會建立一個包含蘋果各種特徵的概念;當下一次再看到蘋果時,會加入對蘋果新的概念,例如蘋果並不都是紅色的,還有黃色的、白色的、綠色的蘋果,還有多種顏色混合的蘋果。這期間,有可能會看到梨、柳丁、乒乓球等與蘋果在某些特徵上相似的物體,幼兒可能把這些東西也認為是蘋果,家長會指出錯誤,幼兒調整對蘋果的認識,判斷越來越準確。是不是很簡單,這其實也是半個多世紀之前“感知機”的工作原理,通過不斷優化不同輸入資訊的權重以實現更加準確的判斷。

  上述監督學習的過程,很容易忽略一個重要的前提條件,機器為什麼知道通過形狀或者顏色去判斷一個物體是不是蘋果,形狀、顏色、氣味是人基於經驗對蘋果賦予的“特徵”屬性,但機器並不知道這些就是蘋果的特徵。過去,一般由人來幫助機器先期定義“特徵”,但由人參與對“特徵”的選取是一件極其繁瑣和耗費時間的工作,並且在面對未知事物的時候,一開始也無規律可循。在輸入資訊越來越複雜的情況下,人工選取特徵已經難以為繼了,由機器自動學習特徵似乎是更好的做法,多層神經網路上進行的非監督學習能夠完成這一過程。

  非監督就如同一個沒有家長在旁邊指導的幼兒學習過程,其目的是推斷出資訊的內在資料規律。例如,幼兒在看到很多次蘋果之後,會把具有一些圓形、紅色、特殊味道的一類物體歸為一類(雖然並不知道這就叫蘋果)並與其他的水果區別開來,這個過程一是實現了聚類,更重要的是完成了特徵學習,幼兒知道應該抓住哪些“特徵”來判斷一個物體是不是蘋果。機器的非監督學習有類似的過程,在多層人工神經網路上對每一層級進行非監督學習,這是深度學習與傳統神經網路最大區別,這一過程被稱作特徵學習。

  我們可以總結出一個簡化的深度學習過程:在深層神經網路中,採用無監督學習對每一層逐層進行訓練,讓機器不斷學習這一層次需要識別的特徵;每一層訓練的結果作為更高一層集的輸入資訊直至最頂層;在最頂層,使用監督學習自上而下對各個層級的參數、權重、模型、演算法進行微調。這一過程反復進行,直到達到一定準確度。與傳統的機器學習比較,深度學習能夠不需要人類説明提取特徵,這提高了學習的自主性和學習效果。

  在實際應用中,對圖像的識別、對聲音的識別,或者像AlphaGo那樣學習圍棋採用的具體方法有很多,但大致的原理是相同的,只是過程和演算法更加複雜。

  會學習的機器能有多智慧

  這麼多科學家的努力、巨額的研發經費投入,結果就是具備一個三歲小孩就能夠熟練掌握的技能——把蘋果和梨區分開來,這是不是有點得不償失。千萬不要低估這看似簡單的一步,要知道,在人不介入的情況下,使機器準確區分蘋果和梨,幾代科學家已經為之奮鬥了半個多世紀且到目前為止也不能做到100%準確。電腦在運算速度上具有遠超過人類的優勢,且這種優勢不斷擴大,其“學習”的速度也是驚人的,這使得人工智慧在多個領域進入應用階段,也成就了本章開篇提到的AlphaGo。

  例如,在圖像和語音辨識領域,穀歌、微軟、IBM、百度等公司近年來加強了深度學習的研究和商業應用。穀歌採用深度學習技術在電腦視覺挑戰比賽中刷新了分類和偵測的紀錄,且比之前的紀錄提高了兩倍多。穀歌在其視圖軟體中嵌入人工智慧模組,實現了對字元、人臉、地標、等進行幾乎精確的識別。

  微軟宣佈其圖像識別系統的錯誤率僅為4.94%,這不僅打破了之前百度創造的5.98%和谷歌創造的6.66%紀錄,甚至低於人類在歸類識別時5.1%的錯誤率。百度也發佈了基於深度學習的語音辨識系統“Deep Speech”,該系統能夠模仿人類大腦新皮層中的神經活動,出錯率比穀歌、微軟和蘋果的系統低10%以上。

  深度學習一個有意思的應用是預測分析。與傳統的邏輯推導不同,通過深度學習的預測分析結果令人驚訝但卻異常準確。2014年巴西世界盃期間,各方人士都在預測比賽結果,在小組賽後的15場淘汰賽中,微軟利用深度學習的方法的預測結果全部準確無誤,而穀歌的預測也猜中了其中14場比賽結果,這樣的預測準確率顯然要比2008年法國世界盃的章魚保羅,和一貫烏鴉嘴的貝利靠譜得多。

  深度學習是機器學習的新浪潮,也是人工智慧發展的一個里程碑,雖然深度學習已經在語音辨識、圖像識別、預測分析、機器翻譯等領域小試身手,但客觀上講還處於繈褓階段,無論是理論研究還是工程化商業化還面臨巨大的難題。誰也不能保障深度學習在未來是否能夠成為人工智慧最基礎的方法,或許會有新的更好的技術替代深度學習,但是可以肯定的是,人工智慧的夢想不再遙遠,機器將在不久的將來像人類一樣思考。

評論區

最新評論

最新新聞
點擊排行