帳號:
密碼:
CTIMES / 文章 /   
人工神經網路打開AI應用新局
成就以任務為導向的人工智慧

【作者: 王岫晨】   2019年02月26日 星期二

瀏覽人次:【2149】
  


說起人工智慧(AI),就不能不提起人工神經網絡(ANN)這件事。AI與ANN是電腦運算發展史上,最能激動人心且又彼此相依的兩大領域。而這兩者之間的差異,十分值得人們去深入探討。而其最關鍵的區別,就在於神經網絡是實現人工智慧的墊腳石。


人工智慧是一個非常寬廣的領域,最主要的目標就只有一個:創造智能化機器,事實上,這樣的目標已經多次實現在我們的生活中,當然這將取決於一般人如何去定義機器智能。儘管在過去的歷史上,我們的超級電腦已經可以贏得益智節目《Jeopardy》(超級電腦華生),並可擊敗國際西洋棋冠軍(超級電腦深藍),但人工智慧的真正目標,通常應該是被視為是對一般廣泛智能的追求,或者可以應用於各種不同情境問題的智能。


到目前為止所建立的許多人工智慧,其實都是為了某一種目的而建構的。比如用人工智慧來打乒乓球,或者是面對某種危機來給予智能化主導判斷的機器人。這些都是電腦工程師與科學家針對某項特定任務所創造專屬電腦的必然結果,他們最終目的是完成這些特定任務,例如贏得棋局,而不是其他任務。


解決以任務為導向的AI問題

而現在,人工智慧當道,只不過如果人工智慧都只是用來下棋或打乒乓球的話,未免也太浪費運算資源了。因此科學家也開始思考,為了解決以任務為導向的AI問題,電腦科學家就必須要開始使用人工神經網絡。


一般來說,人們大腦的智能是由生物神經網絡所組成,這些網絡根據人們的感知和外部刺激來建立關連。舉一個非常簡單的例子,例如燒傷所帶來的痛苦。當燒傷的情況第一次發生的時候,在大腦中就會建立起一個連接,這樣的識別會被標示為火焰(並衍生包括火焰、煙霧、熱量等)的感覺訊息,並將其與疼痛的感覺關連起來。



圖一 : 神經網絡背後的基本意義,就是模擬電腦中的大腦互連單元,以便它可以從環境中學習、識別不同的情境,並且做出類似於人類的決策。
圖一 : 神經網絡背後的基本意義,就是模擬電腦中的大腦互連單元,以便它可以從環境中學習、識別不同的情境,並且做出類似於人類的決策。

這樣的關連,可以讓一個人從很小的時候,就學會如何避免被燒傷的方法。透過這種相同的神經網絡脈絡,我們就可以做出很多的一般性學習,例如:冰淇淋冰冰甜甜的味道很好。甚至還可以做出演繹性的跳躍思考,例如看到烏雲來了,就知道可能快下雨了,或者股票市場在12月總是會出現反彈力道。儘管這些跳躍思考並不總是正確的,例如也有不好吃的冰淇淋(麻油雞口味??),12月也有下跌的股票等。然而透過經驗的累積與修正,就可以允許自適應的學習方式。


將電腦打造成為通才

人工神經網絡試圖透過一個簡單框架程序的建構,來響應問題的本質,並接收有關它如何處理的反饋,然後進一步在電腦上重建這個學習系統。電腦可以透過數千次執行相同的問題來優化其響應,並根據其收到的反饋來調整其響應。在這之後,再給予電腦一個不同的問題,它便可以採用與前一個電腦相同的方式來進行處理。透過這種改變電腦已經學習的響應問題與解決方法的數量,電腦科學家就可以將這樣的電腦改造成為一個通才。


走到這一步,就開始令人聯想到電腦正在一步步接管世界並管理人類,在很多電影中都已可見到類似的場景。儘管如此,但神經網絡的發展還有很長的一段路要走。在神經網絡上所測試的問題,都是透過數學的方式來表達。換句話說,人們不能把花拿到電腦前,並讓它透過氣味來猜測可能的顏色,因為氣味必須以數字來表示,然後計算機再將這些數字記錄在記憶中,以及哪一種花的圖像可以散發出這種氣味,這一切都必須要全部進行關連。


從這樣看來,人工神經網路透過不斷的資訊輸入(好比嗅覺),並且再從這些輸入資訊中去進行學習的能力,將可以獲得更多,最終並將可能產生出人們口中所稱的真正人工智能。


神經網路基本結構


圖二 : 卷積神經網絡已經存在多年,並受到生物行為模式的啟發,特別是大腦如何理解從眼睛接收到的信號。
圖二 : 卷積神經網絡已經存在多年,並受到生物行為模式的啟發,特別是大腦如何理解從眼睛接收到的信號。

神經網絡背後的基本意義,就是模擬電腦中的大腦互連單元,以便它可以從環境中學習、識別不同的情境,並且做出類似於人類的決策。基本的神經網絡包含大約數百萬個人工神經元。這些單元分層排列,每層連接到另一側。其結構大約分成以下幾個部分:


●輸入單元:可從外部環境接收訊息。


●隱藏單元:最終輸入到輸出單位。每個隱藏單元都是其輸入的壓縮線性函數。


●輸出單元:這些資訊表示網絡應如何反應最近所獲取的訊息。


大多數神經網絡都是完全連接。這意味著每個隱藏單元和每個輸出單元都連接到每層另一側的每個單元。每個單元之間的連接稱為「重量」(weight)。這裡所稱的重量可以是正的也可以是負的,正或負取決於它對另一個單元的影響程度。通常來說,較高的權重對互連單元具有較高的權限。


當神經網絡被訓練,或者在訓練開始之後,將使用不同的輸入單元將不同的訊號模式饋送到網絡中。這些訊號將觸發隱藏單元,之後並將達到輸出單元。通常這稱之為前饋網絡,是一種神經網路經常會有的設計。


當使用不同的學習範例對神經網絡進行充分訓練之後,它就會到達一個新的階段,並呈現一組全新的輸入,這些輸入通常可以預測出令人滿意的輸出。神經網路對於深度學習有著相當重要的影響,以下是現今神經網絡和深度學習的一些重要趨勢。


卷積神經網絡

卷積神經網絡(Convolutional Neural Networks;CNN)已經存在多年,並受到生物行為模式的啟發,特別是大腦如何理解從眼睛接收到的信號。以目前來說,現有的視覺識別系統便是採用CNN演算法來執行影像分類、定位與對象檢測等工作。


近年來,科學界對於卷積神經網絡的興趣不斷提高,因為它正被大量運用於智能監控、社交網絡照片標記和影像分類、機器人、無人機和自動駕駛汽車等用途上。包括Google、Amazon、Facebook等數據工程師則使用它來進行各種圖像過濾和分類。


一個密切相關的重要領域,則是機器視覺的深度學習,這是條碼掃描器能夠看到並理解條碼中條紋的能力。同樣的,這也是Apple的Face ID在看到人臉時的識別方式。為了開始深入學習機器視覺,目前市面上有許多的平台,包括Google的Vision API、Allegro.ai,以及Missinglink.ai等。


膠囊網絡

膠囊網絡(Capsule Networks;CapsNets)是深度神經網絡的一種新興模式。他們以類似於人類大腦的方式來處理訊息。它實質意涵在於,膠囊網絡可以維持著層次關係。膠囊網絡與卷積神經網絡形成了一個對比。



圖三 : 膠囊網絡(CapsNets)是深度神經網絡的一種新興模式。他們以類似於人類大腦的方式來處理訊息。
圖三 : 膠囊網絡(CapsNets)是深度神經網絡的一種新興模式。他們以類似於人類大腦的方式來處理訊息。

儘管卷積神經網絡是至今使用最為廣泛的神經網絡之一,但它們未能考慮到簡單和復雜對象之間所存在的關鍵空間層次結構,這將會造成錯誤分類,並導致更高的錯誤率。當進行簡單的識別任務時,膠囊網絡能提供更高的準確度,同時減少錯誤數量。他們也不需要大量的培訓模型數據。


深度強化學習

深度強化學習(Deep Reinforcement Learning;DRL)是神經網絡的一種形式,通過觀察、行動來與環境進行交流學習。DRL已經成功應用於遊戲策略上,例如著名的AlphaGo計劃已經成功擊敗人類的棋藝冠軍,在幾個著名的人與機器競賽上,深度強化學習都為機器取得了競爭中的優勢。DRL是應用於開發業務應用程序的通用學習技術之一,而其另一個優點,是可以透過模擬來訓練加以。


結語

人工智慧為新時代奠定了基礎,許多科技上的突破都奠基於此。近年來,深度學習和神經網絡已經成為發展人工智慧不得不注意的重要趨勢。例如自動駕駛汽車可結合使用多種模型,如深度加強學習和卷積神經網絡,用來進行自駕時的視覺識別。


就本質上來說,人工神經網絡是一種人類神經網絡的模型,目的在幫助電腦學習。如果將人工智慧比喻為是考古界的聖杯的話,那麼神經網路就是用來發掘出這個聖杯的最佳捷徑。


[[超級電腦「華生」]]


圖四 :  IBM所研發的超強人工智慧電腦華生(Watson)
圖四 : IBM所研發的超強人工智慧電腦華生(Watson)

華生(Watson)是IBM繼深藍(Deep Blue)後由華生研究中心費魯奇博士 (Dr. David Ferrucci)最新研發出超強人工智慧電腦,運用IBM開發出問答系統(DeepQA)為運算結構,而問答系統在電腦科學與人工智慧應用上是一大挑戰, 因為要回答不同的問題程式系統需要迅速整合資訊檢索、自然語言處理、知識表徵及推理能力,並同時應對人機介面的互動。因此將華生的設計概念規劃在可以挑戰即時問答模式的益智節目《Jeopardy》並與人類參賽者一較高下。


在硬體部分,華生是結合強大的平行運算處理器、90台高速運算伺服器及2,880個處理器核心組成,能即時運算15TB的數據,且運算速度每秒可執行80兆個指令。而華生的記憶體被灌輸了100萬本書,相當於2億頁的資料內容,內容包羅萬象,舉凡天文地理、醫學,甚至是百科全書跟地圖圖鑑等全是華生的智慧來源。


在軟體部分,華生是由C++及JAVA語言共同撰寫並結合Apache Hadoop架構來進行分散式運算,利用100多種不同的方法來分析自然語言、定義來源、產生假設並透過攫取正確訊息來確認假設,進而合併排序答案,推定可能答案範圍。


為了要挑戰即時問答的益智節目,華生必須要具備龐大的資料庫且快速的搜尋能力,因此華生在此種硬體設備的支援下,當華生要回答問題時,會先運用600萬條邏輯規則來瞭解人類語言的意義脈絡,立即從資料庫中搜索、瀏覽,同時比照兩億頁的文字,交叉分析文章段落、確認語意,在沒有連網的情況下,三秒內回答問題。


相關文章
深度學習在機器視覺領域的機遇與挑戰
由自駕車邁向智慧交通系統的進展
延伸工業感測器價值鏈 須藉系統整合深入應用
機器視覺走入AI世代 後勢發展深具潛力
服務型機器人成長快速 掌握關鍵技術方能站穩市場
comments powered by Disqus
相關討論
  相關新聞
» 趨勢科技併購 Cloud Conformity 強化雲端資安領先地位
» 看好5G、AI領域新應用 軟硬體大廠整合數位雙生核心
» 引世界迎向永續工業復興 達梭「體驗時代的製造業」大會落實戰略
» 趨勢科技率先利用 AWS Transit Gateway 提供高效能在線式網路資安防護
» Autodesk 2020新品論壇 共享各領域知識及資訊
  相關產品
» JIUN推出新款雲端醫學影像管理系統
» 優必達借力Azure 提供混合式雲遊戲與人工智慧服務解決方案
» IBM 與 NVIDIA 攜手為資料科學家拓展開源機器學習工具
» Hortonworks、IBM與紅帽協力推動工作負載容器化
» IBM與紅帽攜手合作加速混合雲採用

AD


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 遠播資訊股份有限公司版權所有 Powered by O3
地址:台北市中山北路三段29號11樓 / 電話 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw