CTIMES- AI成閨密？神經網路與機器學習正在改變世界！ :神經網路,機器學習

│新東西市集│東西講座│影音頻道│出版中心│

元件次系統自動控制

最新動態

【文章精選】多功機器人協作再進化

產業快訊

8/20-23自動化x機器人展立即預登參觀

CTIMES / 文章 /

AI成閨密？神經網路與機器學習正在改變世界！

神經網路的原理與應用

【作者：季平】 2023年02月06日星期一

瀏覽人次：【4013】

如果人工智慧(AI)進化到可以完全複製人類大腦，甚至更上一層樓，每顆AI腦袋都是IQ180以上，人類將何去何從？是進化成神一般的存在，掌控AI世界，還是被更聰明的AI取代，成為人類版《侏儸紀公園》的動物主角—取代恐龍？又或者，有那麼一天，IQ不足180的人類可以更換AI腦，打造後人類時代的「高度文明世界」？聽起來是腦洞大開的異想世界，但如果科技與人工智慧持續發展，未來還真沒什麼是不可能的。

神經網路的五感運用

人腦是神經網路(Neural Network；NN)架構的靈感謬思，透過腦細胞(神經元)形成高度複雜、互聯的網路系統，相互傳送訊號，協助人類處理資訊。神經網路神複製人腦架構，透過軟體程式或演算法共同協作來解決問題，也就是一種運算系統，由於仿生物的神經網路具有極高的學習能力，大量運用在機器學習和認知科學領域。

人工智慧(AI)簡單來說，就是讓電腦系統具有人類的知識及行為，而且可以像人類般具有學習、推理、判斷能力，具有人類的記憶、知識並了解人類的語言邏輯。透過程式設計，可以將人類解決問題的過程公式化或模組化，如此，就可以賦能電腦解決更為複雜的問題。神經網路包含在AI中，透過機器深度學習，建立一種讓電腦學習並持續改善的系統，更為精準地解決複雜問題，做出智慧決策。

神經網路於20世紀40年代提出，70年代時原理技術皆已發展成熟。目前神經網路的應用相當多元，如透過醫學影像分類可以進行醫學診斷、透過網路篩選與行為資料分析推播廣告、透過整合金融歷史資料進行金融預測；視覺辨識系統可以識別道路標誌和路況、臉部視覺可以識別臉部的各種樣態，而影像標籤可以識別標誌或其他影像資訊，甚至可以進行內容審核，從內容物中移除不安全或不當內容。

語音辨識部分，神經網路可以協助分析人類語音，進行錄音並提供準確字幕，或將各種對話即時轉化為文件；可以進一步透過自然語言處理(NLP)協助電腦從文字或資料中蒐集到有意義的內容，如常見的虛擬客服及聊天機器人(Chatbot)。

隨著網購消費模式興起，也可以透過神經網路追蹤使用者活動，建立消費者輪廓，進一步標籤化以利精準行銷，甚至可以分析使用者或消費者行為，透過智慧產品標記(IPT)蒐集及管理資訊以協助銷售、進行消費者互動，或自動推薦適合使用者及消費者的相關活動及產品。

神經網路的運作方式

人類大腦是相當精密、複雜的多工構造，透過神經線路的連結來處理各種資訊。基本上，大腦在執行任務的過程中會按層級進行排列，每一層或神經元有不同的工作屬性。比方走過香氛店時聞到自己喜愛的香水味道，腦袋會輸入「我愛的香味」資訊，然後出現浪漫場景或特殊的人事物或喜悅的感覺，之後腦中出現是否應該買下香氛的決策內容，或者提醒自己：類似的香氛已經買了很多，但又陷入自我掙扎：這個味道還是有點不一樣的，適合不同情境，最後採取行動買下香氛。

大腦每天都會出現很多類似的「內心戲」，感覺只是三秒鐘的事，大腦可能已經千迴百轉。神經網路也會試圖模擬、推演這類多層次運作方式，處理不同資訊，然後做出決策。神經網路跟人腦一樣可以具有多層神經元，但基本有三層：資訊進入、進行分析與分類的輸入層，處理資訊的隱藏層，以及做出最終決定的輸出層。輸入和輸出層之間可以存在多個隱藏層。多數工作可以在一個或數個隱藏層中獲得解決，但是複雜的工作內容就可能需要多個隱藏層才能獲得解決。研究顯示，多個隱藏層的深度神經網路 (DNN)在影像或語音辨識等較為複雜的工作中發揮更好的效用，因此，難度高的語意解讀就需要更多的隱藏層。

一如大腦的複雜結構，神經網路也高達27種類型，如深度前饋神經網路(Deep Feed Forward)、GRU(Grated Recurrent Unit)、自動編碼器(Auto Encoder)、長短時記憶網路(Long/Short Term Memory)、深度卷積網路（Deep Convolutional Network）、深度卷積反轉圖像網路(Deep Convolutional Inverse Graphics Network)、極端學習機(Extreme Learning Machine)等。

圖一 : CNEA中的鼠類神經元影像（CMOS奈米電極陣列）。(Source：Samsung)

神經網路的主流應用

神經網路目前的主流是深度學習(Deep Learning)，操作上尤重訓練(Training)及推理(Inference)步驟，需要龐大的運算能力及記憶體，而且搭配不同的應用情境，需要局部或全部再次訓練，推理時也需要相當的計算量。深度學習是機器學習(ML)的一部分，是由一系列神經網路提供技術支援，深度學習模型採用多個資料來源資訊，並即時分析資料。其中，圖形處理單元 (GPU)會針對訓練模型進行最佳化，可以同時處理多個運算。不過，深度學習不同於機器學習，後者旨在教電腦處理及學習資料，但是深度學習可以讓電腦不斷訓練自己處理資料、學習並構建更多功能，這部分需要更為複雜的多層神經網路。

神經網路與深度學習工具可以建立更多聰明的應用場景，提高工作效率。早在2021年，半導體大廠三星電子(Samsung) 於《Nature Electronics》期刊中發表類大腦運作的神經形態晶片可望成真的願景，該技術使用Donhee Ham與Hongkun Park博士所開發的突破性奈米電極陣列，作法是將複製的神經元連線圖貼至非揮發性記憶體（Non-Volatile Memories）上，如固態硬碟（SSD）中的商業快閃記憶體或可變電阻式記憶體（RRAM）等新型記憶體。針對各記憶體進行編程，可以利用其傳導性重現被複製連線圖的神經元連結強度。

以亞馬遜(Amazon)的AWS深度學習服務來說，就是透過功能強大的雲端運算擴展深度學習神經網路，優化處理速度，應用程式包含機器學習技術自動化影像和影片分析(Amazon Rekognition)，提供預先訓練和可自訂的電腦視覺 (CV)功能，可以從使用者的影像和影片中擷取資訊和洞察結果；Amazon Transcribe可以自動識別和準確轉錄語音，將內容轉換成文字；Amazon Lex可以建置智慧聊天機器人，機器人可以理解意圖、維護對話內容，並且可以跨多種語言自動執行簡單任務。

圖二 : 機器學習技術自動化影像和影片分析(Amazon Rekognition)。(Source：AWS)

深度學習可以透過多層神經網路分類資訊，如神經網路訓練辨識有鳥或狗出現的圖像，未來就能用來辨識相關動物圖像，因為多層，可以產生更精確的結果。深度學習演算法須接受大量資料訓練，而且是更正確的資料，才能獲得更精確的結果，也需要在訓練期間進行調整，才能提供更好的預測，因此，深度學習需要高效能運算。

適用於平行執行大型機器學習(ML)與深度學習問題的GPU，能針對資料運算進行最佳化。比方前面提到的鳥或狗照片，只要加上一張GPU卡，可以在一天內進行超過七千萬的圖像運算。

以神經網路中的卷積神經網路(Convolution Neural Network)為例，由於神經網路是由大量相同神經元所組成，具有高度平行性，深度學習就是大量及密集地進行矩陣運算，處理更多層的深層神經網絡以提高正確率，也大幅提高效率，減少電腦功耗，降低硬體成本。因此，部署深度學習需搭配合適的軟體、系統及GPU硬體。以輝達(NVIDIA)的函式庫cuBLAS或cuSPARSE來說，可有效發揮GPU效能，提升矩陣求解運算效能達6-17倍。

神經網路的視覺應用

單就電腦視覺來說，已廣泛應用於替代人眼觀察、辨識、定位、檢查、測量、決策，系統能自動擷取、分析視覺影像，提供資訊並控制機器及工作流程，全球各大半導體廠早已應用機器視覺檢查良率或尋找缺陷。在工廠自動化環境中也可以使用神經網路解決複雜而且無法建立基本規則的缺陷探測，以及識別產品瑕疵，尤其缺陷探測對於製造業自動化帶來相當大的助益，如透過神經網路的視覺應用功能檢測汽車外觀刮擦傷等。系統可以透過三種方式學習：

(1)監督式學習

電腦透過一組加上標籤的資料學習，並且不斷修改演算法，直到能夠處理該組資料，獲得想要的結果。

(2)非監督式學習

缺乏標籤資料可供學習時，可以透過神經網路分析該組資料，成本函數會告知結果和目標相差多遠，神經網路再予以調整，提升演算法的精準度。

(3)強化學習

神經網路會強化正面結果並懲處負面結果，這種方式可以強迫神經網路不斷學習。

康耐視機器視覺與工業讀碼解決方案就能解決如引導、識別、測量及檢測等難題，以提升流程性能、改善產品品質並降低成本。以輪胎解決方案來說，輪胎的生命週期中可能途經多個地點和建築物，過程中的管理遵規、工作進度、排序和派送以及品質控制都必須做到準確識別輪胎，因此，製造商從收到原料到最後組裝的製程階段需要條碼讀取與機器視覺解決方案，以便更好地完成工作。二維及三維機器視覺系統檢測、識別和引導元件採用完全獨立運作的工業級視覺系統，結合先進的視覺工具庫及高速圖像採集與處理功能，可滿足多數任務需求。

圖三 : 專為輪胎製造商打造的先進條碼讀取與機器視覺解決方案。(Source：康耐視)

神經網路與機器學習正在改變人類世界

圖四 : AI聊天機器人ChatGPT在全球掀起風潮。(Source：OpenAI)

2023年美國消費性電子展(CES)特別聚焦於人工智慧(AI)、機器學習領域，以及自駕車與智慧座艙領域，尤其對話式人工智慧不只能進行擬人對話、擷取語意脈絡，還能提供智慧化回應的語音助理服務，可望繼續成為行銷利器，更貼近消費者生活。不過，人工智慧複製擬人互動可能必須依序執行十餘個神經網路才能完成多層任務。輝達(NVIDIA)即指出，AI與人類互動需要在300毫秒內完成，但是多數對話式AI模型僅能處理數百萬個參數，學習能力可能不足，以至於語音助理回覆容易產生延遲，這部分還有努力空間。

雖然如此，卻無礙於AI人工智慧思考模式和對話方式的進步速度，比方去年11月底出現比Siri還聰明的AI聊天機器人ChatGPT在全球掀起風潮，短短2個月活躍用戶數已達1億人之多。這款OpenAI研發的聊天機器人採取預訓練模型，利用1,750億個數據創造背景元素及細部脈絡，將預測及回饋納入內容中，再從自己產生的反饋中不斷學習。

ChatGPT是機器學習領域中的深度神經網路技術，可以用較少的參數表示複雜函數，隨著輸入資料愈來愈多，就能愈來愈準確地推斷結果，愈來愈像人類，甚至連工程師、教師與作家這些靠「智慧財」維生的人都可能被輕鬆取代，看來，AI成閨密，翻身做主人的時代不遠了。

‧	智能設計：結合電腦模擬、數據驅動優化與 AI 的創新進程
‧	生成式AI與PC革新
‧	機器學習可以幫助未來的癌症診斷
‧	資料科學與機器學習協助改善頸部損傷評估
‧	人工智慧推動神經網路技術開發熱潮

相關討論