NVIDIA(輝達)今日宣布在語言理解領域獲得多項突破,讓企業透過即時對話式AI能更自然地與顧客互動。
|
NVIDIA T4 GPU |
NVIDIA的AI平台率先訓練當今最先進的AI語言模型之一BERT(Bidirectional Encoder Representations from Transformers),用不到一小時就完成訓練,並在2毫秒內完成AI推論。突破性的效能協助開發者將頂尖語言理解技術導入在各種提供給全球數百萬消費者的超大規模應用。
率先採納NVIDIA先進效能成果的業者包括Microsoft與許多全球最具創新力的新創公司,透過NVIDIA平台著手為其客戶開發能即時反應的高度直覺化語言服務。
雖然有限度的對話式AI服務已存在多年,然而發展至今,包括聊天機器人、智慧個人助理與搜尋引擎等服務想要以人類理解力的水準運作仍極為困難,主要原因是無法即時部署超大規模的 AI 模型。NVIDIA透過在其AI平台導入多項關鍵的優化技術藉以解決這項問題,不僅在AI訓練與推論方面刷新速度紀錄,同時也建構出至今最大的語言模型。
NVIDIA深度學習應用研究部門副總裁Bryan Catanzaro表示:「超大語言模型徹底顛覆自然語言AI。因為它解決許多極為困難的語意問題,往真正的對話式AI邁進一步。NVIDIA的突破性成果除了加快這些模型,還讓組織建構新型頂尖服務,以未曾想像的方式協助與滿足客戶。」
最快訓練、最快推論與最大模型
以自然語言理解技術運行的AI服務預計在未來幾年呈現指數成長。根據Juniper Research的報告,光是數位語音助理市場規模預計在未來5年內將從25億美元成長到 80 億美元。此外,Gartner也預測2021年,15%的客服互動將完全由AI執行,與2017年相比增加400%。
NVIDIA力助邁入新時代,藉由多項關鍵優化微調其AI平台,創下三項新的自然語言理解效能紀錄:
最快訓練:採用內建由1,472個NVIDIA V100 GPU組成92個NVIDIA DGX-2H系統的NVIDIA DGX SuperPOD,執行全球最先進的AI語言模型之一BERT的大型版本,成功把BERT-Large的訓練時間從先前的數日大幅縮短至僅53分鐘。此外,NVIDIA也能透過僅一台NVIDIA DGX-2系統在2.8天內就完成BERT-Large的訓練,展現NVIDIA GPU在對話式AI領域的擴充性。
最快推論:NVIDIA以NVIDIA T4 GPU運行NVIDIA TensorRT,在BERT-Base SQuAD資料集上僅用2.2毫秒就完成推論,不僅遠低於許多即時應用要求的10毫秒的處理門檻,也大幅領先以高度優化CPU程式碼執行的40毫秒。
最大模型:針對開發者對於更大模型永無止境的需求,NVIDIA Research 在Transformers的基礎上著手建構與訓練全球最大的語言模型,並導入BERT採用的技術元件,以及許多其他自然語言的AI模型。NVIDIA的客製化模型擁有83億個參數,數量足足比BERT-Large多出24倍。
全球數百名開發者正運用 NVIDIA AI 平台推動語言理解的研究並開發新服務。
Microsoft Bing正運用其Azure AI平台與NVIDIA技術執行BERT,藉以獲得更精準的研究成果。
Microsoft Bing小組計畫經理Rangan Majumder表示:「Microsoft Bing仰賴最先進的AI模型與運算平台,為顧客提供最好的全球搜尋體驗。我們與NVIDIA緊密合作,透過Azure AI內建的NVIDIA GPU,針對熱門的自然語言模型BERT進一步優化推論作業,在排名搜尋品質方面,獲得從去年部署以來最大幅度的改善。在Azure環境中執行推論,NVIDIA GPU相比CPU平台在延遲縮短幅度超過2倍,吞吐量更提高5倍,讓Bing為全球顧客提供更具相關性、低成本與即時的搜尋體驗。」
多家參與NVIDIA Inception計畫的新創公司包括Clinc、Passage AI與Recordsure,也正運用NVIDIA AI平台為包括銀行、汽車製造商、零售商、醫療機構、旅遊住宿等業者提供頂尖對話式AI服務。
Clinc透過NVIDIA GPU建構多款對話式AI解決方案,提供給全球超過3,000萬名客戶,其中包括頂尖車廠、醫療機構與全球領導金融機構包括Barclays、USAA、以及土耳其最大銀行 Isbank。
Clinc執行長Jason Mars表示:「Clinc頂尖AI平台能瞭解複雜的問題並將其轉化為有利的情資,提供給全球頂尖品牌進行行銷。NVIDIA AI平台的突破性效能讓我們突破對話式AI的疆界,提供各種革命性服務,協助顧客運用科技,以更有意義的有效方式和顧客進行互動。」