登峰造極的AI運算速度 NVIDIA超級電腦Summit搭載27,648顆GPU

2018年06月14日 星期四
【科技日報林彥伶報導】

NVIDIA(輝達)推出全球最強超級電腦Summit。說它是史上最強科學工具也好,運算新典範也行,無論如何就是跟「慢」八竿子打不著關係,這部在橡樹嶺國家實驗室亮相的超級電腦Summit,運算速度超乎想像,無論任何研究數據都能迅速端到眼前。

全球最強超級電腦 Summit 搭載 27,648 顆 NVIDIA GPU。
全球最強超級電腦 Summit 搭載 27,648 顆 NVIDIA GPU。

這部龐大機器搭載27,648顆Volta GPU,運算效能超過3exaop,一個exaop代表每秒執行10億乘以10億次的運算,這樣的速度足足比五年前美國最快超級電腦Titan快了100倍。這部新登基的運算霸主95%的運算效能來自GPU。

這部為美國能源部打造的新系統是設計用來解決當前最艱鉅的挑戰,將加速全球頂尖科學家的研究工作,包括高能物理、材料開發、醫療等領域,以200 petaflops的運算效能執行各種高精度科學模擬。

NVIDIA創辦人暨執行長黃仁勳在Summit的發表會上表示:「Summit的確擁有超快的運算速度,但它的意義不僅僅是卓越而已,Summit是偉大的科學設備,將吸引全球最頂尖的科學家。」

它可說是一部科學的時光機器。

橡樹嶺國家實驗室團隊在近10年前就意識到新型態運算的需求。以往把一個電晶體疊到另一個電晶體之上的舊思維,已經無法提供他們要求的效率,於是他們在2012年率先大膽組建Titan,這部當時全球最快超級電腦在每個節點都配置一顆GPU,如此顛覆創新的勇氣獲得回報,如今有超過550種HPC應用都運用GPU加快運算,當中最廣泛使用的前15種應用全都採用GPU加速技術。他們的創新成果重新塑造了超級運算的形態。

Summit是運算史上的全新篇章,不僅僅是橡樹嶺國家實驗室,而是所有運算都要靠Summit開路。我們的研究團隊和美國能源部合作超過11年,聯袂研究各種先進技術,包括Volta GPU及NVLink高速互聯技術,這些都是Summit最核心的科技。如今的Summit不光為每個節點配置一顆GPU,而是加碼到6顆Tensor Core GPU張量運算核心,達到的模擬效能足足是Titan的10倍。

如同當年Titan啟發世界加快模擬運算,Summit也將啟發全球科學家運用AI配合電腦模擬進行科學探索。此外,Summit背後的技術也已拓展到眾多科學家的工作領域,從PC、伺服器、工作站,一路到雲端運算系統。

黃仁勳表示:「Summit是全新品種的運算設備,是全球最大的AI超級電腦,有學習能力的機器,Summit的軟體有能力寫出人類寫不出來的超傑出軟體。」

帶動AI與高效能運算的發展

雖說Summit的基因和專為AI打造的新世代系統有共同之處,但兩者的運算速度完全不在同一層次。研究人員能運用名為半精度或FP16的簡化運算模式,讓Summit的效能提高約15倍,攀升到exascale的水準,意即每秒運算超過一百萬兆次,如此速度著實驚人。如果每次運算代表一粒細沙,以這樣的速度,一秒鐘就能填滿350座休士頓巨蛋體育館。

Summit能為科學做出貢獻

Summit的速度將讓當代科學家完成許多神奇成就。現在,橡樹嶺國家實驗室儼然成為尖端科學的遊樂場,眾多科學家聚集在此、急於運用這部神器追求完美的研究成果,因此Summit的行程排到滿檔,透過Summit加速的研究計畫包括:癌症研究、聚變能源、疾病與成癮。

癌症研究:美國能源部與美國國家癌症研究所正合作執行一項名為「癌症分散式學習環境」(CANcer Distributed Learning Environment; CANDLE)的專案,目標是開發出各種工具,對現有醫療資料自動進行擷取、分析及整理,並藉此揭露各種疾病因素之間的隱藏關係,如基因、生物標誌以及環境等因素。

聚變能源:聚變能源以太陽能為來源,長久以來一直被視為是不會枯竭的潔淨能源。Summit將能模擬一部聚變能源反應爐的模型,並利用磁力圍控的電漿,藉此加速商業運轉發展。

疾病與成癮:研究人員將運用AI找出各種人體蛋白質與細胞系統其功能與演化的模式,這些模式將協助我們更瞭解阿滋海默症、心臟病或成癮症狀,以及作為新藥開發之參考。

運用超大規模的機器學習與深度學習技巧,科學家將能透過Summit獲得許多重大突破,進而促進經濟、改善醫療,並協助提供無限能源。這將有助於拯救我們的星球,這也是為什麼我們需要快上加快的超級電腦,我們已竭盡全力完成這項偉大的運算挑戰—打造全球第一部exascale加速超級電腦,好讓全球各地的科學家與研究者繼續全速衝刺。

黃仁勳說:「我想大大恭喜橡樹嶺國家實驗室的朋友與同事們,自此,我們將能攀上下一個高峰。」

全球最快超級電腦的五項優勢:200 petaflops—Summit只需1秒,就能完成地球上每人每秒1次運算、1年期間加總的運算量總和;3 exaops的AI運算—Summit花1秒完成的運算量,如果讓地球全人類每人每秒完成1次運算、一共需要15年才能算完;在一項早期測試中,一個基因研究團隊花1小時解決的問題,在PC上卻得耗費30年;機櫃空間佔地5,600平方英呎,大小將近2個網球場;Summit的總重量接近一部商務客機。


關鍵字: Summit   超級電腦   GPU   NVIDIA