從基因角度獲得治療與疾病預防的洞悉,是目前醫療發展的一大重點。世界衛生組織研究顯示,多數重大疾病是先天基因體質與後天生活環境交互作用後累積的結果。透過基因檢測不僅可讓人們充分了解先天體質,也能預知罹患疾病的風險。2020年來新冠病毒肆虐全球,醫療產業除了不斷積極找尋有效的療法與研發疫苗,更迫切進行COVID-19患者的基因分析研究,以避免未來發生如此大規模的流行性傳染病。
|
台大醫院智慧醫療中心副主任李建璋表示,醫院現有地端伺服器不足以運算龐大基因資料運算量,也難以因應暴增的數據量而擴增,是研究團隊面臨的兩大難題。(source:Microsoft) |
台大醫院為國家級教學醫院,多年來致力於發展前瞻醫療研究,因此參與了微軟的全球AI for Health計畫,運用Azure高效能運算(HPC)在全球最大英國Bio Bank的基因資料庫進行大規模運算,不僅運算效率大幅提升了40倍以上,也成功完成亞洲第一大規模的基因插補程序,為將來科學研究鋪下基礎,推動基因研究以落實疾病預防。
在疫情期間,台大醫院觀察到許多的非典型案例,如患有慢性病的長者雖得到新冠肺炎但卻在短期內痊癒,或者,不具有慢性病病史的年輕人得病後卻很快地去世。因此,如果能透過交叉比對基因位點資料,找出關鍵基因並建立風險評分的機制,就更有可能有效防範疾病,大幅提升國民健康。
台大醫院智慧醫療中心副主任李建璋表示:「隨著許多研究證實疾病和基因有密切關聯,基因定序逐漸受到醫療界重視;既有的伺服器不足以運算龐大的基因資料量,加上暴增的數據量難以即時擴大投資設備,是研究團隊普遍面臨的兩大難題。此次參與微軟AI for Health專案,接軌全球運算資源與技術專家,讓台大醫院不僅成功突破運算瓶頸,推進基因研究邁向新的里程碑,更期盼未來可以持續攜手科技的創新力量,加速醫療產業研究歷程。」
目前數據,每人會有大約73萬個比較常見的基因變異位點,在基因採檢時常有部分基因位點缺漏的狀況發生,因此醫療團隊在透過AI分析基因前,都需要花費至少數個月的時間。此次英國Bio Bank提供50萬筆的人體生物樣本資料,但是台大醫院現有的傳統伺服器在運行數個月後仍停留在插補程序運算,遲遲無法進展至分析階段,因此去年九月開始與微軟Azure專業技術團隊合作,以機器學習方式預測遺失位點,就能補齊所有的基因資料。
奠基在Azure HPC的運算優勢,原需耗費數個月的1萬8千名COVID-19患者基因資料插補與分析,成功縮短至僅僅5小時,雙方團隊更將原需計算超過二年以上的50萬筆基因,提前至四週內完成分析,下一步更預計將基因庫內每筆人體生物樣本近億個基因位點資料運算完畢,成為未來精準醫療的基礎。
微軟全球黑帶專家-亞洲區HPC/AI解決方案總經理磯貝直之表示:「此次成果為亞洲最大規模針對UK Biobank基因資料進行插補運算,未來台灣各醫療研究機構若使用Biobank資料將不須重複進行插補程序,可有效縮短基因分析時間、提升研究效率與加速進程。我們很高興微軟可以運用Azure全球豐富HPC資源及緊密合作夥伴關係為全球醫療發展貢獻一己之力。」
微軟全球黑帶專家-亞洲區HPC/AI解決方案副總經理馮立偉表示:「微軟面對現有研究環境在處理巨量資料的侷限性,不僅傾注Azure HPC的高速算力與技術團隊,更尋求R程式套件國外創辦者協助與Intel技術合作,共同進行演算法的修正與優化,找出最佳雲端硬體規格及資料量大小切割方式,進行基因插補與分析。」
微軟全球助理法務長及台灣微軟公共暨法律事務部總經理施立成表示:「AI for Good期盼以科技之力,協助組織在面對全球環境、無障礙、文化遺產保護與人道行動挑戰時,能加速落實理想並擴大影響力;而AI for Health是其中計畫之一,旨在運用微軟AI技術協助開發健康照護技術,助力醫療單位解決全球醫療問題,包含癌症檢測與治療系統的優化、流感傳染分佈等。」
時至今日,微軟已於全球資助超過180個組織,未來也將繼續投入、賦能更多的醫療組織。微軟與台大醫院期望該研究成果將可帶動多基因風險分數等評估方式的建立,協助罹病高風險族群提早預防與治療,將人類基因研究拓展到更多醫療領域上。