为确保AI人工智慧更安全的发展,语言模型作为其重要核心,相关资安、准确性等问题,也是产业关心的重要议题。在数位发展部数位产业署支持下,工研院今(29)日宣布打造台湾首座AI测试实验室,全方位确保产业客户的语言模型能安全可靠的在各个领域稳定运行。
|
工研院打造台湾首座针对语言模型评测的AI测试实验室。 |
因语言模型是自然语言处理(Natural Language Processing;NLP)不可或缺的关键,也是AI人工智慧理解文本、生成内容、语音辨识、情感分析等重要依据,经由大规模文本学习来掌握语法、语意、上下文关联性等语言特徵,进而产生类似人类的自然语言。
然而,模型也可能因为数据偏差或失真,导致产生错误或不当资讯,甚至在处理敏感数据时更有资安风险存在。因此,尽管生成式AI当红,但语言模型的开发和部署还是得小心谨慎,以确保输出结果准确、稳定且可靠。
在数发部数产署支持下,由工研院成立台湾首座AI测试实验室,叁考国际可信任AI的相关框架及标准,并透过AI产品与系统评测中心(Artificial Intelligence Evaluation Center;AIEC)专家以及技术委员会,开发可信任语言模型评测工具。
藉此提供包括准确性、公平性、可靠性、隐私及资安等自动化语言模型测试方案,协助台湾厂商评估及改善语言模型,以确保语言模型及AI应用能在不同场景下保持稳定及可靠,并满足企业和使用者需求。
工研院量测技术发展中心执行长蓝玉屏表示,随着生成式AI渗透到各个领域,对AI模型进行可信任性的测试与评估至关重要,因此工研院打造针对语言模型提供评测工具开发和导入的AI测试实验室,透过叁考国际以及国内专家审议的测试题库,来评估生成内容的可信任性,促进企业在应用AI技术时更具信心。
未来,随着AI应用更进一步拓展,工研院将持续加强对AI技术的测试和把关,并探索新兴技术应用的测试与评估,确保台湾在全球AI技术竞争中的发展。此外,为了强化国际合作,工研院同时与法国国家计量院(LNE)签署合作协议,针对AI进行国际合作与技术交流,协助台湾AI评测技术接轨国际。