OpenAI日前发表了全新人工智慧系统OpenAI o3,新的系统主要在透过「推理」解决数学、科学和电脑程式设计等问题。
OpenAI表示,o3系统目前仅与安全和资安测试人员共享,但在评估数学、科学、编码和逻辑技能的标准化基准测试中,其表现已超越业界领先的AI技术。OpenAI指出,o3在一系列常见程式设计任务中的准确度比o1提升了20%以上,甚至在竞争性程式设计测试中超越了其首席科学家Jakub Pachocki。
OpenAI执行长Sam Altman在发表会中表示:「这个模型在程式设计方面表现出色。」但他补充说,至少还有一位OpenAI的程式设计师可以在这项测试中击败该系统。
OpenAI计划在明年初向个人和企业用户推出这项技术。o3的推出是OpenAI构建可推理解决复杂任务的AI系统的广泛努力的一部分。本周稍早,Google也发表了类似的技术,称为Gemini 2.0 Flash Thinking Experimental,并与少数测试人员分享。
这些公司和其他公司都致力於构建能够透过一系列步骤仔细且合??逻辑地解决问题的系统,每个步骤都建立在前一个步骤的基础上。这些技术可能对使用AI系统编写程式码的电脑程式设计师或在数学和科学等领域寻求自动化辅导的学生有所帮助。