OpenAI日前發表了全新人工智慧系統OpenAI o3,新的系統主要在透過「推理」解決數學、科學和電腦程式設計等問題。
OpenAI表示,o3系統目前僅與安全和資安測試人員共享,但在評估數學、科學、編碼和邏輯技能的標準化基準測試中,其表現已超越業界領先的AI技術。OpenAI指出,o3在一系列常見程式設計任務中的準確度比o1提升了20%以上,甚至在競爭性程式設計測試中超越了其首席科學家Jakub Pachocki。
OpenAI執行長Sam Altman在發表會中表示:「這個模型在程式設計方面表現出色。」但他補充說,至少還有一位OpenAI的程式設計師可以在這項測試中擊敗該系統。
OpenAI計劃在明年初向個人和企業用戶推出這項技術。o3的推出是OpenAI構建可推理解決複雜任務的AI系統的廣泛努力的一部分。本週稍早,Google也發表了類似的技術,稱為Gemini 2.0 Flash Thinking Experimental,並與少數測試人員分享。
這些公司和其他公司都致力於構建能夠透過一系列步驟仔細且合乎邏輯地解決問題的系統,每個步驟都建立在前一個步驟的基礎上。這些技術可能對使用AI系統編寫程式碼的電腦程式設計師或在數學和科學等領域尋求自動化輔導的學生有所幫助。