6月11日消息,據(jù)Techcrunch報道,OpenAI發(fā)布了o3-pro,這一AI模型被公司稱為迄今為止最強大的產(chǎn)品。
o3-pro是OpenAI今年早些時候推出的推理模型o3的一個版本。與傳統(tǒng)AI模型不同,推理模型能夠逐步推理解決問題,因此在物理、數(shù)學和編程等領域表現(xiàn)更為可靠。
自本周二起,o3-pro已面向ChatGPT Pro和Team用戶開放,取代原有的o1-pro模型。OpenAI表示,企業(yè)版與教育版用戶將在下周獲得訪問權限。o3-pro也已于今日上線OpenAI的開發(fā)者API。
在API中,o3-pro的定價為每百萬輸入tokens 20美元,每百萬輸出tokens 80美元。輸入tokens指輸入到模型中的內(nèi)容,輸出tokens則是模型基于輸入生成的內(nèi)容。
一百萬輸入tokens大約相當于75萬字,略長于《戰(zhàn)爭與和平》。
OpenAI在更新日志中寫道:“在專家評測中,評審人員在所有測試類別中均更傾向于o3-pro,尤其是在科學、教育、編程、商務和寫作輔助等關鍵領域。評審人員還一致認為,o3-pro在表達清晰度、內(nèi)容全面性、指令遵循度和準確性等方面表現(xiàn)更優(yōu)。”
根據(jù)OpenAI介紹,o3-pro具備多項工具調(diào)用能力,可實現(xiàn)網(wǎng)頁搜索、文件分析、圖像內(nèi)容推理、使用Python、借助記憶進行個性化響應等。不過,OpenAI也指出,相較于o1-pro,o3-pro生成回復所需時間通常更長。
o3-pro還存在其他限制。目前,ChatGPT中的臨時對話功能暫時關閉,OpenAI正在解決相關技術問題。o3-pro不支持圖像生成,也無法用于“畫布”(Canvas)這一AI智能工作區(qū)功能。
值得一提的是,OpenAI內(nèi)部測試顯示,o3-pro在多項主流AI基準測試中取得了優(yōu)異成績。在AIME 2024數(shù)學能力評測中,o3-pro得分高于谷歌的旗艦AI模型Gemini 2.5 Pro。在GPQA Diamond(博士級科學知識測試)中,o3-pro也超越了Anthropic近期發(fā)布的Claude 4 Opus。
來源: 網(wǎng)易科技報道
撫順眾聯(lián)網(wǎng)絡公司轉(zhuǎn)載
撫順網(wǎng)絡公司 撫順網(wǎng)絡 撫順軟件公司
