OpenAI再推新智能體Deep Research 在“人類的最后考試”中表現(xiàn)突出
快訊
2025年02月03日 16:00 18
admin
OpenAI發(fā)布了一款新的人工智能工具“Deep Research”,旨在為用戶執(zhí)行耗時的在線研究任務,涵蓋從復雜科學問題到汽車推薦等眾多領域。這一新工具進一步豐富了這家初創(chuàng)公司的人工智能代理陣容?!?/p>
Deep Research可能需要 5 到 30 分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網絡。最終輸出以報告的形式出現(xiàn)在聊天中,很快用戶還將看到嵌入的圖像、數(shù)據(jù)可視化和其他分析輸出,以增強清晰度。這次的時間大大提升了它的能力。例如,在“人類的最后考試”中,Deep Research取得了令人印象深刻的 26.6% 的準確率——遠遠超過了其最接近的競爭對手 DeepSeek R1,后者的得分低于 10%。這一飛躍凸顯了系統(tǒng)的迭代優(yōu)化和結構化綜合能力,證明了在人工智能快速發(fā)展的步伐中,有些任務確實需要時間。
在上周日的博客文章中,OpenAI宣布,這項名為“Deep Research”的服務將通過其ChatGPT在線聊天機器人向特定付費客戶開放。該工具能夠根據(jù)用戶的指令,在線搜索文字、圖像、PDF文件以及用戶上傳的文件,進而生成一份詳盡的報告。OpenAI將這一功能比作研究分析師,并強調它能夠在“幾十分鐘”內完成通常需要一個人“數(shù)小時”才能完成的工作。
不過,OpenAI也提醒用戶,“Deep Research”仍處于早期階段,可能會將虛構信息誤認為事實,且在區(qū)分謠言和準確信息方面可能存在困難。此外,這款研究工具“非常耗費計算資源”,初期用戶每月僅能提交100次查詢。
相關文章
最新評論