OpenAI再推新智能體Deep Research 在“人類的最后考試”中表現(xiàn)突出

快訊 2025年02月03日 16:00 18 admin

　　OpenAI發(fā)布了一款新的人工智能工具“Deep Research”，旨在為用戶執(zhí)行耗時的在線研究任務，涵蓋從復雜科學問題到汽車推薦等眾多領域。這一新工具進一步豐富了這家初創(chuàng)公司的人工智能代理陣容?！?/p>

　　Deep Research可能需要 5 到 30 分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網絡。最終輸出以報告的形式出現(xiàn)在聊天中，很快用戶還將看到嵌入的圖像、數(shù)據(jù)可視化和其他分析輸出，以增強清晰度。這次的時間大大提升了它的能力。例如，在“人類的最后考試”中，Deep Research取得了令人印象深刻的 26.6% 的準確率——遠遠超過了其最接近的競爭對手 DeepSeek R1，后者的得分低于 10%。這一飛躍凸顯了系統(tǒng)的迭代優(yōu)化和結構化綜合能力，證明了在人工智能快速發(fā)展的步伐中，有些任務確實需要時間。

　　在上周日的博客文章中，OpenAI宣布，這項名為“Deep Research”的服務將通過其ChatGPT在線聊天機器人向特定付費客戶開放。該工具能夠根據(jù)用戶的指令，在線搜索文字、圖像、PDF文件以及用戶上傳的文件，進而生成一份詳盡的報告。OpenAI將這一功能比作研究分析師，并強調它能夠在“幾十分鐘”內完成通常需要一個人“數(shù)小時”才能完成的工作。

　　不過，OpenAI也提醒用戶，“Deep Research”仍處于早期階段，可能會將虛構信息誤認為事實，且在區(qū)分謠言和準確信息方面可能存在困難。此外，這款研究工具“非常耗費計算資源”，初期用戶每月僅能提交100次查詢。

標簽： Research 突出人類