Meta新一代AI大模型Llama 4發(fā)布在即 此前兩度延期
據(jù)媒體周五報(bào)道,Meta有望在本月發(fā)布的新一代開源大語言模型Llama 4。此前這款大語言模型的發(fā)布已至少經(jīng)歷兩次延期,目前仍存在再度推遲可能。
這距離前代模型Llama 3的發(fā)布已過去近一年,凸顯出Meta在AI軍備競賽中面臨的技術(shù)挑戰(zhàn)。
據(jù)Meta內(nèi)部測試顯示Llama 4在數(shù)學(xué)推理(GSM8K基準(zhǔn))和代碼生成(HumanEval)準(zhǔn)確率較Llama 3提升37%。
這款大語言模型多次延期的主因是多模態(tài)訓(xùn)練數(shù)據(jù)清洗遇阻,特別是視頻-文本對齊質(zhì)量未達(dá)預(yù)期。該模型需協(xié)調(diào)16000塊H100 GPU集群,能源消耗較Llama 3訓(xùn)練增加2.3倍。
行業(yè)觀察人士指出,若再度延期,Meta將錯(cuò)過6月開發(fā)者大會的關(guān)鍵展示窗口。而競爭對手Anthropic的Claude 4和谷歌Gemini 2.0已分別計(jì)劃在Q3發(fā)布重大更新。
相關(guān)文章

炒股就看金麒麟分析師研報(bào),權(quán)威,專業(yè),及時(shí),全面,助您挖掘潛力主題機(jī)會! 出品:上市公司研究院 作者:君 通領(lǐng)科技于2016年和202...
2025-02-11 21 兩度 措辭 轉(zhuǎn)戰(zhàn)
最新評論