深度求索宣布DeepSeek-V3.1正式發(fā)布。經(jīng)查,目前新版模型已經(jīng)默認(rèn)同步上線(xiàn)官網(wǎng)、App,面向C端用戶(hù)完全免費(fèi)。
據(jù)介紹,DeepSeek-V3.1具備128K超長(zhǎng)上下文處理能力,支持混合推理架構(gòu)(一個(gè)模型同時(shí)支持思考模式與非思考模式)。
此外,新版模型擁有更高的思考效率,相比R1能在更短時(shí)間內(nèi)給出答案。
不僅如此,DeepSeek-V3.1擁有更強(qiáng)的Agent(智能體)能力,通過(guò)Post-Training(后訓(xùn)練)優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
比如,在代碼修復(fù)測(cè)評(píng)SWE與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測(cè)試中,以及在需要多步推理的復(fù)雜搜索測(cè)試(browsecomp)與多學(xué)科專(zhuān)家級(jí)難題測(cè)試(HLE)上,DeepSeek-V3.1均大幅領(lǐng)先DeepSeek-R1-0528。
另外,DeepSeek-V3.1思考效率提升有了巨幅提升。經(jīng)過(guò)思維鏈壓縮訓(xùn)練后,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項(xiàng)任務(wù)的平均表現(xiàn)與R1-0528持平。
對(duì)于DeepSeek R2發(fā)布延遲的原因,DeepSeek總結(jié)稱(chēng),主要由于采用國(guó)產(chǎn)昇騰芯片進(jìn)行訓(xùn)練時(shí)遇到技術(shù)挑戰(zhàn),以及公司對(duì)模型質(zhì)量的高標(biāo)準(zhǔn)要求。雖然之前有8月發(fā)布的傳聞,但已被官方否認(rèn)。目前看來(lái),我們可能需要再等待幾周的時(shí)間,但具體日期還需以官方消息為準(zhǔn)。