AMD在年初的CES 2025上推出了銳龍AI Max系列處理器,擁有2個(gè)Zen 5架構(gòu)CCD最多16個(gè)內(nèi)核,并擁有最多40組RDNA 3.5架構(gòu)CU的超大核顯,并配備256位的LPDDR5X內(nèi)存控制器,盡管很多用戶對(duì)這款產(chǎn)品的期待是更小體積的游戲機(jī)產(chǎn)品,但是從AMD自身的規(guī)劃以及廠商的反應(yīng)來看,該系列處理器似乎更多的被計(jì)劃用于本地AI以及大模型等需求。
顯然AMD對(duì)于AI更加重視,現(xiàn)已宣布對(duì)銳龍AI Max的可變顯存進(jìn)行重大升級(jí),即將推出的Adrenalin Edition 25.8.1 WHQL驅(qū)動(dòng)程序可以讓配備128GB內(nèi)存的銳龍AI MAX設(shè)備劃分96GB作為顯存使用,這讓它能夠運(yùn)行128B參數(shù)的大模型。
AMD表示已經(jīng)成功使用銳龍AI Max+ 395處理器成功在本地運(yùn)行Meta的Llama 4 Scout 109B模型,成為首款成功運(yùn)行該模型的Windows AI處理器,并支持視覺和MCP,Llama Scout采用混合專家模式,所以每次只有17B處于活動(dòng)狀態(tài),所以可保持較快的輸出,最多可實(shí)現(xiàn)15tokens/s的生成速度。
銳龍AI Max處理器對(duì)大模型提供了廣泛的支持,從最小的1B微型模型到最大128B的模型,支持包括GGUF在內(nèi)的多種量化格式,使其能夠靈活地適用于不同場(chǎng)景。這次升級(jí)還增大了對(duì)大型上下文大小的支持,大多數(shù)設(shè)置的最大token數(shù)約為4096個(gè),但這次升級(jí)后銳龍AI Max平臺(tái)可以擴(kuò)展至256000個(gè)token,但需要開啟Flash Attention功能,啟用KV Cache Q8,這運(yùn)行在上下文中保存大量token,使其支持更高級(jí)的任務(wù),例如解析和匯總大型文檔的內(nèi)容。
當(dāng)然,上述功能都需要你擁有的銳龍AI Max搭載了128GB內(nèi)存,特別是考慮到該系列處理器使用了板載的LPDDR5X內(nèi)存的情況下。目前擁有這類設(shè)備的用戶可以在AMD官網(wǎng)上下載預(yù)覽版驅(qū)動(dòng)提前嘗鮮。