AMD在年初的CES 2025上推出了銳龍AI Max系列處理器,擁有2個Zen 5架構(gòu)CCD最多16個內(nèi)核,并擁有最多40組RDNA 3.5架構(gòu)CU的超大核顯,并配備256位的LPDDR5X內(nèi)存控制器,盡管很多用戶對這款產(chǎn)品的期待是更小體積的游戲機產(chǎn)品,但是從AMD自身的規(guī)劃以及廠商的反應(yīng)來看,該系列處理器似乎更多的被計劃用于本地AI以及大模型等需求。
顯然AMD對于AI更加重視,現(xiàn)已宣布對銳龍AI Max的可變顯存進行重大升級,即將推出的Adrenalin Edition 25.8.1 WHQL驅(qū)動程序可以讓配備128GB內(nèi)存的銳龍AI MAX設(shè)備劃分96GB作為顯存使用,這讓它能夠運行128B參數(shù)的大模型。
AMD表示已經(jīng)成功使用銳龍AI Max+ 395處理器成功在本地運行Meta的Llama 4 Scout 109B模型,成為首款成功運行該模型的Windows AI處理器,并支持視覺和MCP,Llama Scout采用混合專家模式,所以每次只有17B處于活動狀態(tài),所以可保持較快的輸出,最多可實現(xiàn)15tokens/s的生成速度。
銳龍AI Max處理器對大模型提供了廣泛的支持,從最小的1B微型模型到最大128B的模型,支持包括GGUF在內(nèi)的多種量化格式,使其能夠靈活地適用于不同場景。這次升級還增大了對大型上下文大小的支持,大多數(shù)設(shè)置的最大token數(shù)約為4096個,但這次升級后銳龍AI Max平臺可以擴展至256000個token,但需要開啟Flash Attention功能,啟用KV Cache Q8,這運行在上下文中保存大量token,使其支持更高級的任務(wù),例如解析和匯總大型文檔的內(nèi)容。
當(dāng)然,上述功能都需要你擁有的銳龍AI Max搭載了128GB內(nèi)存,特別是考慮到該系列處理器使用了板載的LPDDR5X內(nèi)存的情況下。目前擁有這類設(shè)備的用戶可以在AMD官網(wǎng)上下載預(yù)覽版驅(qū)動提前嘗鮮。