AMD為銳龍AI Max帶來更強AI支持可運行128B大模型

來源:電腦之家 2025-07-30 18:05 http://www.ghqlgyb.cn/

　　AMD在年初的CES 2025上推出了銳龍AI Max系列處理器，擁有2個Zen 5架構(gòu)CCD最多16個內(nèi)核，并擁有最多40組RDNA 3.5架構(gòu)CU的超大核顯，并配備256位的LPDDR5X內(nèi)存控制器，盡管很多用戶對這款產(chǎn)品的期待是更小體積的游戲機產(chǎn)品，但是從AMD自身的規(guī)劃以及廠商的反應(yīng)來看，該系列處理器似乎更多的被計劃用于本地AI以及大模型等需求。

　　顯然AMD對于AI更加重視，現(xiàn)已宣布對銳龍AI Max的可變顯存進行重大升級，即將推出的Adrenalin Edition 25.8.1 WHQL驅(qū)動程序可以讓配備128GB內(nèi)存的銳龍AI MAX設(shè)備劃分96GB作為顯存使用，這讓它能夠運行128B參數(shù)的大模型。

　　AMD表示已經(jīng)成功使用銳龍AI Max+ 395處理器成功在本地運行Meta的Llama 4 Scout 109B模型，成為首款成功運行該模型的Windows AI處理器，并支持視覺和MCP，Llama Scout采用混合專家模式，所以每次只有17B處于活動狀態(tài)，所以可保持較快的輸出，最多可實現(xiàn)15tokens/s的生成速度。

　　銳龍AI Max處理器對大模型提供了廣泛的支持，從最小的1B微型模型到最大128B的模型，支持包括GGUF在內(nèi)的多種量化格式，使其能夠靈活地適用于不同場景。這次升級還增大了對大型上下文大小的支持，大多數(shù)設(shè)置的最大token數(shù)約為4096個，但這次升級后銳龍AI Max平臺可以擴展至256000個token，但需要開啟Flash Attention功能，啟用KV Cache Q8，這運行在上下文中保存大量token，使其支持更高級的任務(wù)，例如解析和匯總大型文檔的內(nèi)容。

　　當(dāng)然，上述功能都需要你擁有的銳龍AI Max搭載了128GB內(nèi)存，特別是考慮到該系列處理器使用了板載的LPDDR5X內(nèi)存的情況下。目前擁有這類設(shè)備的用戶可以在AMD官網(wǎng)上下載預(yù)覽版驅(qū)動提前嘗鮮。

原標(biāo)題：AMD為銳龍AI Max帶來更強AI支持可運行128B大模型

責(zé)任編輯：李曉靈