[摘要]AMD要進軍人工智能領域、挑戰(zhàn)英偉達,它需要軟、硬件兩方面的準備工作:媲美甚至超過英偉達的顯卡,支持主流人工智能框架的顯卡軟件平臺。
騰訊數碼訊(文心)據InfoWorld網站報道,目前,用于機器學習應用的顯卡市場基本上是一家公司的天下:英偉達。
AMD是另外一家主流獨立顯卡廠商,市場份額達到30%,英偉達市場份額為70%。在機器學習領域,英偉達的領先優(yōu)勢可以用一個詞來描述:一家獨大。原因不僅僅是英偉達產品在所有支持顯卡的云服務中占有壓倒性優(yōu)勢,應用在機器學習中的顯卡中間件大體上都是英偉達的CUDA(統(tǒng)一計算設備架構)。
AMD很早就制定了反擊計劃。除一直在開發(fā)在價格和性能上能與英偉達競爭的硬件產品外,它還在打造一個與廠商無關的顯卡編程資源平臺,使開發(fā)者在開發(fā)采用顯卡的解決方案時能自由地選擇AMD技術,而無需擔憂軟件支持。
AMD最近公布了實現(xiàn)這些目標的新措施。首先是一款新顯卡產品——Radeon Vega(基于之前公布的新顯卡架構);其次是新版開放源代碼軟件平臺ROCm——使機器學習框架和其他應用能利用多種顯卡的軟件層。
這兩個元素——硬件和軟件,同等重要。對于AMD反擊英偉達在機器學習領域的優(yōu)勢來說,兩者缺一不可。
AMD新一代明星顯卡:Vega
長期以來,AMD一直致力于提供性價比最高的產品,無論是處理器還是顯卡(或長期以來傳言中的二合一產品)。Vega——AMD的新一代顯卡,目標不是成為英偉達Pascal系列顯卡的高性價比替代品,而是完全擊敗Pascal。
InfoWorld 表示,AMD披露的早期跑分顯示,Radeon Vega Frontier Edition顯卡(一款專業(yè)級Vega顯卡),在DeepBench中的跑分是英偉達Tesla P100顯卡的1.38-1.51倍——與使用的英偉達驅動程序版本有關。
盡管跑分這種事兒不必過于認真,但如此大幅度的性能差距仍然給人留下深刻印象。重要的還有AMD產品的價格。Tesla P100零售價約為1.3萬美元(約合人民幣8.9萬元),AMD尚未披露Vega Frontier價格。即使Vega Frontier價位與Tesla P100相當,它也還是很有吸引力的,符合AMD的總體商業(yè)策略。
AMD應對CUDA的技術:ROCm
對于AMD在機器學習領域獲得優(yōu)勢更重要的不是在價格上擊敗英偉達,而是確保其硬件在常見機器學習應用中得到與英偉達至少同等程度的支持。
大體上,利用顯卡進行加速的軟件,都使用英偉達的CUDA庫文件——只支持英偉達硬件。開放源代碼的OpenCL庫,在多種類型設備上提供與廠商無關的支持,但性能不如CUDA等專用解決方案。
AMD沒有努力改進OpenCL,使之可以與CUDA媲美——這是一個由委員會推動的緩慢過程,而是打造自己的開放源代碼顯卡計算平臺ROCm(Radeon開放計算平臺)。AMD的理念是,ROCm為顯卡——主要是AMD自家顯卡,提供了一個與語言和硬件無關的中間件層,從理論上說適用于任何顯卡。如果有需要,ROCm還可以通過OpenCL與顯卡通訊,但也提供有直接與底層硬件通訊的渠道。
InfoWorld稱,與OpenCL相比,ROCm能大幅提升機器學習應用的性能,這一點是毋庸置疑的。把Caffe框架移植到ROCm,速度比OpenCL版提升了約80%。另外,AMD還宣稱,移植代碼利用ROCm是一個高度自動化的過程,這是現(xiàn)有框架嘗試ROCm的又一個“誘因”。對其他框架的支持——例如TensorFlow和MxNet,也在規(guī)劃中。
AMD著眼于長遠考慮
AMD心目中的最終目標并不復雜:創(chuàng)建一個環(huán)境,使其顯卡在機器學習領域能替代英偉達產品。AMD可以通過以相當的價格提供性能相當甚至更高的硬件,確?,F(xiàn)有的機器學習軟件生態(tài)鏈能在其顯卡上運行來實現(xiàn)其目標。
在某種程度上,移植軟件是最簡單的部分。移植軟件基本上就是聘請足夠多的編程人員,為最重要的開放源代碼機器學習框架改寫需要的代碼,然后隨著硬件和框架不斷發(fā)展而更新代碼。
對于AMD來說最困難的工作,可能是在大規(guī)模提供顯卡的應用中取得立足之地。Amazon Web Services、Azure和Google Cloud Platform中的顯卡都是英偉達產品。需求尚不支持其他顯卡。但是,如果新一代機器學習軟件更加獨立于顯卡,云服務提供商將失去一個不采用Vega或其后續(xù)產品的借口。
AMD引導其顯卡在機器學習領域需求的任何計劃都是大膽的。AMD要成功需要數年時間,因為它面對的是一個英偉達已經稱霸多年的世界。
來源:InfoWorld