就在上周,摩爾線(xiàn)程舉行了 2022 秋季發(fā)布會(huì),推出了首款支持 Windows 環(huán)境和 DirectX 圖形接口的國(guó)產(chǎn)顯卡產(chǎn)品 MTTS80、全新多功能 GPU 芯片“春曉”、面向服務(wù)器應(yīng)用的 MTT S3000,以及元計(jì)算一體機(jī) MCCX。

筆者一開(kāi)始以為,這次會(huì)是一場(chǎng)“PPT 發(fā)布會(huì)”。因?yàn)檫@次摩爾線(xiàn)程的步子實(shí)在邁的太大。但沒(méi)想到就在一周后,這張 MTT S80 實(shí)實(shí)在在的擺在了IT之家的桌面上,而且是裝上主機(jī)就可以在 Windows 下使用,并不需要復(fù)雜的調(diào)試。

在本文中,我們就來(lái)看看這張 MTT S80,為國(guó)產(chǎn)顯卡的發(fā)展邁出了怎樣的一步吧。測(cè)試配置如下:

外觀(guān)設(shè)計(jì)
摩爾線(xiàn)程 MTT S80 的包裝設(shè)計(jì)很是獨(dú)特,上面國(guó)畫(huà)風(fēng)的線(xiàn)條圖案彰顯著它國(guó)產(chǎn)顯卡的賣(mài)點(diǎn)。說(shuō)來(lái)這也是IT之家第一次測(cè)試國(guó)產(chǎn)顯卡,頗有紀(jì)念價(jià)值。

包裝內(nèi)除了顯卡本體外,有一本非常簡(jiǎn)單的說(shuō)明書(shū),以及一根雙 PCIe 8Pin 轉(zhuǎn) CPU 8Pin 線(xiàn)。之所以說(shuō)明書(shū)如此簡(jiǎn)單,是因?yàn)樗陌惭b方法與正常顯卡無(wú)異,裝上去,打開(kāi) Windows,安裝驅(qū)動(dòng),完事。

MTT S80 顯卡本體的設(shè)計(jì)水平相當(dāng)高。整體設(shè)計(jì)方正,金屬風(fēng)滿(mǎn)滿(mǎn)。外殼采用了一體式設(shè)計(jì),并使用鋁合金壓鑄 + CNC 工藝,極大的提升了顯卡的整體結(jié)構(gòu)強(qiáng)度,不用顯卡支架也不用擔(dān)心變形。散熱部分采用 3 風(fēng)扇設(shè)計(jì),2 個(gè) 8cm 風(fēng)扇加上中間的 7cm 風(fēng)扇構(gòu)成了中心對(duì)稱(chēng)的整體布局。

兩側(cè)的風(fēng)扇外緣被兩條弧線(xiàn)包裹,其靈感來(lái)源是數(shù)學(xué)中常見(jiàn)的雙曲函數(shù),與中間圓形 RGB 風(fēng)扇交相輝映,很有設(shè)計(jì)感。這的 3 組風(fēng)扇均支持智能調(diào)速,在保證 GPU 穩(wěn)定工作的同時(shí),還能提供一個(gè)安靜的使用體驗(yàn)。

背板有一整塊金屬保護(hù),中間有一個(gè)摩爾線(xiàn)程 LOGO,右側(cè)通風(fēng)孔在通電后還會(huì)點(diǎn)亮,觀(guān)感非常酷炫。


最炫酷的莫過(guò)于中間的橙色光環(huán)了,點(diǎn)亮后猶如噴薄的火山口,帶來(lái)無(wú)窮的能量。

從顯卡側(cè)面可以看到 S80 密集的散熱鰭片,同時(shí)使用了 4 根 6mm 熱管貫穿散熱片整體,幫助熱量從 GPU 芯片和顯存上盡快傳遞到散熱鰭片上。

最棒的設(shè)計(jì)莫過(guò)于側(cè)面的 8Pin 電源接口了,雖然這會(huì)導(dǎo)致需要更大的機(jī)箱才能兼容,但也使得機(jī)箱正面觀(guān)感變得更簡(jiǎn)潔美觀(guān)。

側(cè)面接口部分,采用了目前高端顯卡才配備的 3 個(gè) DP1.4a 和一個(gè) HDMI2.1 接口,可以支持最高 8K 的視頻輸出。

最后需要注意的是,MTT S80 是首批使用 PCIe 5.0 接口的顯卡,也是一款支持 PCIe 5.0*16 接口的顯卡,這意味著最好搭配比較新的主板才能實(shí)現(xiàn)最好的接口性能。所以摩爾線(xiàn)程京東旗艦店會(huì)選擇以 2999 搭一個(gè)華碩 B660M 主板的方式進(jìn)行售賣(mài)。

架構(gòu)解析
摩爾線(xiàn)程 MTT S80 搭載了一顆基于 MUSA 架構(gòu)的多功能 GPU 芯片“春曉”,相較于摩爾線(xiàn)程在今年 3 月發(fā)布的“蘇堤”,“春曉”內(nèi)置的四大計(jì)算引擎全面升級(jí),可以同時(shí)支持圖形圖像渲染、8K 視頻編解碼、AI 訓(xùn)練和推理、通用計(jì)算、GPU 虛擬化、物理仿真等多種功能。

核心參數(shù)方面,MTT S80 基于臺(tái)積電 7nm 工藝打造,擁有 4096 個(gè) MUSA 核心,主頻 1.8GHz、16GB GDDR6 顯存,顯存位寬 256bit,核心內(nèi)集成了 220 億個(gè)晶體管,內(nèi)置 MUSA 架構(gòu)通用計(jì)算核心以及張量計(jì)算核心,可以支持 FP32、FP16 和 INT8 等計(jì)算精度。

我們也對(duì) MTT S80 進(jìn)行了拆解,整張卡的拆解非常簡(jiǎn)單,擰開(kāi)所有可見(jiàn)的螺絲就可以取下背板和擋板。內(nèi)部做工是相當(dāng)規(guī)整的,顯存為 8 顆三星 GDDR6 閃存,每顆 2GB,組成了 16GB 的大顯存。

核心代號(hào)為 SD102AA-500,基于摩爾線(xiàn)程的 GPU 芯片“春曉”打造。

MTT S80 最特別的地方在于,它是國(guó)內(nèi)率先支持 Windows 環(huán)境和 DirectX 圖形接口的 GPU。發(fā)布會(huì)上摩爾線(xiàn)程表示,目前 MTT S80 的 Windows 驅(qū)動(dòng)已經(jīng)內(nèi)置了 MUSA DirectX Driver 模塊,并已完成對(duì)《暗黑破壞神 3》、《英雄聯(lián)盟》和《穿越火線(xiàn)》等十多款游戲完成適配,還有更多游戲可以運(yùn)行,但還在適配過(guò)程中。不過(guò)至于是否真的如它所說(shuō),我們接下來(lái)就實(shí)測(cè)一下。

理論性能
首先我們進(jìn)行一下理論性能測(cè)試。但在測(cè)試前,我們發(fā)現(xiàn):MTT S80 的確是支持 Windows 和 DirectX 環(huán)境,在硬件層面能夠支持 DirectX 11,但目前驅(qū)動(dòng)還未完成全部功能模塊的開(kāi)發(fā),因此目前只支持 DirectX 9,目前大部分的跑分軟件都是基于 DirectX 11/12 的。所以常規(guī)的測(cè)試我們就不能進(jìn)行了,只能另尋辦法。

在 Windows 環(huán)境下有一款可以測(cè)試 DX9 性能的軟件 ——Unigine Valley BenchMark 1.0,在這款軟件中,MTT S80 獲得了 2302 分的成績(jī)。

我們?cè)?Unigine 官網(wǎng)查詢(xún)排行榜,可以看出在這個(gè)項(xiàng)目中 MTT S80 能達(dá)到 GTX 1060 6G 的水平。

像素填充率和紋理填充率也是評(píng)價(jià)顯卡性能的重要指標(biāo)。像素填充率指的是 GPU 在一秒內(nèi)可以渲染到屏幕并寫(xiě)入顯示存儲(chǔ)器的像素?cái)?shù)量,我們用使用 Fillrate Tester 實(shí)測(cè) MTT S80 的像素填充率 FFP - Single texture 成績(jī)?yōu)?188 GPixel / s。作為對(duì)比,RTX 3060 的像素填充率為 85.30 GPixel / s,RTX 3080Ti 的像素填充率為 186.5 GPixel / s。

紋理填充率指的是 GPU 可以在一秒內(nèi)映射到像素的紋理貼圖元素的數(shù)量。我們可以用 3DMark 06 來(lái)進(jìn)行測(cè)試。最終 Multi-Texturing 最高為 170 GPixel / s,作為對(duì)比,RTX 3060 的紋理填充率為 199.0 GTexel / s。RTX 3050 的紋理填充率為 142.2 GTexel / s。之所以不同項(xiàng)目間差距懸殊,是因?yàn)槟壳膀?qū)動(dòng)還未對(duì) CPU 多線(xiàn)程進(jìn)行優(yōu)化,因此圖形負(fù)載越重,MTT S80 表現(xiàn)就越好。一旦未來(lái)驅(qū)動(dòng)優(yōu)化完成,MTT S80 的性能表現(xiàn)會(huì)有進(jìn)一步提升。

除了上面兩款測(cè)試外,Windows 平臺(tái)就沒(méi)有太多跑分軟件了。所以我們轉(zhuǎn)戰(zhàn) Linux 平臺(tái),在 Ubuntu 下看看還能不能測(cè)出一些數(shù)據(jù)。我們?cè)囋嚳词褂?clpeak,測(cè)試它的顯存帶寬以及單精度浮點(diǎn)(FP32)性能。最終測(cè)出來(lái)的數(shù)據(jù)如下:顯存帶寬最大為 365 Gbps、單精度浮點(diǎn)最大為 13.9 TFLOPS。

這大概是一個(gè)什么水平呢?以下是桌面端 RTX 3060 12G 的理論性能,MTT S80 的顯存帶寬和浮點(diǎn)性能都比 RTX 3060 略高一點(diǎn)點(diǎn)。

前面我們有提到,MTT S80 是首款支持 PCIe 5.0 的國(guó)產(chǎn)顯卡,因此我們也測(cè)試了一下它的 PCIe 帶寬,我們?cè)?Ubuntu 下使用 OCL Bandwidth Test 進(jìn)行接口上下行測(cè)試,實(shí)測(cè)上傳最大帶寬為 28G / s,下載最大帶寬為 32G / s,這個(gè)速度是目前大部分主流 PCIe 4.0 顯卡的兩倍??梢哉f(shuō) MTT S80 是一張“戰(zhàn)未來(lái)”的顯卡了。

從上面我們的測(cè)試來(lái)看,MTT S80 在不考慮環(huán)境兼容性的情況下,純理論性能可以做到 RTX 3060-RTX 3060Ti 的水平。而在 Windows 環(huán)境下,由于驅(qū)動(dòng)對(duì) DirectX 和 OpenGL 環(huán)境還在努力適配,因此不同軟件中的性能差距很大。可以說(shuō)摩爾線(xiàn)程 MTT S80 這次的硬件水平是相當(dāng)在線(xiàn)的,驅(qū)動(dòng)適配雖然暫時(shí)跟不上主流水平,但也為國(guó)產(chǎn)顯卡開(kāi)了一個(gè)好頭。
游戲體驗(yàn)
前面我們有說(shuō)過(guò),MTT S80 是首款支持 Windows 和 DirectX 環(huán)境的國(guó)產(chǎn)顯卡,那么它的實(shí)際游戲體驗(yàn)怎么樣?前面我們有提到,MTT S80 暫時(shí)只支持 DirectX 9 環(huán)境,所以我們只能選擇一些比較老,但是受眾廣泛的游戲來(lái)測(cè)試。以下游戲我們均開(kāi)到 1080P 低畫(huà)質(zhì)運(yùn)行。首先是《英雄聯(lián)盟》,達(dá)到了 140-150 幀,可以滿(mǎn)足電競(jìng)級(jí)顯示器暢玩。

如果開(kāi)到 1080P 高畫(huà)質(zhì),幀數(shù)則會(huì)來(lái)到平均 136 幀左右,同樣也能流暢游玩。

最后我們嘗試一下 2K 高畫(huà)質(zhì),平均幀數(shù)還能維持在 120 幀以上,表現(xiàn)很不錯(cuò)了。

《QQ 飛車(chē)》默認(rèn)鎖 30 幀,自然是可以暢玩。

《穿越火線(xiàn)》的平均幀數(shù)高達(dá) 180 幀,完全可以流暢游玩。

《暗黑破壞神 3》是摩爾線(xiàn)程在發(fā)布會(huì)上演示的游戲,我們實(shí)測(cè)下來(lái)也確實(shí)可以滿(mǎn)足 90-100 幀左右流暢游玩。

《我的世界》也得到了適配。但筆者發(fā)現(xiàn)網(wǎng)易版是打不開(kāi)的,微軟版可以直接打開(kāi),但幀數(shù)在平均 40-50 幀左右,不算很流暢,但已經(jīng)可以玩了。

最后我們測(cè)試一下《CS:GO》,這款游戲玩起來(lái)還是很流暢的。我們運(yùn)行 Benchmark 可以達(dá)到 213 幀左右的平均幀數(shù)。

從上述游戲的適配情況可以看出,摩爾線(xiàn)程目前的思路是優(yōu)先適配那些受眾廣泛的國(guó)民級(jí)游戲,來(lái)提高國(guó)產(chǎn)顯卡的接受程度,然后再回頭去適配那些精品的小眾游戲,這樣的發(fā)展思路無(wú)疑是正確的。

視頻編解碼
對(duì)于一款家用顯卡來(lái)說(shuō),不僅僅要能玩游戲,更要有出色的視頻編解碼能力。在發(fā)布會(huì)上摩爾線(xiàn)程表示,MTT S80 不僅支持 H.264、H.265 (HEVC),還加入了最新的 AV1 編解碼能力,并有三個(gè) DP 1.4a 接口和一個(gè) HDMI 2.1 接口,每個(gè)接口均可輸出 8K、4K 畫(huà)面。

筆者首先嘗試在油管打開(kāi)一個(gè) 4K 的在線(xiàn)視頻,觀(guān)感是非常流暢的,沒(méi)有遇到編解碼不暢帶來(lái)的卡頓。從控制面板中可以看到,MTT S80 也被正常調(diào)用進(jìn)行 GPU 加速了。

那么它的視頻編解碼性能和效率究竟如何呢?我們需要回到 Linux 環(huán)境下,使用 ffmpeg 工具調(diào)用 vappi 的硬件編解碼加速接口,選擇不同格式的碼流來(lái)進(jìn)行測(cè)試,從我們的測(cè)試結(jié)果看,可以正常并行解碼多路 H.264、H.265、VP9 和 AV1 等格式的視頻,并且可以實(shí)現(xiàn)多路 H.264、H.265 的并行編碼,以及多種格式間的視頻轉(zhuǎn)碼。
我們準(zhǔn)備了一個(gè) 1080p 的視頻 YUV 數(shù)據(jù),采用 H.265 進(jìn)行多路編碼,為了盡量增加編碼器的壓力,測(cè)試時(shí)采用 9 路編碼并行,從測(cè)試結(jié)果可以看到每路的編碼的幀率為 183fps,總體性能超過(guò) 1080p1600fps。

另外我們也對(duì)解碼的性能做了些測(cè)試,多路壓測(cè)解碼 1080p 的視頻時(shí),總幀率也可以超過(guò) 1200fps。如下是 VP9 格式的 1080p 視頻并行 10 路解碼時(shí)的單路性能,可以看到幀率為 122fps。

可以說(shuō),MTT S80 的視頻編解碼性能是在線(xiàn)非常強(qiáng)的,硬件能力上已經(jīng)打好了基礎(chǔ)。對(duì)于大部分內(nèi)容消費(fèi)者們來(lái)說(shuō),買(mǎi)回來(lái)就可以直接用,看 4K HDR 視頻也毫無(wú)壓力。對(duì)于視頻創(chuàng)作者們來(lái)說(shuō),MTT S80 硬件的編碼能力也是很強(qiáng)的。但目前暫時(shí)沒(méi)有剪輯軟件適配。據(jù)摩爾線(xiàn)程內(nèi)部產(chǎn)品人士的反饋,目前他們正在積極與國(guó)內(nèi)外視頻編輯類(lèi)軟件進(jìn)行驅(qū)動(dòng)和 API 適配,希望未來(lái)可以逐步滿(mǎn)足消費(fèi)者視頻編輯的需求。摩爾線(xiàn)程能與一些國(guó)產(chǎn)剪輯軟件一起,推進(jìn)剪輯軟件的適配。
AI 與計(jì)算
得益于全功能 MUSA 架構(gòu),MTT S80 還可以應(yīng)用在 AI 訓(xùn)練方面,比如開(kāi)發(fā)者可以通過(guò) MUSA 軟件棧將現(xiàn)有 AI 模型簡(jiǎn)單、快捷的遷移到 MTT S80 上;兼容性方面,MTT S80 兼容 PyTorch、TensorFlow 等多種主流深度學(xué)習(xí)框架,并實(shí)現(xiàn)了對(duì) Transformer、CNN、RNN 等數(shù)十類(lèi) AI 模型的優(yōu)化。
前面我們的測(cè)試中,MTT S80 的單精度浮點(diǎn)性能很強(qiáng),因此在很吃單精度浮點(diǎn)性能的 AI 高精度推理上能展現(xiàn)強(qiáng)大的性能,滿(mǎn)足對(duì)數(shù)據(jù)計(jì)算精度要求極高的場(chǎng)景,如醫(yī)療、金融等應(yīng)用領(lǐng)域。比如 MTT S80 特別適配了醫(yī)療領(lǐng)域 AI 開(kāi)源框架 MONAI,實(shí)現(xiàn)多種任務(wù)的高精度推理。
最大的黑科技還是“CUDA on MUSA”。為了降低用戶(hù)的遷移成本,摩爾線(xiàn)程專(zhuān)為使用 CUDA 語(yǔ)言的用戶(hù)開(kāi)發(fā)了一套 CUDA ON MUSA 的兼容方案?;谀柧€(xiàn)程提供的 porting 工具,通過(guò)編譯與運(yùn)行兩步就可以讓 CUDA 源碼運(yùn)行在摩爾線(xiàn)程 MUSA 架構(gòu) GPU 上。

總結(jié):國(guó)產(chǎn)顯卡的一大步
從筆者今天的評(píng)測(cè)中能看出,MTT S80 的硬件性能已經(jīng)達(dá)到了主流甜品級(jí)的水平,這無(wú)疑是整個(gè)國(guó)產(chǎn)顯卡行業(yè)的一大步。但最大的難點(diǎn)還是在于后續(xù)如何開(kāi)發(fā)驅(qū)動(dòng)程序,由于計(jì)算機(jī)圖形的專(zhuān)業(yè)性非常強(qiáng),全球能夠懂得開(kāi)發(fā) Windows 驅(qū)動(dòng)的人本來(lái)就少,其中大部分都集中于西方國(guó)家,在中國(guó)的專(zhuān)業(yè)人士屈指可數(shù)。處于初創(chuàng)階段的國(guó)內(nèi) GPU 企業(yè)需要快速推出市場(chǎng)化的 GPU 產(chǎn)品,但面臨的難題在于背景是芯片設(shè)計(jì)、底層驅(qū)動(dòng)開(kāi)發(fā)等關(guān)鍵領(lǐng)域人才匱乏、團(tuán)隊(duì)缺少磨礪。所以開(kāi)發(fā)通用 GPU 絕非易事。

即便是做了十幾年核顯,市場(chǎng)占有率第一的 intel,在進(jìn)軍獨(dú)立顯卡市場(chǎng)時(shí)也遇到了驅(qū)動(dòng)開(kāi)發(fā)的挫折,更何況是對(duì)于一個(gè)初創(chuàng) 2 年的新玩家呢?國(guó)產(chǎn) GPU 想要做到對(duì)舊有軟件生態(tài)的兼容,無(wú)疑是一個(gè)漫長(zhǎng)而艱難的過(guò)程。我們不得不承認(rèn),自主創(chuàng)新是一條非常艱難的路,但也是一條不得不走的路。最近美國(guó)一紙禁令,英偉達(dá)就不得不對(duì)中國(guó)斷供指定型號(hào)的 GPU 芯片,未來(lái)會(huì)發(fā)生什么樣的摩擦我們更是難以想象,所以我們必須做好充足的準(zhǔn)備。

但我們今天也有幸看到,摩爾線(xiàn)程邁出了兼容主流平臺(tái)的第一步,就我們手上的這個(gè) MTTS80 來(lái)說(shuō),對(duì)于大部分輕度使用的消費(fèi)者們,買(mǎi)來(lái)直接插在 Windows 電腦上就可以用,看看視頻打打 LOL 啥的也沒(méi)問(wèn)題,這無(wú)疑是值得慶幸的。但我們也應(yīng)當(dāng)理性看待,不能指望摩爾線(xiàn)程一步登天,直接做出主流級(jí)別的產(chǎn)品,因此筆者在評(píng)價(jià)摩爾線(xiàn)程 MTT S80 時(shí),也給予了最大的鼓勵(lì)與寬容。當(dāng)然,還是希望摩爾線(xiàn)程能盡快推動(dòng)各類(lèi)游戲和應(yīng)用的適配,充分釋放這顆強(qiáng)大的核心,回應(yīng)整個(gè)國(guó)產(chǎn)行業(yè)的期待。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。