在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

40 年來最大變革,英特爾 Meteor Lake 解析

2023/9/20 9:29:34 來源:IT之家 作者:阿迷 責編:阿迷

在今年英特爾 ON 技術(shù)創(chuàng)新大會上,英特爾正式對最新的 Metror Lake 架構(gòu)進行介紹,這是英特爾首次推出 Intel 4 工藝產(chǎn)品。進一步推進摩爾定律四年五個節(jié)點的目標,目前英特爾正在量產(chǎn) Intel 7 工藝的處理器,此次大會上公布的 Intel 4 工藝的處理器也在爬坡生產(chǎn)中。

預(yù)計到 2023 年下半年,英特爾將投產(chǎn) Intel 3 工藝處理器,2024 年上半年投產(chǎn) Intel 20A 工藝處理器,2024 年下半年投產(chǎn) Intel 18A 工藝處理器。英特爾 12 代、13 代酷睿已經(jīng)順利推出,并提供大量創(chuàng)新型技術(shù),未來英特爾將繼續(xù)在 PC 和邊緣計算領(lǐng)域提供新的創(chuàng)新技術(shù),而此次推出的 Meteor Lake 將是一個重要的節(jié)點,它采用了英特爾首個 AI 加速的 NPU,能在 PC 上高效的實現(xiàn)本地推理,為未來 Arrow Lake 和 Lunar Lake 帶來先導(dǎo)技術(shù)支持。

Meteor Lake 是英特爾公司重要的發(fā)展拐點,除了獨立的 NPU 架構(gòu),還有更多額外的引擎,接下來,我們來詳細看看這次 Meteor Lake 帶來哪些改變。

Meteor Lake 架構(gòu)

Meteor Lake 包括四個獨立的模塊,通過 Foveros 3D 封裝技術(shù)封鏈接。其中包含計算模塊、SoC 模塊、圖形模塊和 IO 模塊。其中計算模塊采用最新一代的能效核和性能核為架構(gòu)以及增強功能,這一部分采用最新一代 Intel 4 制程工藝,能耗相比此前有重大進步。

SoC 模塊集成了 NPU、低功耗島能效核、Wi-Fi 和藍牙,并支持 8K HDR、AV1 編解碼器、HDMI 2.1 及 DP2.1 標準。其中 NPU 部分能帶來高效的 AI 功能表現(xiàn),并兼容 OpenVINO 等標準化程序接口。

圖形模塊部分集成了英特爾銳炫圖形架構(gòu),提供的高達前代 2 倍性能的圖形表現(xiàn)能力。

因為在 SoC 上面 Meteor Lake 有了低功耗的能效核,在匹配已有的能效核和性能核上,就組成了一個三階的高性能混合架構(gòu),對比 12 代和 13 代酷睿產(chǎn)品,英特爾在混合架構(gòu)上有了一個新的層級。

在 AI 的支持上,Meteor Lake 提供 NPU 能與所有計算引擎的內(nèi)置 AI 功能結(jié)合實現(xiàn)更高能效的 AI 計算。其中 GPU 具有性能并行性和高吞吐量,非常適合在媒體、3D 應(yīng)用和渲染管道中引入 AI 功能。NPU 則是一個專用的低功耗 AI 引擎,用于維持 AI 運行和 AI 卸載。CPU 則具有快速響應(yīng)能力,非常適合輕量級、單推理、低延遲的 AI 任務(wù)。通過 GPU、NPU、CPU 不同層級的 AI 算力網(wǎng)絡(luò),Meteor Lake 能很好的實現(xiàn)本地 AI 能力。將 AI 從云端引入到客戶端 PC 和企業(yè)邊緣 PC。

我們順著 Meteor Lake 的整體架構(gòu)再來細看一下每個具體部分。首先來看下這次變化比較大的 SoC 模塊,這部分包含兩個總線,分別是 NOC 總線和 IO Fabric 總線,其中 NOC 總線特點是高帶寬、快速響應(yīng),能讓掛載在該總線上的設(shè)備能快速、低功耗的訪問整個內(nèi)存,同時 NOC 總線也起到連接計算模塊和圖形模塊的作用,SoC 模塊內(nèi)與該總線直連的設(shè)備包括低功耗的能效核、內(nèi)存控制器、多媒體區(qū)塊、NPU、IPU 等。

底下的 IO Fabric 總線主要連接 PCIe、USB 3/2、SATA、Wi-Fi 與藍牙、網(wǎng)絡(luò)、傳感器、音頻等相關(guān)的設(shè)備,另外還有芯片級別的 SSE 安全引擎和平臺級的安全模塊。通過 IO Fabric 總線,與外部的 IO 模塊連接,IO 模塊中集成了 USB 4、Thunderbolt 4、PCIe 控制器。

最新的 Meteor Lake 每個模塊都有專屬的電源管理模塊,這些模塊會相互協(xié)同工作,與上層操作系統(tǒng)和和軟件協(xié)同,以此實現(xiàn)模塊化、系統(tǒng)級別的電源管理。SoC 模塊中的低功耗島強調(diào)在極致性能前提下實現(xiàn)更低的能耗以此延長電腦使用時間,許多外部設(shè)備模塊都集中在 SoC 上,SoC 上集成的大部分功能可以滿足大部分用戶大部分的使用需求,在高性能計算和圖形計算上就要用到計算模塊和圖形模塊。

接下來就是不同核心之間調(diào)度的問題,考慮到 SoC 中的低功耗效能核和計算模塊中的性能核與效能核都參與 PC 的計算過程,因此任務(wù)調(diào)度對于 Meteor Lake 而言也是一個重要的話題。在此前性能核和效能核的二級混合架構(gòu)基礎(chǔ)上,SoC 低功耗效能核作為第三級混合架構(gòu)無疑增加了調(diào)度的復(fù)雜度。

針對不同線程日常的使用,英特爾硬件線程調(diào)度器也對 SoC 中低功耗效能核進行適配。這次英特爾與微軟共同將常見的指令進行分類。

Class 0 代表性能核和效能核在執(zhí)行指令時每個時鐘周期內(nèi)指令數(shù)量基本一致的情況,Class 1 代表性能核在每個時鐘周期內(nèi)指令數(shù)量大于效能核的情況,比如浮點運算指令,Class 2 代表性能核在每個時鐘周期內(nèi)指令數(shù)量遠遠大于能效核的情況,比如 AI 計算,Class 3 則代表能效核每個周期指令數(shù)量大于性能核的情況。根據(jù)指令的不同,英特爾線程調(diào)度器就會提供一個反饋表,對每個核心進行打分,其中 EE 代表能效,Perf 代表性能。分數(shù)高的核心就會被優(yōu)先推薦給操作系統(tǒng)使用。我們以上圖為例,如果操作系統(tǒng)想要追求性能,那么英特爾線程調(diào)度器就會推薦使用 P-Core N,操作系統(tǒng)根據(jù)這些推薦就會將相關(guān)任務(wù)放到這一核心上;如果操作系統(tǒng)想要追求更好的能耗表現(xiàn),那么線程調(diào)度器就會推薦 E-Core N。針對不同等級的任務(wù)類型,線程調(diào)度器能動態(tài)的為操作系統(tǒng)推薦合適的核心。

與之前的硬件線程調(diào)度相比,Meteor Lake 增強了對操作系統(tǒng)的反饋,當其他進程占用功耗的時候,核心功耗會被動態(tài)分配,以此境轉(zhuǎn)的報告整個核心和每個核的能力,通過內(nèi)部功耗比的評估和判斷,Meteor Lake 上的硬件線程調(diào)度器更加精準的將反饋表提供給操作系統(tǒng)。

全盤對平臺的系統(tǒng)操作模式、軟件操作模式、平臺硬件特征等特點,納入控制邏輯中,讓硬件線程調(diào)度器對三階高性能混合架構(gòu)有更好的支持。

圖形和媒體部分,這里 Meteor Lake 將原先位于 GPU 的多媒體和顯示引擎轉(zhuǎn)移到 SoC 模塊中,IO 模塊上有一個物理顯示接口負責顯示信號的輸出。

升級后的多媒體引擎最高支持 8K 60Hz 10bit HDR 視頻解碼和 8K 30Hz 10bit HDR 視頻編碼,并支持 VP9、AVC、HEVC、AV1 以及其他傳統(tǒng)格式。

顯示引擎部分則對功耗進一步優(yōu)化,并進行全路徑的壓縮,當遇到顯示輸出和顯示解決方案不匹配的情況,通過這一壓縮技術(shù)能很好的提供顯示輸出。

另外這一顯示引擎還支持 HDMI 2.1、DP2.1 以及完整的 eDP 1.4 輸出規(guī)范,分辨率最高支持 8K 60Hz HDR,或 4 個 4K 60Hz HDR 輸出。

接下來是 Meteor Lake 的圖形模塊部分,相比于上代顯卡產(chǎn)品,這次 Meteor Lake 擁有更高的主頻和更低的典雅,在互聯(lián)的緩存上也做了很多優(yōu)化,核心頻率得到提升。

Meteor Lake 擁有 8 個 GPU 核心和 128 個矢量引擎,幾何圖形渲染管線增加到 2 條,另外還有 8 個采樣器和 4 個紋理映射單元,另外還新增了 8 個硬件光追單元。

這次 Meteor Lake 的圖形模塊繼承了英特爾獨顯產(chǎn)品的一些先進特性,同時對 DX12 Ultimate 進行了更多的優(yōu)化,光追在游戲、生產(chǎn)率和科學研究上也帶來了更好表現(xiàn)。

在 Blender 軟件下,相比于 CPU,Meteor Lake 的 GPU 能帶來 2 倍以上的性能提升。

其他技術(shù)方面,Meteor Lake 帶來了全新的 Wi-Fi 7 網(wǎng)絡(luò),這一網(wǎng)絡(luò)技術(shù)大大提高了數(shù)據(jù)吞吐率,并提高了多路并發(fā)性能。另外還 Meteor Lake 還對藍牙 5.4 規(guī)范進行支持,包括新的音頻編解碼規(guī)范,能夠大大降低功耗時延,提升音頻品質(zhì)。

英特爾連接管理軟件 ICPS 在業(yè)界是很受歡迎的,在 Meteor Lake 上升級到 3.0 版本,繼續(xù)在設(shè)備的無線和有線網(wǎng)絡(luò)連接上做提升。英特爾的 Unison 多設(shè)備互連軟件可以跨生態(tài)系統(tǒng)、跨設(shè)備種類,不僅是 Windows 操作系統(tǒng),我們還可以支持 Mac OS、iOS、iPAD OS,可以支持各種安卓智能設(shè)備,跨生態(tài)系統(tǒng)、跨設(shè)備種類,通過英特爾 Unison 軟件,把 PC、手機、平板以及其他的智能設(shè)備做互聯(lián)互通。這是一個很成熟的軟件方案,在 Meteor Lake 上英特爾也會推出第二代 Unison 軟件。

再一個就是 Wi-Fi Sensing 技術(shù),這項技術(shù)利用筆記本現(xiàn)有的 Wi-Fi 和天線,在不增加額外硬件基礎(chǔ)的情況下,通過軟件做到人體接近感應(yīng),比如喚醒操作系統(tǒng),或是人體遠離自動降低功耗鎖定系統(tǒng)等,未來英特爾也將會利用 Wi-Fi 進行定位或手勢識別等。

Meteor Lake 也對 Thunderbolt 4 有很好的支持,通過更強大的吞吐能力和帶寬表現(xiàn),實現(xiàn)存儲、顯示、虛擬化方面的擴展。

Intel 4 制程及 Foveros 工藝

接下來,我們看一下 Meteor Lake 所采用的 Intel 4 制程工藝。根據(jù)此前英特爾公布的 IDM 2.0 戰(zhàn)略,英特爾計劃在四年實現(xiàn)五個制程節(jié)點,Intel 4 是這一戰(zhàn)略中的第二個節(jié)點。

此前的 Intel 7 制程是英特爾能夠持續(xù)提升節(jié)點性能的力證,其晶體管優(yōu)化聚焦于性能。而這次 Meteor Lake 傷的 Intel 4 制程工藝旨在利用極紫外光刻技改善良率和面積微縮,進一步實現(xiàn)高能效,為 Intel 3 奠定基礎(chǔ)。

目前正在開發(fā)的 Intel 3 制程工藝將帶來密度更高的設(shè)計庫,增加驅(qū)動電流的晶體管并降低通孔電阻,更多的使用 EUV 光刻技術(shù)。未來的 Intel 20A 標志著英特爾進入埃米時代,將采用 Ribbon FET 和 PowerVin 技術(shù),而后續(xù)的 Intel 18A 則繼續(xù)基于 Intel 20A 打造,將每瓦性能再提升 10%,并奠定英特爾制程節(jié)點的領(lǐng)先地位。

這次 Meteor Lake 所采用的 Intel 4 實現(xiàn)了 2 倍面積微縮,以此帶來高性能邏輯庫,同時還引入了多項創(chuàng)新。

其中 EUV 光刻技術(shù)簡化和改進互聯(lián)架構(gòu)設(shè)計,雖然 EUV 光刻機售價高昂,但確實給英特爾的新制程帶來了巨大的簡化。Intel 4 在 EUV 加持下,掩碼減少了 20%,工藝步驟減少了 5%,同時 Intel 4 還兼容 EMIB 和 Foveros 封裝技術(shù)。

封裝技術(shù)方面,英特爾在今年馬來西亞客機巡展上介紹從 Meteor Lake 開始,F(xiàn)overos 封裝技術(shù)將引入客戶端產(chǎn)品,打造性能更加強大的筆記本電腦。

雖然 13 代酷睿處理器的多種功能都被整合到 SoC 上,但隨著這些功能日趨多樣,并變得越來越復(fù)雜,設(shè)計和制造這些單片式系統(tǒng)級芯片的難度越來越大,成本也越來越高。為了解決這一技術(shù)難題,F(xiàn)overos 封裝技術(shù)就出現(xiàn)了,它利用高密度、高帶寬、低功耗互連,將多種制程工藝制造的諸多模塊組合成大型分離時模塊架構(gòu)組成的芯片復(fù)合體。

此前,英特爾在數(shù)據(jù)中心 GPU Max 系列產(chǎn)品中首次采用了擴展的 Foveros 封裝技術(shù) ——Co-EMIB 實現(xiàn)對 GPU Max 產(chǎn)品封裝。而此次全新推出的 Meteor Lake 處理器將首次將 Foveros 技術(shù)引入客戶端產(chǎn)品中。

Meteor Lake 處理器在架構(gòu)上的巨大調(diào)整,帶來了封裝上的挑戰(zhàn),這一是一款三模塊芯片,提供大電容的圖形模塊、使用 Fovers 36X 間距芯片連接的 SoC 模塊以及采用 Intel 4 制程工藝打造的計算模塊,其中計算模塊的 IO / 供電和芯片間路由采用金屬層。

由于 Meteor Lake 架構(gòu)整體結(jié)構(gòu)的復(fù)雜性,這對封裝帶來更多的挑戰(zhàn),其組裝流程共分為五個步驟,首先從晶圓廠和外部代工廠將晶圓切割成單個芯片;其次則對單芯片進行測試確保芯片質(zhì)量才能進入 Foveros 組裝階段,這種測試是保障異構(gòu)設(shè)計可靠的關(guān)鍵所在;第三步則對基板上的晶圓組裝,通過芯片附著、底部填充、晶圓模具組裝等操作,以及碰撞、鈍化、研磨、拋光等制造流程,實現(xiàn)晶圓組裝;緊接著,Meteor Lake Foveros 復(fù)合體在 BGA 基板上進行封裝組裝,目前這種復(fù)合體兼容現(xiàn)有的封裝組裝工具和工藝,只需要進行少許優(yōu)化即可完成;最后則對封裝好后的芯片進行測試,包括壓力、老化測試以及類測試、系統(tǒng)級平臺測試,測試完成后,芯片即可推向市場進行組裝生產(chǎn)。

Foveros 先進工藝相比于 Raptor Lake 有很多優(yōu)勢,其凸點間距只有 36u,跡線寬度小于 1 微米,凸點密度提高近 8 倍,跡線長度小于 2 毫米,帶寬達到 160GB/s/mm,功耗小于 0.3pJ / 位。這樣的提升,大幅降低了低功耗晶片互連分區(qū)開銷,同時小區(qū)塊也提高了晶圓的良率,另外能為每個區(qū)塊選擇理想的硅工藝,以此降低成本和性能,簡化 SKU 的創(chuàng)建可以更容易提高定制能力。這些都為 Meteor Lake 良品率的提升和成本控制帶來益處。

目前,英特爾正進行超過以支持晶圓級組裝的 Meteor Lake 和后續(xù)產(chǎn)品,這些新的設(shè)施將為 Foveros Direction 9 微米和未來產(chǎn)品提供產(chǎn)能。

此前英特爾從 FCBGA 到 FCLGA 再到 EMIB 和 Foveros,以及后續(xù)的 Foveros Direct 封裝技術(shù)變革,將使英特爾成功踐行四年五個制程節(jié)點的承諾,預(yù)計在 2024-2025 年實現(xiàn) 2.5D 封裝。

NPU 開啟 AI 新篇章

Meteor Lake 處理器擁有獨立的 NPU 加速單元,通過與 CPU、GPU 配合形成三層 AI 加速架構(gòu),互相協(xié)同,帶來強大的人工智能體驗。此次 Meteor Lake 打造的 NPU 架構(gòu)主機接口和設(shè)備管理支持微軟的新驅(qū)動程序模型,這是的 Meteor Lake 的 NPU 能在確保安全性的同時,支持微軟加速驅(qū)動程序模型。

而內(nèi)存管理單元提供多種情況下的隔離,支持電源和工作負載調(diào)度,從而實現(xiàn)快速低功耗狀態(tài)轉(zhuǎn)換。

Meteor Lake 的 NPU 由多個引擎架構(gòu)構(gòu)成,該架構(gòu)配備兩個神經(jīng)計算引擎,可以共同處理單一工作負載或各自處理不同的工作負載。在神經(jīng)計算引擎中包含兩個主要的計算組建,分別是推理古鹽道和 SHAVE DSP,其中推理管道是高能效計算的核心驅(qū)動因素,通過最大限度的減少數(shù)據(jù)移動并利用固定功能運作來處理常見的大計算量任務(wù),可以在神經(jīng)網(wǎng)絡(luò)執(zhí)行中實現(xiàn)高效節(jié)能。

絕大多數(shù)計算發(fā)生在推理管道上,這個固定的功能管道硬件支持標準的神經(jīng)網(wǎng)絡(luò)運作。該管道由一個乘積累加運算陣列、一個激活功能塊和一個數(shù)據(jù)轉(zhuǎn)換塊組成。

SHAVE DSP 是一款專為 AI 設(shè)計的高度優(yōu)化 VLIW DSP,流式混合架構(gòu)向量引擎可以與推理管道和直接內(nèi)存訪問引擎一起進行管道化,實現(xiàn)在 NPU 上并行進行的真正的異構(gòu)計算,從而最大的提高性能。另外還有 DMA 引擎優(yōu)化編排數(shù)據(jù)移動,以此實現(xiàn)最高的能效和性能。

像 MobileNet 網(wǎng)絡(luò)模型,當它復(fù)雜度比較低的時候,使用 CPU 處理是比較快、比較有效的。但是高復(fù)雜度、大規(guī)模運算使用 NPU 更合適,因為 NPU 的處理能力比 CPU 要高,對 AI 的工作負載方面,處理能力更高一些。

Stable Diffusion 作為一個圖像網(wǎng)絡(luò)結(jié)構(gòu),在生成式 AI 中不同場景下所需要的算力密度不同,在對自然語言生成圖像過程中,主要包含文本解碼器、Unet、VAE 三個核心流程,在 CPU、GPU、NPU 上的表現(xiàn)并不相同,所帶來的時間、功率、效率也不盡相同,如果通過 Meteor Lake AI 算力協(xié)同,那么就可以帶來更綜合的表現(xiàn),Unet 正向提示詞跑在 GPU 上面,負向提示詞的 Unet 跑在 NPU 上,這個時間縮短到 11.3 秒,因為有 GPU 的參與,所以功耗為 30W。由此可見不同的任務(wù)放在不同的架構(gòu)上承擔,這樣整體性能很好,功耗也很低。

目前,英特爾正與業(yè)內(nèi)超 100 家合作伙伴進行終端側(cè) AI 應(yīng)用測試,將 AI 引入日常生活中,在 AI API 層,目前英特爾已經(jīng)與微軟共同開發(fā)出 WinML、ONNX RT、DirectML 等接口,以及英特爾自家的 OpenVINO,這些 API 接口都能更好的調(diào)用 CPU、GPU 和 NPU 的底層資源,幫助 AI 應(yīng)用更好實現(xiàn)算力的使用。

除了 Meteor Lake 上最新的 NPU 模塊,英特爾 GPU 在 AI 加速能力上也是非常強大,通過 DP4a 指令集,英特爾 GPU 可以實現(xiàn)一個周期 64 個 INT8 整型累加計算。這在此前英特爾 GPU 架構(gòu)解析中都有提到,這里不再贅述。

通過 CPU、GPU、NPU 三層 AI 算力網(wǎng)絡(luò),Meteor Lake 將客戶端處理器的人工智能加速能力推到了新高度,在這樣的算力網(wǎng)絡(luò)支持下,本地大語言模型、AIGC 相關(guān)話題可以跳脫云上算力,使得 AI 在邊緣計算領(lǐng)域進一步深化。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英特爾Meteor Lake

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知