硬件丨英特尔公开12代酷睿、Xe HPG高性能独显细节

在昨天的英特尔架构日活动上，英特尔官方正式公布了12代AlderLake处理器的详细信息。12代酷睿采用了大小核混合架构设计，其中大核心为“性能核心”(PerformanceCores)，或者“P核心......

在昨天的英特尔架构日活动上，英特尔官方正式公布了12代AlderLake处理器的详细信息。

12代酷睿采用了大小核混合架构设计，其中大核心为“性能核心”(PerformanceCores)，或者“P核心”(P-Cores)，采用GoldenCove架构，最多8核心16线程，支持AVX-512指令集、DLBoost深度学习加速等功能。

小核心则叫做“能效核心”(EfficiencyCcores)，或者“E核心”(E-Cores)，Gracemont架构，最多8核心8线程，不支持超线程。

其中，桌面版最高8+8核心，移动版最高6+8核心，超轻薄本版最高2+8核心，桌面版采用LGA1700接口。

并且为了解决大小核调度问题，英特尔为AlderLake设计了新的“ThreadDirector”(线程调度器)，并与微软全力合作，搭配Windows11的任务调度器，将合适的负载分配给不同核心、线程。

英特尔宣称，该技术可以在最短30微秒的时间里确定一个线程的性质、归属，而传统的系统调度器需要上百甚至几百微秒，还可能分配错误。

另外，ThreadDirector还会针对性地优化频率，尤其是在移动端，保证效率的同时还能提高能效，而且可以在微秒级别调整频率。

AlderLake得益于DDR5和，内存和IOFabric全面提升，分别高达204GB/s和64GB/s。AlderLake拥有多达16条通道，还有4条通道。IPC相比上一代提高19%。

CPU之外，英特尔还公布了XeHPG高性能游戏显卡的部分架构、技术细节。

架构方面，DG2GPU的一个基本组成模块被称为“Xe-Cores”(Xe核心)，每个Xe核心内有16个矢量单元，或者叫矢量引擎，每个每时钟周期可处理256位，又可细分为8个FP32ALU单元，因此每个Xe核心每时钟周期颗处理器128个FP32操作。

同时还有16个矩阵数学单元，或者叫矩阵引擎(XMX)，处理矩阵、张量操作，每个每时钟周期可处理1024位，可以是64个FP16操作，也可以是128个INT8操作。

Xe核心的上一层级是“渲染切片”(RerSlice)，专为DX12Ultimate设计，每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、2个像素后端。

值得一提的是，光追部分支持DirectX光追(DXR)、Vulkan光追。

AlchemistDG2GPU包含最多8个渲染切片，共享大容量二级缓存。

英特尔宣称，通过架构、逻辑设计、电路设计、制程工艺技术、软件的全方位优化，相比于XeLP微架构，XeHPG微架构可以实现1.5倍的频率提升、1.5倍的能效提升。

目前，Intel正与开发人员密切合作，进行Xe微架构的设计，力求与行业标准保持一致。

驱动程序也在统一的代码库中涵盖集成、独立显卡，英特尔称第一款高性能游戏显卡将性能和质量放在首位。

同时，英特尔已经完成了内核显卡驱动程序组件的重新架构，特别是内存管理器、编译器，号称计算密集型游戏的吞吐量平均提高了15％，最多可达80％，而游戏加载时间缩短了25％。

并且英特尔的超采样技术也被外媒曝光，DG2GPU的超采样技术叫做“XeSS”，技术原理和NVIDIADLSS、AMDFSR都有所不同，是通过DP4a、XMX指令实现的，其中MXM矩阵引擎是AI加速的基础。

本文由admin于2025-04-28发表在智农机械网，如有疑问，请联系我们。
本文链接：https://nyjx.s9479.cn/129805739500.html