
在昨天的英特尔架构日活动上,英特尔官方正式公布了12代AlderLake处理器的详细信息。12代酷睿采用了大小核混合架构设计,其中大核心为“性能核心”(PerformanceCores),或者“P核心......
在昨天的英特尔架构日活动上,英特尔官方正式公布了12代AlderLake处理器的详细信息。
12代酷睿采用了大小核混合架构设计,其中大核心为“性能核心”(PerformanceCores),或者“P核心”(P-Cores),采用GoldenCove架构,最多8核心16线程,支持AVX-512指令集、DLBoost深度学习加速等功能。
小核心则叫做“能效核心”(EfficiencyCcores),或者“E核心”(E-Cores),Gracemont架构,最多8核心8线程,不支持超线程。
其中,桌面版最高8+8核心,移动版最高6+8核心,超轻薄本版最高2+8核心,桌面版采用LGA1700接口。
并且为了解决大小核调度问题,英特尔为AlderLake设计了新的“ThreadDirector”(线程调度器),并与微软全力合作,搭配Windows11的任务调度器,将合适的负载分配给不同核心、线程。
英特尔宣称,该技术可以在最短30微秒的时间里确定一个线程的性质、归属,而传统的系统调度器需要上百甚至几百微秒,还可能分配错误。
另外,ThreadDirector还会针对性地优化频率,尤其是在移动端,保证效率的同时还能提高能效,而且可以在微秒级别调整频率。
AlderLake得益于DDR5和,内存和IOFabric全面提升,分别高达204GB/s和64GB/s。AlderLake拥有多达16条通道,还有4条通道。IPC相比上一代提高19%。
CPU之外,英特尔还公布了XeHPG高性能游戏显卡的部分架构、技术细节。
架构方面,DG2GPU的一个基本组成模块被称为“Xe-Cores”(Xe核心),每个Xe核心内有16个矢量单元,或者叫矢量引擎,每个每时钟周期可处理256位,又可细分为8个FP32ALU单元,因此每个Xe核心每时钟周期颗处理器128个FP32操作。
同时还有16个矩阵数学单元,或者叫矩阵引擎(XMX),处理矩阵、张量操作,每个每时钟周期可处理1024位,可以是64个FP16操作,也可以是128个INT8操作。
Xe核心的上一层级是“渲染切片”(RerSlice),专为DX12Ultimate设计,每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、2个像素后端。
值得一提的是,光追部分支持DirectX光追(DXR)、Vulkan光追。
AlchemistDG2GPU包含最多8个渲染切片,共享大容量二级缓存。
英特尔宣称,通过架构、逻辑设计、电路设计、制程工艺技术、软件的全方位优化,相比于XeLP微架构,XeHPG微架构可以实现1.5倍的频率提升、1.5倍的能效提升。
目前,Intel正与开发人员密切合作,进行Xe微架构的设计,力求与行业标准保持一致。
驱动程序也在统一的代码库中涵盖集成、独立显卡,英特尔称第一款高性能游戏显卡将性能和质量放在首位。
同时,英特尔已经完成了内核显卡驱动程序组件的重新架构,特别是内存管理器、编译器,号称计算密集型游戏的吞吐量平均提高了15%,最多可达80%,而游戏加载时间缩短了25%。
并且英特尔的超采样技术也被外媒曝光,DG2GPU的超采样技术叫做“XeSS”,技术原理和NVIDIADLSS、AMDFSR都有所不同,是通过DP4a、XMX指令实现的,其中MXM矩阵引擎是AI加速的基础。