Intel Goldmont Plus 架构解析:大幅改进,为32核型号打下基础【wikichip】
首页 > 观测 > 数码科技    作者:剧毒术士马文   2017年12月29日 17:27 星期五   11条评论    
时间:2017-12-29 17:27  

本文地址:http://www.moepc.net/?post=4015

看到Goldmont Plus/+的名字,你可能会认为它只是加强版的Goldmont,那么你就错了。实际上Goldmont Plus和前代Goldmont一样,性能都有很大提升。


点击查看原图

Goldmont Plus


点击查看原图

Goldmont


点击查看原图

Silvermont


尽管前端没有改成传闻的4-way decode,不过分支预测单元之类的还是得到了加强。这次大幅改进的是后端。前端的fetch和decode保持3-way,后端加宽到支持4-way allocation和4-way retirement。换言之,Goldmont Plus的最大retire速率达到每周期4条。


QQ截图20171229171404.png


Intel提到Reservation Station(保留站)和Reorder Buffer(重排序缓存)也加大了容量,得以支持更大的乱序执行窗口。相应地Load/Store缓存也有增大。用于寄存器存储数据的某些Store-to-load 转发操作也有性能优化。


QQ截图20171229171833.png


缓存也是一样的待遇,共享L2缓存容量翻倍到4MB,L2 predecode cache(L2预解码缓存)变成Goldmont的400% - 从16KB增加到64KB。此外还增加了一个二级TLB,指令与数据共享。



QQ截图20171229162915.png


执行单元方面改进不少。Integer Execution Cluster(IEC,整数执行丛集)增加到4个端口,新增的第四个端口为独立的Jump Execution Unit(JEU,跳转执行单元),支持更快的分支跳转。AES指令的延迟和输出也有改善。


最有趣的估计要属FDIV 浮点除法器的改动。浮点除法器升级到基于radix-1024的高速设计(10bit)【Broadwell上首次引入,此前的Haswell/Ivy Bridge为radix-16】,各类浮点除法性能都有明显提升。随之还有带宽的显著增加,除法运算延迟也降低到原来的一半以下。



Goldmont的测试数据,Goldmont Plus应该会更上一层。




一直以来Intel低功耗处理器采用Chip-Level Multi Processing(CMP)作为组成的基本模块。【原文是core-level】


3.png



Silvermont、Airmont和Goldmont的一个CMP里只有2个核心 + 共享的1MB L2缓存,可以屏蔽其中一个核心变成单核模块。多个CMP模块通过Point-to-point Interface(IDI)连在一起,挂在System Agent上一条名为Tracker Unit的crossbar一致性总线上。




QQ截图20171229184248.png



比如Silvermont架构的Avoton/Rangeley ,是由4个双核CMP模块组成的8核心


QQ截图20171229162934.png

Avoton,Atom C-2000系列




此前发布的Goldmont架构 16核 Denverton,包含8个双核CMP模块


QQ截图20171229162940.png

Denverton,Atom C-3000系列



随之Goldmont Plus的发布,Intel开始转向四核CMP模块。

Goldmont Plus的一个CMP内包含:4个Goldmont Plus核心 + 共享4MB L2缓存


四核CMP可以屏蔽2个核心,变成双核

比如桌面/移动版的Gemini Lake就是1个CMP,双核也是通过屏蔽得来


不久前发布的桌面/移动版Gemini Lake,由1个四核CMP组成



如果Intel继续Denverton的8 CMP设计,配合新的四核CMP模块,新的C系列就能做到32核心。


QQ截图20171229162945.png

预测的新Atom



本文地址:http://www.moepc.net/?post=4015

via:https://fuse.wikichip.org/news/679/goldmont-plus-detailed-large-improvements-setting-the-stage-for-a-32-core-model/

原作者:David Schor

MOEPC.NET编译,有改动及修正,转载请保留出处。

二维码加载中...
本文作者:剧毒术士马文      文章标题: Intel Goldmont Plus 架构解析:大幅改进,为32核型号打下基础【wikichip】
本文地址:http://www.moepc.net/?post=4015
声明:若无注明,本文皆为“MoePC.net (原My艦これ/Mykancolle)”原创,转载请保留文章出处。

WRITTEN BY

avatar
猪三千Google Chrome 63.0.3239.108Windows 102018-01-02 09:11
板u集成的组nas用过 加个外接电源基本上没声音
剧毒术士马文2018-01-03 01:11
@猪三千:10W TDP
直接被动散热
wangbaisen1990Google Chrome 57.0.2987.108Linux2017-12-30 11:14
atom系列?
剧毒术士马文2017-12-30 23:23
@wangbaisen1990:Atom一家子
wangbaisen1990Google Chrome 57.0.2987.108Linux2017-12-31 08:10
@剧毒术士马文:atom系列竟然还没死绝……
剧毒术士马文2018-01-01 23:53
@wangbaisen1990:低功耗核心还是有用场的
Atom发展了很多代了
wangbaisen1990SouGou Browser 2.XWindows 102018-01-02 20:06
@剧毒术士马文:这玩意作为I/O服务器用的话 比起高通那个如何
chnhiGoogle Chrome 63.0.3239.84Windows 102017-12-30 00:23
相同 功耗 发热 的情况下 能不能有更高的频率实现单线程力拼 core m 。。。
剧毒术士马文2017-12-30 23:22
@chnhi:Core M的性能从来都不是重点...
主要是许多主流架构才支持的特性
ayuGoogle Chrome 57.0.2987.108Linux2017-12-29 23:32
看了半天也没搞明白:这微架构是服务器的,还是桌面端的。
剧毒术士马文Google Chrome 63.0.3239.108Windows 102017-12-29 23:43
@ayu:Goldmont+本身就是Atom产品线延续下来的(祖传24K L1-D $ 笑),低功耗低性能

桌面/移动端只有1个CMP,给最低端的桌面/笔记本,性能低于主流架构奔腾双核

服务器版本能拓展更多核心,适合特定应用,比如I/O IoT 存储

真正的高性能计算还是得主流架构的Server版本

返回顶部    首页     管理  
版权声明       pw:moepc.net或mykancolle.com (有时需加www.) 若被菊爆请留言补档
本站JPEG/PNG均经过Google Guetzli高度压缩
部分内容来源于网络,并不代表本站赞同其观点和对其真实性负责。
如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容。
本站资源仅为个人学习测试使用,请在下载后24小时内删除,不得用于商业用途,否则后果自负,请支持正版!
illust-AMD/Ryohka
Feel free to use your Adblock, we don't have any ads.
Foreign visitors, if you have any questions, leave a comment in English/Japanese/German.
(just copy and paste one Chinese character cauze the anti-spam settings.)   sitemap