AMD Pinnacle Ridge 技术解析【IPC/工艺/性能】
首页 > 观测 > 数码科技    作者:剧毒术士马文   2018年4月23日 23:39 星期一   39条评论    
时间:2018-4-23 23:39  

本文地址:http://www.moepc.net/?post=4852

原文作者:The Stilt

来源:https://forums.anandtech.com/threads/ryzen-strictly-technical.2500572/page-72#post-39391302


这篇是Summit Ridge的:

AMD Ryzen: 严谨技术解析 http://www.moepc.net/?post=1406


这篇是Raven Ridge的:

AMD Raven Ridge CPU/GPU 架构性能解析【IPC、超频】http://www.moepc.net/?post=4372


Pinnacle Ridge的Zen核心也作出了与Raven Ridge APU同样的改变。


围绕Zen核心的最大变化在于L2缓存的延迟,从Summit Ridge的17 CKLs降至12 CLKs。剩下的就是制程、Scalable Data Fabric(SDF),IMC 和不同组件固件/软件配置。


相较Summit Ridge,Pinnacle Ridge的IPC平均要高约1.5%。部分对延迟敏感的程序(比如WinRAR)能达到8%。


测试采用的都是当时的最新版程序(18年2月-4月),所有公开或者自己编译的程序所用的Intel编译器都打了补丁,防止针对特定厂家CPU的优化。


3.8GHz 单线程IPC测试配置


  • R7 1700 3.8GHz
  • ASUS Crosshair VI Hero (bios 6001, PinnaclePI 1.0.0.0a)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • R7 2700X 3.8GHz
  • ASUS Crosshair VII Hero (bios 0097 – 0505, PinnaclePI 1.0.0.0a – 1.0.0.2)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • Core i7-8700K 3.8GHz (Ring / LLC 3.5GHz)
  • ASUS PRIME Z370-A (bios 0607 / 0613 打了最终版Spectre微码补丁 Spectre µCode 0x84)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • Core i9-7960X 3.8GHz (Mesh / LLC 2.4GHz)
  • ASUS Rampage VI Apex (bios 1102 打了最终版Spectre微码补丁 Spectre µCode 0x2000043)
  • Corsair LPX 3600C16 4x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334



关于表格


“ER”代表“Extremities Removed”,在总值中排除每款处理器成绩过好和过差的测试项目,降低极端情况影响。包括:Pinnacle Ridge的3DPM(过低)和WinRAR(过高);Coffee Lake的GCC(过低)和NBody(过高);Skylake-X的GCC(过低)和Linpack(过高)。


“Excl. >=256b”说明排除了128bit以上指令对性能影响较大的成绩,包括Coffee LakeSkylake-X的Embree、Variable Density Fluid Simulation、Linpack、NBody和X265。【相当于排除了Skylake Client支持的AVX2和Skylake Server支持的AVX2/AVX-512对性能的影响】


几周前我给出的IPC数字和现在的差距比较大,原因是libBullet这项测试。不知为何,以前libBullet在Ryzen CPU上的性能都很差,直到最近不知哪里改了,性能突然能和Intel CPU相当(比原来提升了3倍)。编译的程序、测试方法和系统设置都没动,可能是AGESA或者操作系统的更新解决了某些问题。


3.8GHz 单线程IPC测试结果


点击查看原图


SKU vs SKU 测试结果


测试配置:


  • R7 1800X
  • ASUS Crosshair VI Hero (bios 6001, PinnaclePI 1.0.0.0a)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • R7 2700X
  • ASUS Crosshair VII Hero (bios 0505, PinnaclePI 1.0.0.2)
  • G.Skill FlareX 3200C14 2x8GB, 2933MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • PR Notes: "ASUS Performance Enhancement" == "Default", "Precision Boost Override" & "Precision Boost Override Scalar" == "Auto" (Enabled).
  • Core i7-8700K
  • ASUS PRIME Z370-A (0613 w/ µCode 0x84)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • CFL Notes: Power limits were manually enforced and verified (95W PL1, 119W PL2, 1 second Tau). 1C = 4.7GHz, 2C = 4.6GHz, 3C = 4.5GHz, 4-5C = 4.4GHz, 6C = 4.3GHz.【手动调了功耗限制】
  • Core i7-7820X
  • ASUS Rampage VI Apex (bios 1102 w/ final Spectre µCode 0x2000043 patched in)
  • Corsair LPX 3600C16 4x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • SKL-X Notes: Ring/LLC was limited to 2.4GHz, power limits were manually enforced and verified (140W PL1, 175W PL2, 1 second Tau). Windows Update automatically installs TBM3 application, and therefore it was utilized during the tests. AVX2 / AVX512 offsets were manually enforced and verified. Single threaded workloads: non-AVX2/AVX512 = 4.5GHz (TB3), AVX2 = 4.0GHz, AVX512 = 3.8GHz. nT workloads: non-AVX2/AVX512 = 4.0GHz, AVX2 = 3.6GHz, AVX512 = 3.3GHz.【mesh默认2.4GHz,手动调了功耗限制,单线程频率:AVX2=4.0GHz,AVX512=3.8GHz,一般4.5GHz;多线程频率:AVX2=3.6GHz,AVX512=3.3GHz,一般4.0GHz


点击查看原图



做出的改变


Pinnacle Ridge采用GF 12nm LP(“Leading Performance”)工艺,属于14LPP的加强版。按照GF的说法,12LP提供>10%的性能提升和最多15%的密度提升(相较14LPP)。




Pinnacle Ridge对性能影响最大的调整之一是加速算法 - XFR2。上代Summit Ridge的XFR收到的反响不佳,因为XFR的实用性很差,没有达到宣传所说的效果。Summit Ridge的XFR频率基于活动的CPU核心数,类似于Intel的睿频。





而Pinnalce Ridge的XFR2则取决于物理限制,比如温度、功耗、电流或者稳定性。在达到任何一项限制之前,都可以保持高频率。



PPT: 主板插槽的功率容量

TDC: 主板VRM持续电流

EDC:主板VRM峰值/瞬间电流


400系主板新增的“Precision Boost Overdrive”功能则可以调高上面提到的物理限制的数值。105W TDP的SKU(比如2700X)的默认限制是这样设置的:PPT 141.75W,TDC 95A,EDC 140A,tJMax 85°C(绝对值,不带offset)。


打开“Precision Boost Overdrive”之后(AGESA默认是打开的),PPT基本上不受限制(1000W),TDC增加到114A,EDC增加到168A。主板厂商可以根据主板的设计及电气特征,自行调整这些限制。


人们通常会误以为XFR会自动超频,实则不然,无论是XFR还是XFR2都不会自动超频。XFR/XFR2只会尝试在设置的限制内最大化性能。比如默认的2700X加速频率永远都不会高于4.35GHz(宣传的最大频率)。


同一颗CPU里的不同核心,天生体质也不一样,并不是所有核心都能达到最大频率(需要太高电压)。




AMD给Pinnacle Ridge增加了“特挑核心”的功能,类似Intel Skylake-X的Turbo Boost Max 3.0。体质最好的两个核心能够达到标称的最大频率,其余核心频率略低。在Ryzen Master里,体质最好的核心用金色星星标注,体质第二好的核心则用银色星星标注。


点击查看原图


通常体质最好的是核心0,体质最差的是核心7。顺序可能会有变化,我这里测过的CPU的体质排序也都不一样。目前还不知道会不会有Ryzen的CPU亲和性管理软件,程序运行的单线程性能可能会有些许波动,纯粹看运气(把程序调度到体质好的核心去需要时间)。


一般情况下,体质最好和最差的核心之间的性能差距大约为1.8%,最差情况下大约3.6%(4.2GHz-4.35GHz)。除开“运气”(调度)因素,每颗CPU由于体质不同也有差距。


内存控制器


Pinnacle Ridge的内存控制器和Raven Ridge的相同。这俩的软件配置稍有区别,但用的是同样的PHY IP,控制器固件也是一样的。


相较Summit Ridge,Pinnacle Ridge改进的内存控制器延迟平均(2133-3466)要低<8.7%。当频率低于2666MHz时延迟差距最大,频率越高差距越小。


同时SDF延迟也稍有降低。CCX之间的通信延迟平均降低了<2.2%,也是频率越高差距越小。内存运行在3200MHz时,SDF延迟的改进几乎可以忽略不计。


点击查看原图


虽然Pinnacle Ridge改进了延迟是极好的,但平均内存延迟(DDR4 2133-3466)依然比Intel最接近的对手Coffee Lake高<38%。而且内存极限频率也和Summit Ridge、Raven Ridge相同。现实点估计DDR4 3400-3533,取决于CPU体质、主板和内存。体质好的CPU可能上到3600稳定。受测的所有2700X最多都只能达到DDR4 3400-3533(主板是C7H和B350I PRO AC),无论用什么设置和内存套装都一样。内存测试用的是“Ram Test”,因此要求门槛会比大多数测试媒体高。


测试的样品中:

  • 12.5%的2700X内存能达到3400MHz
  • 25.0%的2700X内存能达到3466MHz
  • 62.5%的2700X内存能达到3533MHz



不同体质CPU的内存控制器也有较大差距。大多数CPU给1.050V SoC电压就能达到DDR4 3466以上,区别在于加压之后。有些U增加SoC电压就能够达到更高内存频率,有的则完全上不去,甚至还有稳定性变差的情况。所有受测样品加压到1.150V SoC电压后稳定性都变差了(错误开始增加)。最稳定的高频都是用低于1.1V SoC电压达成的。


理论上某些主板可能能上的更高,不过总的来说内存超频受到的还是内存控制器本身的限制,而不是主板的信号布线。所以400系主板应该也没法明显提升内存超频性能。


工艺


和上代一样,高端Pinnacle Ridge的超频空间也非常之小。个人而言,我甚至反对超频2700X,因为大多数情况下超频会降低单线程性能。


点击查看原图


如上图所示,大致情况和Summit Ridge、Raven Ridge一致。直到3.5GHz为止都能保持优秀的能效,4.0GHz以下还算理想。再往上电压就会大幅增加,比如4.1GHz就需要在4.0基础上加0.112V电压,功耗也增加了41.5W(34.3%)。


再往上的话散热就成了问题,高端风冷和一体水冷在满载情况下基本会达到极限。开放式风冷测试平台,室温22°C的情况下,用利民的Thermalright Ultra 120 Extreme(搭配68CFM风扇)压制4.1GHz / 1.337V的2700X,拷机温度达到了93°C(包含10°C offset)。


下面这个功耗曲线只包含了VDDCR_CPU的功耗,只有CPU核心的功耗。还要加上CPU SoC的VDDRC_SOC功耗(一般15-30W,看给了多少SoC电压)才是整个CPU的功耗。


点击查看原图


Pinnacle Ridge的高温和降低的电压说明,GF的12LP制程漏电量比14LPP要高得多,降低的功耗没法补上电压的缺口。

4.2GHz往上是可能的,但想日常用基本得用非一体的高端水冷,高端主板,电压也会增加到不够安全的程度。

因此个人建议不要超频,推荐另辟蹊径 - 寻找XFR2留下的可能性。某些华硕主板就有额外的XFR2相关增强【Performance Enhancement设置,C6H/C7H之类的主板已经有了】,能够保持全核4.1GHz以上,两个体质较好的核心保持4.3GHz以上,而无需进入实际的超频模式【进入超频模式的话,如果你超不到4.3往上就相当于降低了单线程性能】。



华硕C7H,C6H更新BIOS后也有PE的设置


降低的那点全核性能比单线程性能提升要小得多,因为大多数CPU的全核频率都不会比4.1GHz高太多。个人估计,对于高端散热+高端主板用户,Pinnacle Ridge 八核的平均频率会在4.1-4.15GHz(上代平均3.85GHz)。







剩下部分后面会更新...


本文地址:http://www.moepc.net/?post=4852

MOEPC.NET编译,转载请保留出处。

二维码加载中...
本文作者:剧毒术士马文      文章标题: AMD Pinnacle Ridge 技术解析【IPC/工艺/性能】
本文地址:http://www.moepc.net/?post=4852
声明:若无注明,本文皆为“MoePC.net (原My艦これ/Mykancolle)”原创,转载请保留文章出处。

WRITTEN BY

avatar
黑羽飘零Google Chrome 54.0.2840.59Windows 72018-05-28 15:56
那看起来lumion8还是用8700k比用2700x好?
kongasdfMaxthon 4.9.4.2000Windows 8.12018-05-02 00:48
怎么解释momoka开启CB15测得的L2 L3缓存延迟与ZEN+几乎一致?
剧毒术士马文2018-05-02 02:04
@kongasdf:延迟你要按Cycle算。不能按ns算
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-27 21:11
2700x到手了,搭配x370taichi。因为bios原因,xfr2是不启用的,自然也没有pbo。cpu全默认+3200c14内存,r15得分1743(设置为实时的优先级分数是1782),看hwinfo的SVI2TFN 的cpu功耗(mosfet输出电流*输出电压),r15过程中最高到101w,全核频率3.85.
    在游戏(一个线程满载,多个线程有不同程度负载)时,频率在3.925上下波动。
    空载情况下,大约4个核心跑在3.0,剩下跑在4.0-4.25不等。
vagabondGoogle Chrome 63.0.3239.84Windows 102018-04-28 12:09
@FlyWood:可以尝试用ryzenmaster手动pbo。。
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-28 12:29
@vagabond:ryzenmaster里的pbo直接写着没做完,不能用
vagabondGoogle Chrome 66.0.3359.139Windows 102018-04-28 22:27
@FlyWood:我的意思是用ryzenmaster超频单核,达到类似pbo的效果。
Fly.Wood-Safari 604.5.6Mac OSX 10_13_32018-04-29 00:13
@vagabond:我还是等等bios更新吧……
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-05-02 02:37
@FlyWood:尝试vcore offset -0.075v:游戏频率上升至4.05;r15 4.0左右
今石老贼Google Chrome 66.0.3359.117Windows 102018-04-26 16:01
zen+温度传感细分出来CPU温度和二极管,而CPU二极管却总是80+,我的NZXT机箱风扇HUB只认那个二极管导致风扇一直全速....恶心
Fly.Wood-Safari 604.5.6Mac OSX 10_13_32018-04-25 18:38
问了一堆问题最后还是自己用x370上2700x试试了
Fly.Wood-Safari 604.5.6Mac OSX 10_13_32018-04-25 18:41
@Fly.Wood-:某宝两千三入手,希望618不要跌太狠
Concord_eGoogle Chrome 65.0.3325.181Windows 102018-04-24 07:16
那么1700X 1800X+C6H可以用PE+超外频来玩吗 还有就是C6H用aida64之类的软件风扇会抽风的问题到底能不能修复...
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-24 22:19
@Concord_e:大概是不行的
Concord_eGoogle Chrome 65.0.3325.181Windows 102018-04-25 03:42
@FlyWood:好吧 在考虑要不要把1700X换2700X,我这个体制太雷了 自动的时候3.9就只有瞬间 绝大部分时间都是3.7 还是5周的前期版有segfault 虽然并没有体感上的区别也没遭遇过来自CPU方面的死机(倒是那张公版1080ti降压超频满载偶尔翻车,默认情况也有微量概率,蛮蛋疼)
ウルサイGoogle Chrome 63.0.3218.0Windows 102018-04-23 20:00
我觉得ipc不应该差intel那么多啊!?我的错觉?GF的12nm lp性能也就这样了,希望7nm不要翻车,要求不高,至少甜点频率跑到4.4以上吧。现在频率上太吃亏了。
IMFTOpera 52.0.2871.64Windows 102018-04-23 21:56
@ウルサイ:本来Zen的IPC就在HSW BDW这个级别,Zen+又只是个微调的架构
剧毒术士马文2018-04-24 00:36
@ウルサイ:建议看除去256bit的IPC
差距大概8%。
游戏的话还会更小。
ウルサイGoogle Chrome 63.0.3218.0Windows 102018-04-24 19:51
@剧毒术士马文:我就想呢!4代-6代就提升了10%不到,6代-8代ipc零提升,纯粹是升频率和加核心,若是加上avx256的话,差了十几就可以接受了,A的设计在这方面是很吃亏。
uwGoogle Chrome 64.0.3282.186Windows 102018-04-23 18:59
你们好,请问Performance Enhancement设置在哪才能找到,翻了C6H的官方页似乎不见有对其的详尽说明,看B站的C6H超频教学视频里的UEFI界面也不知晓在哪
剧毒术士马文2018-04-24 00:37
@uw:已经更新:http://www.moepc.net/?post=4855
jayjokeGoogle Chrome 66.0.3359.66Windows 102018-04-23 17:37
GF真的是烂泥扶不上墙啊

真担心明年GF会拖zen2后腿
光辉拉克丝Google Chrome 55.0.2883.87Windows 102018-04-23 16:11
GF还是不行
不过12nm 比三星14nm略强点。 同频功耗更低
台湾佬Google Chrome 65.0.3325.181Windows 72018-04-23 11:36
理论上某些主板可能能上的更高,不过总的来说内存超频受到的还是内存控制器本身的限制,而不是主板的信号布线。所以400系主板应该也没法明显提升内存超频性能。

拿华擎和C6H做下对比?
xing0999Google Chrome 57.0.2987.132Linux2018-04-23 11:05
12LP静态功耗增加了吗
怪不得raven还是14lpp,用12lp续航可能尿崩
qvcGoogle Chrome 65.0.3325.109Linux2018-04-23 07:27
那么有没有什么方法可以把单核、多核睿频的频率按比例往上拉呢?
马文的小弟弟Google Chrome 65.0.3325.181Windows 102018-04-23 00:38
12LP制程漏电量比14LPP高得多。。。这么尴尬么
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-23 00:48
@马文的小弟弟:这篇文章后面说到,2700x用了高静态漏电率的硅晶圆,为了能够以更低电压达到指定的频率
vagabondGoogle Chrome 63.0.3239.84Windows 102018-04-23 00:33
看游戏测评的视频,afterburner显示的是4.2ghz,难道是6核4.1+2核4.3?
另外应该是每个ccx最好的核心是星星,第二好的是圆圈,剩下两个啥都没有。然后其实自己用ryzen master超频也可以只超单核。
剧毒术士马文Safari 6531.22.7Iphone 4_0 like Mac OS X2018-04-23 00:52
@vagabond:你说的是CCX内的体质
文章里说的是整个die的体质
这两个功能都有 不重复
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-23 00:30
看起来是2700x在x370上的时候ryzen master就不会有pbo的选项了么
vagabondGoogle Chrome 63.0.3239.84Windows 102018-04-23 00:35
@FlyWood:有的,b350都有,只要更新最新的ryzen master。
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-23 00:39
@vagabond:那么这次370和470可以说是没啥区别了啊,除了那个storemi软件
vagabondGoogle Chrome 63.0.3239.84Windows 102018-04-23 00:53
@FlyWood:storemi是啥?
不过可能300系主板没有400的好用,因为我试着超频单核没感觉出更好超。
香霖堂杂工Google Chrome 66.0.3359.117Windows 72018-04-23 10:58
@vagabond:就是农企类似傲腾的功能,加速盘,不过所有ssd都可以用
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-23 11:25
@vagabond:一个类似intel rst的软件,支持dram,3dxpoint,nvme盘和hdd变成一个混合盘
FlyWoodGoogle Chrome 65.0.3325.181Windows 102018-04-23 11:27
@vagabond:主要是看300系开了pbo之后全核会不会更高吧
Vega128Google Chrome 65.0.3325.181Windows 72018-04-22 23:20
女朋友还是不够用啊
theLastWishGoogle Chrome 58.0.3029.110Windows 102018-04-23 07:35
@Vega128:垃圾女朋友,分手算了

返回顶部    首页     管理  
版权声明      pw:moepc.net或mykancolle.com (有时需加www.) 若被菊爆请留言补档
本站JPEG/PNG均经过Google Guetzli高度压缩
部分内容来源于网络,并不代表本站赞同其观点和对其真实性负责。
如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容。
本站资源仅为个人学习测试使用,请在下载后24小时内删除,不得用于商业用途,否则后果自负,请支持正版!
illust-AMD/Ryohka
Feel free to use your Adblock, we don't have any ads.
Foreign visitors, if you have any questions, leave a comment in English/Japanese/German.
(just copy and paste one Chinese character cauze the anti-spam settings.)   sitemap