飞行者联盟-色综合天天综合-飞机模拟机_色综合天天色_无人机_色综合天天_低空经济_航空技术交流平台

飛行者聯盟 門戶 新聞資訊 模擬飛行 查看內容

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?

2024-12-21 08:33| 發布者: chinesezgb 1000 0

摘要: 半導體工程師2024年12月16日 09:14北京最近AMD Ryzen R7 7800X3D突然又漲到了3000元往上的價格,不知道是臺積電一側3DIC先進封裝工藝產能吃緊,還是需求側突然對這類帶更大LLC的處理器有了新需求。我們之前特別撰文 ...

半導體工程師2024年12月16日 09:14北京

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-3084

最近AMD Ryzen R7 7800X3D突然又漲到了3000元往上的價格,不知道是臺積電一側3DIC先進封裝工藝產能吃緊,還是需求側突然對這類帶更大LLC的處理器有了新需求。


我們之前特別撰文探討過AMD的3D V-Cache技術。簡單來說,這是一種通過3D先進封裝來增加處理器L3 cache容量的技術——而且這個3D先進封裝用的還是hybrid bonding混合鍵和這種難度系數和技術含量相對很高的方案,主要應當是考慮到帶寬和延遲需求。


比如Ryzen 7800X3D把L3 cache堆到了96MB;更高規格的7900X3D、7950X3D,相比沒有用3D V-cache的常規版CPU,L3 cache都擴容了1倍,達到128MB。服務器Epyc處理器這邊,8個CCD每片如果都往上疊3D V-ache,則總共能堆出768MB的L3 cache——比當年的主存都大...

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-7509

堆更大的L3 cache自然有利于較大working set size的負載實現更高的性能。那具體是什么負載呢?其實早在2021年AMD面向PC推這種3D V-cache技術時就已經明確了,這種型號后綴多了“3D”的Ryzen處理器主打游戲(Gaming)——拋開數據中心不談,至少在PC應用場景內就是如此。當初在Ryzen 5000系列處理器發布時,AMD就提過3D V-cache能讓游戲性能平均提升15%。


會不會是因為《黑神話:悟空》正當火熱,所以游戲市場周邊對此類帶3D V-cache的CPU產生了新一波的需求,帶動了7800X3D, 7600X3D這類處理器價格的上漲呢?

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-8772

*測試平臺:主板 (華碩TUF GAMING B650M-PLUS WIFI, MAG B760M MORTAR WIFI), 顯卡 (GeForce RTX 4070), 內存 (DDR5-6000), 電源 (ANTEC 1000W), 操作系統 (Windows 11 23H2); 下同…


其實從測試數據來看,單就《黑神話:悟空》這一款游戲,Ryzen 7800X3D實際幀數表現是不及價格還略低的酷睿i7-14700KF的。以CPU為瓶頸的測試下(1080p 推薦畫質),前者的幀率甚至比后者低了20%以上——當然實際游玩過程,通常在畫質選擇上以GPU為瓶頸,不會有這么大的差異。


拋開近期Intel深陷的負面新聞不談,本文嘗試再說道說道3D V-cache在PC領域內的價值,以及堆LLC是不是真的有那么神。


最大價值點:游戲


有關3D V-cache技術,及hybrid bonding先進封裝,本文就不再多做贅述了。就制造和封裝角度來看,這稱得上是尖端技術在PC處理器上的應用先驅。而本文主要把注意力集中到應用上。


文首提到的《黑神話:悟空》應該說是個例。就綜合游戲性能而言,Ryzen 7800X3D還是表現出了不錯的優勢的——尤其是相較自家不帶V-cache的Ryzen 7800X。主要表現在一些L3 cache敏感型游戲,典型如《永劫無間》《Lol》《Dota 2》等;7800X3D都比酷睿i7-14700KF表現更優。


去年Chips and Cheese對3D V-cache版的AMD Ryzen處理器做了micro-benchmark。拋開3D V-cache帶來額外的延遲、些微帶寬降低不談,Chips and Cheese主要測了4款游戲,分別是《GHPC(Gunner, HEAT, PC)》《賽博朋克2077》《DCS(數字戰斗模擬)》《使命召喚17:黑色行動冷戰》:主要是想看看加了V-cache,相較于沒有V-cache的核心,對游戲負載帶來了怎樣的影響。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-8565

《賽博朋克2077》測試,來源:Chips and Cheese


在《GHPC》游戲中,V-cache版核心相比不帶V-cache的核心,有著33%的L3 cache命中率提升(58.65%→78.00%),整體IPC提升在9.67%左右。《賽博朋克2077》游戲中,更大的L3 cache能夠達成13.4%的IPC領先(L3命中率45.99%→63.74%);《使命召喚17》的情況也類似,3D V-cache能夠獲得19%的IPC增長(L3命中率46.51%→68.68%)——突有一種處理器架構換代的即視感。


對這三款游戲來說,L3 cache命中率的顯著提升完全能夠抵消3D V-cache更高的緩存延遲——而且Zen 4架構增大了L2 cache的容量,很大程度也能緩解L3 cache延遲的增加。


值得一提的是,《使命召喚》游戲過程中測得的IPC相比其他游戲更低。從更細粒度的管線各階段分析來看,Renamer寄存器重命名是其中瓶頸。V-cache的增加能夠顯著降低后端瓶頸——因為更高的cache命中率也就能更好地喂給后端執行單元;但它對前端性能改善較小。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-1040

最后《DCS》的情況略有不同,L3命中率可提升幅度非常有限(89.06%→92.42%),此時3D V-cache更高的延遲開始發揮作用,相比不帶V-cache的標準核心,IPC些微落后了2.3%左右。其實考慮更多系統層面變量,這點變化可能并不足以較大程度影響游戲幀率;不過此例至少能夠說明,某些情況下,即便是在游戲場景內,緩存延遲的影響也大于容量。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-3698

《DCS游戲測試》,來源:Chips and Cheese


另外值得一提的是,更大的cache也不止能讓游戲受惠,還有文件壓縮(7-Zip)和視頻編碼(libx264)負載也能因此得到IPC提升。更具體的推薦去看一看Chips and Cheese的原文。只不過個別應用場景的IPC提升,并不是故事的全部。


更多緩存 or 更高算力?


Chips and Cheese的測試中,我們認為比較有趣的是libx264視頻編碼測試。更大的L3 cache是能夠幫助提升視頻編解碼性能的,測試結果也明確L3命中率提升10%左右,IPC提升因此也有4.9%。但在絕對性能上,這項測試里不帶V-cache的CPU核心性能優于帶V-cache的核心。


原因很簡單,前者的核心頻率比后者高了7%;更高的IPC不足以彌補頻率缺失。這實際上在我們看來也成為3D V-cache的關鍵問題:有時不得不以更低的核心頻率和核心數為代價,來換取更大的L3 cache。


我們知道,芯片設計是PPA權衡的藝術,加上3D V-cache意味著更大的die size和成本,以及與計算單元的功耗資源分配權衡。


同型號后綴是否帶3D對比,如7950X的核心基頻就比7950X3D高300Mhz。考慮價格,也就是芯片area面積因素:7950X3D目前京東售價4099元,而7950X的售價則為3449元——非官方的3D V-cache版CPU價格浮動會更大。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-5397

對用戶而言,這就是個錢究竟是花在cache上,還是花在核心數/頻率上的問題。要知道,現在7800X3D的價格是比7900X還高的。如果我們引入競爭對手的產品,那么情況就更復雜了——但問題的本質不變:錢是花在cache上,還是花在計算核心上。


如文首所述,Ryzen 7800X3D目前的價格是3000元左右;酷睿i7-14700KF的價格2700元。前者有著更大的L3 cache容量,后者有著更多的計算核心資源。

在更單純考察核心算力資源的情況下,參照Cinebench R23的單線程與多線程渲染測試結果,這兩顆處理器的情況是這樣的:

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-244

另外,基于7800X3D的優勢項,嘗試集合實測性能下7800X3D表現不錯的游戲有:

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-556

這番對比大概更有——“你掏錢是愿意買更多核心/更高的頻率,還是愿意花在L3 cache上”——的意思。因為我們無法明確不同制造工藝及對應芯片面積的成本差異,拋開市場對價格的影響因素,這個問題的答案大方向可能取決于,你用PC究竟是為了做什么。


回到同Ryzen體系下的對比,去年AnandTech對Ryzen 7950X和7950X3D的評測顯示,由于前者有著更高的核心頻率及更寬松的TDP,在辦公、網頁、渲染、編碼等主流場景,以及涉及兼容性的老測試中,表現出了更優的性能;科學與模擬仿真測試,兩者互有勝負;


游戲測試的情況則相對復雜:4K高分辨率下,性能瓶頸主要在GPU側,7950X3D的勝率略高——只不過受制于GPU,幀率領先非常有限;2k分辨率下,7950X3D的勝率更高;1080p分辨率大約是7950X3D的主場,在更多3A游戲中表現出色......


簡單來說,基于PC大眾使用場景,3D V-cache技術的價值主要表現在游戲應用上——而其他主流應用場景下,3D V-cache并沒有什么軟用,有時候甚至會幫倒忙。


所以AMD對這項技術的定位,從5800X3D起就很明確了:游戲。只不過即便是在游戲測試場景內,如前文Chips and Cheese測試的《DCS》以及文首《黑神話:悟空》那樣,也總有些游戲實際是更吃高頻與核心算力——或者說資源堆在核心和頻率上更劃算。


游戲場景下的一些講究


早就聽聞7800X3D是游戲神U,但實際跨品牌特別選擇一些游戲的話,酷睿i7-14700KF也是可以讓Ryzen 7800X3D的場面非常難看的,比如像下面這樣:

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-268

一般在游戲過程中,CPU負責處理游戲邏輯、AI、物理計算等非圖形相關工作。這些任務也需要快速訪問數據。那么更大的CPU cache可存儲這些數據,就比頻繁訪問更慢的主內存更好。


在與GPU協作的過程中,CPU準備面向GPU的數據和指令;更大緩存也意味著指揮GPU的時間能減少。另外,有些游戲可充分利用CPU多核資源,更大的緩存也有利于核間數據共享,提升多線程游戲引擎的性能。


那為什么從測試結果來看,3D V-cache對于部分游戲未能表現得很友好呢?我們猜測這里面還是有不同變量的。比如說Ryzen處理器基于chiplet方案,每8個核心為一片CCD(die)——比如對于7900X3D/7950X3D這樣的處理器而言,就需要兩片CCD。


3D V-cache只位于其中一片CCD之上,另一片CCD上方是沒有V-cache的。這就造成了兩邊資源的不同,甚至頗有點“異構”的意思。那么游戲究竟跑在哪邊的CCD上,就頗有講究了。這對驅動提出了要求,檢測特定負載,決定它更需要cache,還是更需要高頻率——這甚至成為了一個調度問題。這一點可能會成為限制高效發揮CPU性能的一部分。


另外,也不是所有游戲都對cache大小表現出敏感。如果程序本身就有更加可預測的存儲訪問模式,或者更小的working set,就不怎么會從更大容量的LLC獲得什么高收益。


還有比較典型的事實,部分策略類游戲和老游戲更吃單核性能——Intel此時就有顯著優勢了。以及不同游戲自身的特性也決定了其性能瓶頸。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-5014

比較典型的像是《微軟模擬飛行》。很多玩家應該知道,這是個相當吃CPU資源的游戲。這可能與其游戲性質有關:對實時天氣、物理、空中交通的模擬,是很吃CPU資源的;另外游戲內有較多數量的對象——包括建筑、樹木、車輛等,也都增加了CPU負載;加上對象LOD,以及主線程追求更高的單線程性能...雜糅不同要素,酷睿i7-14700KF因此能在這款游戲中表現出顯著優于Ryzen 7800X3D的性能。


當然了,在很多游戲場景下,3D V-cache仍然是表現出了性能優勢的——這一點不應被否認。只不過就綜合性能角度考慮,3D V-cache的確是個需要被權衡的參考因素。


從系統層面來看,包括游戲是否更依賴單核性能,游戲引擎面向硬件的架構優化,內存延遲與帶寬表現,以及游戲自身的特性都有關系。《全面戰爭:三國》《騎馬與砍殺2》《GTA5》等游戲中,3D V-cache未能討到好處也就可以理解了。


Intel在此間的某些變量要素都有優勢,包括單核性能、實際的內存延遲和帶寬表現等。還有個關鍵,也在于兩顆處理器算力資源的不對等。


3D V-Cache真的值得嗎?


總感覺對比酷睿i7-14700KF和Ryzen 7800X3D,某種程度上并不合理。從標稱TDP功耗的角度來看,后者默認TDP 120W——從AnandTech去年的實測來看,其實際和日常功耗更低;而前者允許的最大睿頻功耗是253W。


拋開架構、工藝之類的細節問題,從粗線條來看,前者是20核28線程的CPU,后者僅8核16線程。所以雖然雙方L3 cache資源不對等(33MB vs 96MB),計算資源實際也是不對等的。在游戲之外,很容易想見常見的生產力、渲染、內容創作等測試,7800X3D的性能與14700KF不在一個維度。

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-1240

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-5795

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-9541

但仍然需要注意,從成本的角度來看,現在酷睿i7-14700KF就是比Ryzen 7800X3D要便宜的。雖然可能用不帶核顯的U來比價格也略失偏頗了,不過此處要表現的仍然是對應成本下,硬件資源的選擇和權衡問題。


如文首所述,不知是hybrid bonding成本高,還是終端產品更多受市場因素影響,3D V-cache現階段可是真的不便宜。單純為了個別存儲敏感型游戲些微提升些幀數,堆LLC真的值得嗎?


最后多提一句,本文僅從PC角度來看現階段的3D V-cache處理器。實際上,我們認為3D V-cache更大的價值在特定負載的數據中心市場——這大概也是最初AMD預設該技術的主場。不過這就是另一個話題了。


Hybrid bonding自然是相當一顆賽艇的技術,必然成為HPC的未來;但在具體實施到PC處理器的3D V-cache上,可能對大部分人而言,現階段這都是個成本投入有些高、效率與成本效益都并不及預期的技術。

來源于電子工程專輯,作者黃燁鋒

PC處理器用3D V-Cache堆緩存,現階段真的值得嗎?-3663半導體工程師半導體行業動態,半導體經驗分享,半導體成果交流,半導體信息發布。半導體培訓/會議/活動,半導體社群,半導體從業者職業規劃,芯片工程師成長歷程。238篇原創內容公眾號


路過

雷人

握手

鮮花

雞蛋

最新評論

返回頂部
主站蜘蛛池模板: 楼承板-开口楼承板-闭口楼承板-无锡海逵 | 蒸压釜-陶粒板隔墙板蒸压釜-山东鑫泰鑫智能装备有限公司 | 碎石机设备-欧版反击破-欧版颚式破碎机(站)厂家_山东奥凯诺机械 高低温试验箱-模拟高低温试验箱订制-北京普桑达仪器科技有限公司【官网】 | 武汉不干胶印刷_标签设计印刷_不干胶标签印刷厂 - 武汉不干胶标签印刷厂家 | 微学堂-电动能源汽车评测_电动车性能分享网 | 短信通106短信接口验证码接口群发平台_国际短信接口验证码接口群发平台-速度网络有限公司 | 铝扣板-铝方通-铝格栅-铝条扣板-铝单板幕墙-佳得利吊顶天花厂家 elisa试剂盒价格-酶联免疫试剂盒-猪elisa试剂盒-上海恒远生物科技有限公司 | 【365公司转让网】公司求购|转让|资质买卖_股权转让交易平台 | 桥架-槽式电缆桥架-镀锌桥架-托盘式桥架 - 上海亮族电缆桥架制造有限公司 | 馋嘴餐饮网_餐饮加盟店火爆好项目_餐饮连锁品牌加盟指南创业平台 | IP检测-检测您的IP质量 | 智慧食堂_食堂管理系统_食堂订餐_食堂消费系统—客易捷 | 薪动-人力资源公司-灵活用工薪资代发-费用结算-残保金优化-北京秒付科技有限公司 | 六维力传感器_三维力传感器_二维力传感器-南京神源生智能科技有限公司 | 优考试_免费在线考试系统_培训考试系统_题库系统_组卷答题系统_匡优考试 | 不锈钢闸阀_球阀_蝶阀_止回阀_调节阀_截止阀-可拉伐阀门(上海)有限公司 | 安徽净化工程设计_无尘净化车间工程_合肥净化实验室_安徽创世环境科技有限公司 | 无线联网门锁|校园联网门锁|学校智能门锁|公租房智能门锁|保障房管理系统-KEENZY中科易安 | 踏板力计,制动仪,非接触多功能速度仪,逆反射系数测试仪-创宇 | 江苏大隆凯科技有限公司 | 连栋温室大棚建造厂家-智能玻璃温室-薄膜温室_青州市亿诚农业科技 | 山东商品混凝土搅拌楼-环保型搅拌站-拌合站-分体仓-搅拌机厂家-天宇 | 合肥角钢_合肥槽钢_安徽镀锌管厂家-昆瑟商贸有限公司 | 珠光砂保温板-一体化保温板-有釉面发泡陶瓷保温板-杭州一体化建筑材料 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 东莞韩创-专业绝缘骨架|马达塑胶零件|塑胶电机配件|塑封电机骨架厂家 | 北京征地律师,征地拆迁律师,专业拆迁律师,北京拆迁律师,征地纠纷律师,征地诉讼律师,征地拆迁补偿,拆迁律师 - 北京凯诺律师事务所 | 钛板_钛管_钛棒_钛盘管-无锡市盛钛科技有限公司 | 干粉砂浆设备_干混砂浆生产线_腻子粉加工设备_石膏抹灰砂浆生产成套设备厂家_干粉混合设备_砂子烘干机--郑州铭将机械设备有限公司 | NBA直播_NBA直播免费观看直播在线_NBA直播免费高清无插件在线观看-24直播网 | 右手官网|右手工业设计|外观设计公司|工业设计公司|产品创新设计|医疗产品结构设计|EMC产品结构设计 | 破碎机锤头_合金耐磨锤头_郑州宇耐机械工程技术有限公司 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 | 避光流动池-带盖荧光比色皿-生化流动比色皿-宜兴市晶科光学仪器 东莞爱加真空科技有限公司-进口真空镀膜机|真空镀膜设备|Polycold维修厂家 | 劳动法网-专业的劳动法和劳动争议仲裁服务网 | 苏州伊诺尔拆除公司_专业酒店厂房拆除_商场学校拆除_办公楼房屋拆除_家工装拆除拆旧 | 北京租车牌|京牌指标租赁|小客车指标出租 | Akribis直线电机_直线模组_力矩电机_直线电机平台|雅科贝思Akribis-杭州摩森机电科技有限公司 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 玉米加工设备,玉米深加工机械,玉米糁加工设备.玉米脱皮制糁机 华豫万通粮机 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 |