GPU显存延迟测试:RNDA 2比Ampere更优秀
- +1 你赞过了
【天极网DIY硬件频道】处理器的多级缓存功能,为CPU带来更低的延迟和更优秀的响应速度。GPU硬件在经过多年发展之后,也迎来多级缓存结构。GPU制造商可以通过内置缓存设计,提升各个硬件间的通讯性能。但不同GPU制造商对缓存架构设计思路也存在差别,让整个系统的延迟、传输也稍有区别。NVIDIA和AMD的GPU缓存设计就存在差异,包括不同大小的寄存器和L1/L2缓存。
英伟达A100 GPU核心的L2缓存容量为40MB,是上代Tesla V100的七倍。原因自然是大量的新应用程序需要更大缓存,且为后续不断增长的使用需求而预留空间。外媒Chips and Cheese近日发布一份报告,揭示AMD最新一代的RNDA 2和英伟达Ampere GPU之间的显存延迟表现。测试软件选择OpenCL中简单的指针追逐测试。
在使用RDNA 2架构的AMD Radeon RX 6800 XT显卡,其Infinity Cache高速缓存的表现非常优秀。作为对比,NVIDIA采用Ampere架构的GeForce RTX 3090旗舰显卡存在差异。虽然两款显卡的显存(VRAM)延迟几乎一致,但IF设计大幅降低Radeon RX 6000显卡的访问延迟。
TechPowerUp指出,英伟达Ampere GPU的L1/L2两级缓存系统的延迟表现并不出色,因为从Ampere SM(L1 缓存)向L2传输的时候,数据延迟高达100ns。
虽然AMD RDNA 2 GPU具有L0/L1/L2三级缓存系统(Infinity Cache理论上可视为L3缓存),但A卡的显存延迟仍低得多,即便从L1到L2也只需66ns。
虽然延迟问题并不会对玩家的日常游戏、使用造成影响,但对很多人来说,性能测试不能落后同价位产品。
最新资讯
热门视频
新品评测