CPU失业前兆？英伟达公布显卡直连SSD技术

2022-03-18 18:23:26 作者：惜

用微信扫描二维码
+1 你赞过了

【天极网DIY硬件频道】传统的数据读取依赖于CPU执行虚拟地址转换、基于页面的按需数据加载以及其它针对内存和外存的大量数据管理工作，作为电脑核心部件之一的显卡是无法直接从SSD中读取数据。但随着人工智能和云计算的兴起，有GPU直接读取SSD硬件内数据，是最高效的方式。

为了让GPU应用程序能够直接读取数据，英伟达联合IBM，通过与几所大学的合作打造一套新架构，为大量数据存储提供快速“细粒度访问”，也就是所谓的“大加速器内存”(Big Accelerator Memory，简称BaM)。通过这一技术，能够提升GPU显存容量、有效提升存储访问带宽，同时为GPU线程提供高级抽象层，以便轻松按需、细粒度地访问扩展内存层次中的海量数据结构。

对于普通用户来说，BaM拥有两大优势，第一是基于软件管理的GPU缓存，数据存储和显卡间的信息传输分配，都交给GPU核心上的线程来管理。并通过使用RDMA、PCI Express接口以及自定义的Linux内核驱动程序，BaM允许GPU直接打通SSD数据读写。

第二就是打通NVMe SSD的数据通信请求，BaM只会在特定数据不在软件管理的缓存区域时，才让GPU线程做好参考执行驱动程序命令的准备。在图形处理器上运行繁重工作负载的算法，能够通过针对特定数据的访问例程优化，从而实现针对重要信息的高效访问。

在以CPU为中心的策略电脑中，会因为CPU、GPU之间的数据传输以及I/O流量的放大，拖累具有细粒度的数据相关访问模式。研究人员在BaM模型的GPU内存中，提供基于高并发NVMe的提交/完成队列的用户级库，使未从软件缓存中丢失的GPU线程，能够以高吞吐量的方式来高效访问存储。

更重要的是，BaM方案在每次存储访问时的软件开销极低，并支持高度并发的线程。在基于BaM设计+标准GPU+NVMe SSD的Linux原型测试平台的相关实验测试中，BaM交出相当喜人的成绩。

作为代替基于CPU统管一切事务的解决方案，BaM的研究表明，存储访问可同时工作、消除同步限制，并且明显提升I/O带宽效率，让应用程序的性能获得大幅提升。NVIDIA首席科学家Bill Dally指出：得益于软件缓存，BaM不依赖于虚拟内存地址转换，天生就免疫TLB未命中等序列化事件。

编辑点评：随着Resizable BAR和SAM技术的发展和应用，GPU和CPU之间的带宽瓶颈得到极大的缓解，但相比于从CPU获取数据，让GPU直接从SSD中获得数据的应用效率会更高。虽然新的BaM目前尚未明确如何在消费者领域应用，但相信不久后也会有相关产品面世。

聚合标签：

网友评论

发布

相关文章

本周热门

热门标签

惜

最新资讯

: 映众英伟达 RTX5090D开箱

热门视频

: 酷开AI闺蜜机C20 Ultra体验

新品评测

: 映众英伟达 RTX5090D开箱

热门产品排行榜

编辑推荐排行榜

1 雷柏P3无线充电功能模块￥69

参数图片评测
2 雷柏V2M V+无线游戏技术鼠标接收器（4K型）￥99

参数图片评测
3 雷柏KA-12 ￥39

参数图片评测
4 雷柏V1M无线游戏鼠标接收器￥29

参数图片评测
5 雷柏V1P无线鼠标充电功能模块(雷柏VT9系列专用) ￥69

参数图片评测
6 雷柏KC-8A喵萌假期主题键帽￥149

参数图片评测
7 雷柏KC-8A航海日记主题键帽￥149

参数图片评测
8 aigo H6S ￥259

参数图片评测
9 aigo H4 ￥50

参数图片评测
10 aigo H4S ￥109

参数图片评测

关于我们|About us|天极服务|天极动态|加入我们|网站地图|网站律师|友情合作|RSS订阅|意见反馈
渝B2-20030003Copyright (C) 1999-2022 Yesky.com, All Rights Reserved 版权所有天极魅客

X

第三方账号登录

微博认证登录
QQ账号登录
微信账号登录

用微信扫描二维码
+1 你赞过了