Skip to the content.

Linux 内核如何随着 AI 来演进

目前看,是削弱的

我还是认为,内核中最复杂的事情就是关于内存和多核(perfbook) 所以,目前看,当中心转向到了 GPU ,内核相对来说,是被削弱的

计算

虚拟化

那是真的没有关系,笑死!

如果你去看看 intel 手册,会发现 system programing 有很大的 一部分都是关于虚拟化的。

但是到了 GPU 时代,尤其是大模型时代,这些东西不在重要, 甚至都是累赘,例如 iommu 会干扰 gpu direct memory 。

相比之下, vdi 的市场也是非常小的

DRM

Linux 内核与 AI infra 的关联,总体而言其实不深。DRM 子系统虽在内核中沉淀了大量图形相关代码,但传统图形显示与 GPU 通用计算实际上是清晰切分的——前者关注像素如何在屏幕上呈现,后者关注如何利用并行能力加速数值计算,二者只是恰好共用 GPU 硬件。驱动本身也不是操作系统的竞争重点,NVIDIA 已将 GPU 驱动开源,整个技术栈的核心在于如何用好 GPU,而非驱动层面的实现。

面向 CPU 的通用设计

更深层次的原因在于工作负载的结构性变化。传统 CPU 和操作系统面向极度多样化的场景:编译器、大数据、容器、虚拟化,甚至虚拟机里再嵌套容器。而大模型时代,所有人的底层计算需求高度收敛到了一件事:矩阵乘法。为了将其做到极致,CPU 已经变成了 GPU 的模样,操作系统也完全可能演化为一种围绕 GPU 设计的专用系统,而非今天这种通用资源管理者。

存储

GPU 统一内存、异构内存管理等功能确实需要在内核中实现。但客观来说,这些大多属于数据路径中的低速路径,真正的高速路径——矩阵乘法的执行、张量核心的调度——完全由 GPU 上的运行时直接处理,内核几乎感知不到。

此外,P2P 内存访问、GPUDirect Storage(CUDA FS)等技术与内核的耦合是真实且紧密的,是构建大规模高性能 AI 集群的基石,这一点无法否认。

类似 pnfs 来做分布式存储

网络

RDMA 是全村的希望了,网络其他的部分是真用不上了。

内核是不断演化的

内核是不断演化的,只是之前 kernel 的中心在云计算和云原生上, 所以大家就发现 kvm fuse iouring cgroup bpf 之类的发展的很快。

对人的要求是一样的

抛开技术栈的变迁,对人的核心要求从未改变。做内核需要深入问题本质,写代码时充分考虑边界条件、并发安全和性能,把事情做到极致。做 AI infra 同样需要这种严谨和钻研。

内核背景在理解 AI infra 时意外地有价值。借助 AI 辅助阅读 NVIDIA 技术文档时,过往在驱动异步模型、Firmware 交互、事件通知等方面的经验,能让人迅速理清其设计意图。GPU 编程中的流、事件、异步拷贝等概念,本质上与操作系统中的并发控制和 I/O 调度并无二致。

因此,一个人应当先成为优秀的工程师,再成为优秀的内核工程师,而不是反过来。内核经验的价值不在于头衔,而在于它塑造的解决问题的方式。无论是优化一个内核调度器,还是优化分布式训练中的通信,背后都是同一种追求极致的工程态度。

待补充内容

Swarm : https://www.99csw.com/book/10133/364677.htm

本站所有文章转发 CSDN 将按侵权追究法律责任,其它情况随意。