每周分享第39期
文章目录
DPU Socket-Direct和Multi-host技术
https://mp.weixin.qq.com/s/BE51x2wBc9tBZyaRjRqG0w
Socket Direct技术

其实就是DPU模式下的Device NUMA Affinity
Multi-host技术

多个host直接连接到一个集中式的DPU上,无需每台host单独配备DPU和交换机端口,实现“多机共用一卡”的高效架构。
计算机科学专业第三次大衰退?原因:AI
https://mp.weixin.qq.com/s/i5ODa4S3FHj2GeIQlGLgBA
EROFS:为沙箱而生的高性能只读文件系统
一个诞生于华为实验室、被Linux内核接纳、被 gVisor/Kata/containerd/Nydus全面采用的现代文件系统——EROFS,正在悄悄改变容器与沙箱的启动速度。
https://mp.weixin.qq.com/s/GLXS2ATuUTWZdQ0o2jVmzQ
EROFS不是一个小众的”压缩文件系统”,它是 Linux内核中专为只读、高性能、安全隔离场景设计的现代文件系统。
从Android固件到Kubernetes容器,从gVisor安全沙箱到Kata微型虚拟机,EROFS已经成为云原生基础设施中最重要的隐形加速器之一。
Manus交易失败了,但创始人依然在谈成功学
https://mp.weixin.qq.com/s/32EK7T42kEjKefg9VV4Z3g
把 eBPF 带进 GPU Kernel 内部
把 eBPF 带进 GPU Kernel 内部:bpftime for GPU 的一次关键突破
bpftime for GPU 所代表的,并不只是一个新工具。
它更像是在提出一种新的可能性:
如果 eBPF 可以深入 CPU 内核与用户态程序,那么它为什么不能继续进入 GPU kernel?
通过 PTX 级插桩、per-thread 粒度观测、零拷贝数据回传以及标准 eBPF 工具链兼容,bpftime for GPU 正在把这个问题变成现实答案。
这意味着,我们第一次开始具备这样的能力:
- 在 GPU kernel 内部布置可编程探针
- 以线程级精度观察执行行为
- 用 eBPF 的方式描述 GPU 可观测性
- 在不侵入业务代码的前提下,为 AI 与高性能计算场景提供更强的调试与分析能力
随着 AI 时代 GPU 负载持续增长,这类能力的价值只会越来越大。
Geoffrey Hinton成为第二位引用量破百万的科学家
https://mp.weixin.qq.com/s/ib9TcSS9XvCoq9mC-XCSSg
天才少年姚顺雨入职腾讯后首发声:人与人差距在 AI 工具
https://mp.weixin.qq.com/s/r_MLUX9pDggXz97oQOofDw
英伟达CUDA迎来史上最大更新
https://mp.weixin.qq.com/s/lDlVLpFHWwd-HE3Muaa-kQ
高考最看重的能力,成了AI时代最不重要的能力
https://mp.weixin.qq.com/s/gLc3uK9ihcz8qK0OmerOhw