DPU Socket-Direct和Multi-host技术

https://mp.weixin.qq.com/s/BE51x2wBc9tBZyaRjRqG0w

Socket Direct技术


其实就是DPU模式下的Device NUMA Affinity

Multi-host技术

多个host直接连接到一个集中式的DPU上,无需每台host单独配备DPU和交换机端口,实现“多机共用一卡”的高效架构。

计算机科学专业第三次大衰退?原因:AI

https://mp.weixin.qq.com/s/i5ODa4S3FHj2GeIQlGLgBA

EROFS:为沙箱而生的高性能只读文件系统

一个诞生于华为实验室、被Linux内核接纳、被 gVisor/Kata/containerd/Nydus全面采用的现代文件系统——EROFS,正在悄悄改变容器与沙箱的启动速度。

https://mp.weixin.qq.com/s/GLXS2ATuUTWZdQ0o2jVmzQ

EROFS不是一个小众的”压缩文件系统”,它是 Linux内核中专为只读、高性能、安全隔离场景设计的现代文件系统。

从Android固件到Kubernetes容器,从gVisor安全沙箱到Kata微型虚拟机,EROFS已经成为云原生基础设施中最重要的隐形加速器之一。

Manus交易失败了,但创始人依然在谈成功学

https://mp.weixin.qq.com/s/32EK7T42kEjKefg9VV4Z3g

把 eBPF 带进 GPU Kernel 内部

把 eBPF 带进 GPU Kernel 内部:bpftime for GPU 的一次关键突破

bpftime for GPU 所代表的,并不只是一个新工具。
它更像是在提出一种新的可能性:

如果 eBPF 可以深入 CPU 内核与用户态程序,那么它为什么不能继续进入 GPU kernel?

通过 PTX 级插桩、per-thread 粒度观测、零拷贝数据回传以及标准 eBPF 工具链兼容,bpftime for GPU 正在把这个问题变成现实答案。

这意味着,我们第一次开始具备这样的能力:

  • 在 GPU kernel 内部布置可编程探针
  • 以线程级精度观察执行行为
  • 用 eBPF 的方式描述 GPU 可观测性
  • 在不侵入业务代码的前提下,为 AI 与高性能计算场景提供更强的调试与分析能力

随着 AI 时代 GPU 负载持续增长,这类能力的价值只会越来越大。

Geoffrey Hinton成为第二位引用量破百万的科学家

https://mp.weixin.qq.com/s/ib9TcSS9XvCoq9mC-XCSSg

天才少年姚顺雨入职腾讯后首发声:人与人差距在 AI 工具

https://mp.weixin.qq.com/s/r_MLUX9pDggXz97oQOofDw

英伟达CUDA迎来史上最大更新

https://mp.weixin.qq.com/s/lDlVLpFHWwd-HE3Muaa-kQ

高考最看重的能力,成了AI时代最不重要的能力

https://mp.weixin.qq.com/s/gLc3uK9ihcz8qK0OmerOhw

斯坦福CS336:大模型从0到1

https://www.bilibili.com/video/BV13SV9zdEhX