实战故事

5 天 3 次崩溃,每一次都比上一次更好


故事线

日期事件结果
Feb 12 夜GLM-5 全网首部署跑通了但太慢,次日弃用
Feb 13M2.5 自转换 + CCR 诞生三层架构上线
Feb 14OOM 内核 Panic写安全等待脚本
Feb 15发现 oMLX,SSD cache 死锁Fork + PR #16 修复
Feb 16GPU Hang 崩溃循环确认是 Metal 驱动问题,唯一解 = 重启

三个关键战役

每一场都是真实的生产事故,有完整的根因分析和修复方案。

  • GLM-5 首部署 — 全网第一个在 Apple Silicon 上跑 GLM-5 的男人
  • OOM 崩溃 — Mac Studio 内核 Panic,SoC 硬件看门狗强制重启
  • SSD 死锁修复 — oMLX PR #16,从发现到彻底修复的完整故事