// SHOWCASE

Neo's AI Infrastructure

A Living System That Evolves Daily

Born Feb 12, 2026 · 16,800 lines · Still growing

8+Projects从零搭建

34SessionsClaude Code

16.8KHand-writtenlines of code

75.8KTotal Codebaselines involved

5Durationdays · Feb 12–16

// ARCHITECTURE

System Architecture

AI Brains

MiniMax M2.5

Local

237GB · 8-bit · 主脑

Claude Code

Local

Opus · 编程助手

Codex CLI

Cloud

在线任务 · 联网搜索

Anthropic API↓

Infrastructure

oMLX Server

Engine

:8000 · Dual API

OpenClaw 龙虾

Gateway

:18789 · 18 Skills

Bot API↓

Interfaces

Telegram Bot

远程交互

Lark/飞书

企业协作

NeoWatch

监控仪表盘

Lobster Patrol

每 2h · 健康检查

AINEOS Skills (18/49)

crypto-analysispeekabooblogwatchermcporter+ 14 more

AI Brains

MiniMax M2.5

Local

237GB · 8-bit · 主脑

Claude Code

Local

Opus · 编程助手

Codex CLI

Cloud

在线任务 · 联网搜索

connects to↓

Infrastructure

oMLX Server

Engine

:8000 · Dual API

OpenClaw 龙虾

Gateway

:18789 · 18 Skills

connects to↓

Interfaces

Telegram Bot

远程交互

Lark/飞书

企业协作

NeoWatch

监控仪表盘

Lobster Patrol

每 2h · 健康检查

AINEOS Skills (18/49)

crypto-analysispeekabooblogwatchermcporter+ 14 more

M2.5 主脑 · Multi-Brain 协同 · 18 Skills 生态 · 原生 API

—Architecture Evolution

v1abandoned

GLM-5 + mlx_lm.server

GLM-5-MLX 直连，文件缺失无法使用

Feb 12

v2superseded

M2.5 + mlx_lm + CCR

Claude Code → CCR(:3456) → mlx_lm(:8080) → M2.5

Feb 13

v3superseded

M2.5 + oMLX

Claude Code → oMLX(:8000) → M2.5 · 原生 API · 无中间层

Feb 15

v4active

Multi-Brain AIOS (current)

M2.5 主脑 + Claude/Codex 协同 + AINEOS Skills 生态

Feb 16

// TIMELINE

Five-Day Sprint

Day 0 · Feb 12 NightGenesis

开荒：GLM-5 全网首部署

•Mac Studio M3 Ultra 512GB 开箱，从零初始化全套环境
•安装 MLX 生态 + Homebrew + Docker + Claude Code agents
•GLM-5-MLX (417GB) 开始下载 — 11GB/min via hf_transfer
•同步部署 Open WebUI (:3000) + OpenClaw (:18789) 首次上线
•GLM-5 下载完成…缺 1 个 safetensors — HF 上传方文件不全
•「我是成为全网第一个本地部署 GLM5 的男人吗？」 — 也是第一个被坑的

Day 1 · Feb 13Build

M2.5 自转换 + CCR 诞生

•GLM-5 太慢放弃，决定转向 MiniMax M2.5
•M2.5 开源了但没 MLX 版 — 自己用 mlx_lm.convert 转换
•27 分钟下完原始权重，同时转出 4-bit (120GB) + 8-bit (237GB)
•4-bit 测试：51.3 tok/s · 128GB — 8-bit 选为主力
•想接入 Claude Code → LiteLLM 失败 → 发现 claude-code-mlx-proxy
•重写 proxy 为纯格式转换层 — CCR (Claude Code Router) 诞生

Day 2 · Feb 14Crisis

NeoWatch + OOM 浩劫

•CCR 深度优化：完整支持 Anthropic ↔ OpenAI tool_use 转换
•从零搭建 NeoWatch 监控系统（FastAPI + Next.js + WebSocket）
•Portfolio 个人网站开发（Next.js + Framer Motion）
•OOM Panic — KV cache 膨胀导致 Metal 崩溃，强制重启
•配置 5 个 LaunchAgent 实现开机自启 + ai-services.sh 管理脚本
•手动 patch mlx_lm server.py 添加 --max-kv-size 限制

Day 3 · Feb 15Migration

oMLX 迁移 + SSD 死锁修复

•发现 oMLX — 原生 Anthropic API，不再需要 CCR 中间层
•mlx_lm.server + CCR → oMLX 全面迁移，架构从三层变两层
•Metal GPU Hang 崩溃循环 — tok/s 骤降是前兆，唯一修复=重启
•发现 SSD Paged Cache 死锁：推理 2-15 分钟后静默卡死
•Fork oMLX → PR #12 (think 过滤) + PR #16 (SSD 死锁 v3→v4)
•v4 终极方案：save 后台 rename + load 主线程 mx.load()，完全修复

Day 4 · Feb 16Polish

深度审计 + 生态收官

•认知文件深度审计：10 处遗漏 — HEARTBEAT 还在检查废弃端口
•全面修复：重写 4 配置 + 填写 3 身份 + 补建 2 记忆 + 删 1 引导
•crypto-analysis skill 注册 + 15m/4h/8h/24h 策略框架文件
•安装 peekaboo + mcporter + blogwatcher → 18/49 skills ready
•龙虾巡检定时化（每 2h :10，12 次/天）+ 自动修复能力
•成果展示网站上线 — 你正在看的这个页面

// OUTPUT

Code Output

16,800 lines hand-written in 4 days

NeoWatch

5,091

crypto-analyzer

3,078

OpenClaw Config

2,974

Scripts

1,814

Portfolio

1,583

Claude Code Memory

740

CCR Proxy (已废弃)

725

oMLX Patch (PR#12+16)

464

LaunchAgents

324

Total: 16,793 lines

// ACHIEVEMENTS

Key Achievements

Core Engine

M2.5 本地主脑部署

MoE 大模型自主 MLX 转换 4-bit + 8-bit 两版，237GB 8-bit 稳定推理 ~25 tok/s

Open Source

oMLX SSD Cache 死锁修复

PR #16 v4 — 两处死锁：save_block 改后台 rename，load_block 改主线程 mx.load()

Architecture

四次架构演进

从单模型到多脑协同 · 三层代理到原生 API · 每次迁移都在做减法

AI Operations

AINEOS Skills 生态

行情分析 · 智能家居 · 企业协作 · Telegram + Lark 双通道 · 龙虾巡检自动迭代

Full-Stack

NeoWatch 全栈监控

FastAPI + Next.js + WebSocket · 实时 GPU 监控 · Telegram 告警 · 赛博朋克仪表盘

Multi-Brain

多脑协同体系

M2.5 主脑 + Claude Code 编程 + Codex 在线任务 · 本地优先、云端增强

// AINEOS IN ACTION

Neo × 龙虾 — 日常对话

真实交互场景 — 从晨报推送到策略迭代，一个活的 AI 生态

lobster@aineos

每日 7:30 自动推送

🦞

07:30龙虾

GM Neo! 今日要点：

BTC $67,234 (+2.3%) — 巨鲸凌晨转入 Binance 5,000 ETH
ETH $3,280 (+1.1%) — Gas 均价 12 gwei
3 封重要邮件待处理
14:00 Team Sync / 16:00 Code Review
新加坡 31°C 多云

07:31Neo

收到。巨鲸那笔帮我盯着，有后续动作马上通知

🦞

07:31龙虾

已设置监控 — 地址 0x7a2...f3b 任何转出超过 500 ETH 立即推送

_powered by AINEOS · M2.5 · oMLX

Lobster Patrol

每 2 小时 · 偶数小时 :10 · 每天 12 次

oMLX Server (:8000) — 模型列表 + 推理速度
OpenClaw Gateway (:18789) — HTTP 200 + Telegram 连接
NeoWatch Backend (:3940) — API 健康 + 采集器状态
NeoWatch Frontend (:3939) — UI 可达性
系统资源 — Wired 内存 / GPU 状态 / 磁盘空间
qmd 记忆索引 — collection 完整性
Cron 投递 — 最后成功时间 < 2 周期

Auto-fix enabledLaunchAgent scheduled

// STACK

Tech Stack

Languages

TypeScriptPythonBashGoSwift

Frameworks

Next.jsFastAPITailwind CSSReact

AI / ML

MLXoMLXMiniMax M2.5GLM-5Claude APImlx_lm

Infrastructure

DockerLaunchAgentsWebSocketTelegram Bot API

Tools

Claude CodeOpenClawNeoWatchqmdpeekaboomcporterhuggingface-cli

Hardware

Mac StudioM3 Ultra512GB RAMMetal GPUSSD Cache

Neo's AI InfrastructureNeo's AI Infrastructure

System Architecture

AI Brains

Infrastructure

Interfaces

AI Brains

Infrastructure

Interfaces

—Architecture Evolution

Five-Day Sprint

开荒：GLM-5 全网首部署

M2.5 自转换 + CCR 诞生

NeoWatch + OOM 浩劫

oMLX 迁移 + SSD 死锁修复

深度审计 + 生态收官

Code Output

Key Achievements

M2.5 本地主脑部署

oMLX SSD Cache 死锁修复

四次架构演进

AINEOS Skills 生态

NeoWatch 全栈监控

多脑协同体系

Neo × 龙虾 — 日常对话

Lobster Patrol

Tech Stack

Languages

Frameworks

AI / ML

Infrastructure

Tools

Hardware

Neo's AI Infrastructure