The fastest local AI engine for Apple Silicon. 4.2x faster than Ollama, 0.08s cached TTFT, 100% tool calling. 17 tool parsers, prompt cache, reasoning separation, cloud routing. Drop-in OpenAI replacement. Works with Claude Code, Cursor, Aider.
推荐理由
README 将它定位为「The fastest local AI engine for Apple Silicon」,核心痛点是把 prompt 技巧、模板和工作流沉淀成可复用资产。它有一定社区验证,同时仍保留发现潜力,最近两周仍在维护,license 清晰,主要技术栈是 Python,适合作为「同类问题选型」的候选项目。
注意事项
README 摘要信息有限,发布前建议再人工扫一遍文档;展示前建议跑通 README quickstart,并确认部署成本、外部依赖和数据安全边界。