XiMind · Technical Spec (Planning)
XiMind 产品规格书(规划版)
云端 AI Agent · 云架构 / API / Token 计费 / 部署规格
规划版架构骨架 · 2028 立项后迭代 v1.0 正式版
2028
启用年份
K8s
云原生部署
JSON-RPC
核心协议
XiMind 产品规格书(规划版)
规划版提示
本 Spec 是 v0.1 规划版(2028 启用)。技术细节(基础模型选型、确切算法管线、数据架构)将在 2027 Q4 立项后 v1.0 正式版中细化。 本文档优先建立总体架构、API 骨架、关键接口约定。
摘要
XiMind(羲音智脑)是 Xisound 六层矩阵中的 L5 云端 AI Agent 服务。 本文档规划其 v1.0 GA 目标架构(2029 Q2):云原生 SaaS + 车端 Agent + 私有化授权三形态;REST + gRPC + WebSocket 三协议 API;Token 计费与多区域部署。
1. 总体架构
1.1 系统全景
graph TB
Clients[客户端层]
Clients --> CCli[XiStudio/XiForge<br/>桌面]
Clients --> WAPP[Web APP]
Clients --> CAPP[车主 APP]
Clients --> Vehicle[车端 Agent<br/>XiAmp AI / XiBox AI]
Gateway[API Gateway<br/>REST+gRPC+WS]
Clients --> Gateway
Gateway --> AI[AI Orchestrator]
AI --> LLM[LLM 推理服务<br/>vLLM + 专用 Fine-tune]
AI --> RAG[RAG 检索<br/>向量库]
AI --> Tools[Tool 调用层]
Tools --> XF[XiForge API]
Tools --> XS[XiStudio API]
Tools --> XT[XiTest API]
Tools --> XTu[XiTune API]
Tools --> Vehicle
AI --> Data[(数据平台)]
Data --> Vec[(向量库<br/>Milvus)]
Data --> TS[(时序库<br/>车端回传)]
Data --> OLAP[(OLAP<br/>ClickHouse)]
Data --> OBJ[(对象存储<br/>S3/MinIO)]
class Clients,CCli,WAPP,CAPP,Vehicle xyL4
class Gateway xyL2
class AI,LLM,RAG,Tools xyL5
class XF,XS,XT,XTu xyL3
class Data,Vec,TS,OLAP,OBJ xySuccess
1.2 技术栈(规划)
| 层 | 技术 |
|---|---|
| API 网关 | Kong / Envoy + JWT/OAuth 2.0 |
| 编排 | Python + FastAPI + Celery |
| LLM 推理 | vLLM + 专用 Fine-tune 模型(基础模型 2027 Q4 选型) |
| RAG | LangChain + Milvus 向量库 |
| 工具调用 | Function Calling / MCP(Model Context Protocol) |
| 实时下发 | MQTT + WebSocket |
| 数据平台 | PostgreSQL + Milvus + ClickHouse + S3/MinIO |
| 部署 | Kubernetes + Istio(Service Mesh) |
| 监控 | Prometheus + Grafana + OpenTelemetry |
1.3 部署拓扑
| 区域 | 节点 | 用途 |
|---|---|---|
| 华东(主) | 50+ K8s 节点 | SaaS 主区域 + 训练 |
| 华南 | 20+ 节点 | 多活容灾 + 车端就近 |
| 北美(海外) | 20+ 节点 | 海外客户 |
| 私有化 | 客户自建 | 高保密定制部署 |
2. API 规格
2.1 核心 API 总览
| 接口 | 协议 | 方法 | 说明 |
|---|---|---|---|
/api/v1/chat |
REST + SSE | POST | 对话接口(多轮) |
/api/v1/codegen |
REST + WS | POST | 代码生成(驱动 XiForge) |
/api/v1/flow |
REST | POST | 算法链路编排(驱动 XiStudio) |
/api/v1/tune |
REST | POST | 调音决策(驱动 XiTune) |
/api/v1/test/generate |
REST | POST | 测试用例生成(驱动 XiTest) |
/api/v1/vehicle/dispatch |
MQTT + HTTPS | - | 车端参数下发 |
/api/v1/auth/token |
REST | POST | Token 认证 |
/api/v1/billing/usage |
REST | GET | 计费查询 |
2.2 Chat API(流式)
POST /api/v1/chat
Authorization: Bearer <token>
Content-Type: application/json
Accept: text/event-stream
{
"session_id": "sess-001",
"messages": [
{ "role": "user", "content": "帮我做一个 8 通道环绕 DSP 方案" }
],
"context": {
"project_id": "proj-abc",
"user_role": "algorithm_engineer"
},
"stream": true
}
返回(Server-Sent Events):
data: {"delta": "好的,", "type": "text"}
data: {"delta": "我先从 XiAlgo 拼装", "type": "text"}
data: {"tool_call": {"name": "xistudio.create_flow", "args": {...}}}
data: {"result": {...}, "type": "complete"}
2.3 CodeGen API(v1.1+)
POST /api/v1/codegen
{
"template": "fx-eq",
"description": "低频增强算法 60Hz +3dB",
"constraints": { "target": "XiDSP-D2", "max_mips": 30 },
"project_id": "proj-abc"
}
响应:
{
"request_id": "req-001",
"status": "success",
"code_diff": "--- a/src/eq.c ...",
"explanation": "基于 Butterworth shelving 实现 ...",
"confidence": 0.85,
"tokens_used": 1500,
"billing_units": 1
}
2.4 车端下发 API(MQTT)
- Topic:
xisound/vehicle/{vin}/params/apply - Payload(JSON):
2.5 数据回传 API(车端 → 云)
- Topic:
xisound/vehicle/{vin}/telemetry - 频率:默认每 5 分钟上报一次,或事件触发
- 内容:使用场景 / 用户调整记录 / 匿名声学特征
3. Token 计费模型
3.1 计量单位
- Token:以基础模型标准定义(约 1 个汉字 = 1-2 Token)
- Billing Unit:计费单位,1 BU = 1000 Token
3.2 消耗规则
| 操作 | 输入 Token 权重 | 输出 Token 权重 |
|---|---|---|
| 纯对话 | 1× | 1× |
| 代码生成 | 1× | 3×(输出代码权重高) |
| 调音决策 | 2×(RAG 检索) | 1× |
| 车端下发 | 2×(实时 QoS) | 1× |
3.3 套餐(规划)
| 套餐 | 月度 Token | 月费(参考) |
|---|---|---|
| Free | 10 万 | 0 |
| 基础 | 100 万 | ¥500 |
| 标准 | 500 万 | ¥5000 |
| 企业 | 5000 万 | ¥100000 |
| 车端 Token(含) | 车内消耗记账 | 含于 XiAmp AI / XiBox AI |
3.4 计费接口
GET /api/v1/billing/usage?period=2029-05
{
"user_id": "u-001",
"period": "2029-05",
"plan": "enterprise",
"tokens_used": 32450000,
"tokens_included": 50000000,
"overage_tokens": 0,
"estimated_cost": 100000.0,
"breakdown": {
"chat": 12000000,
"codegen": 15000000,
"tune": 3000000,
"vehicle": 2450000
}
}
4. LLM / AI 模型架构
4.1 模型层次
| 层次 | 用途 | 模型(规划) |
|---|---|---|
| 基础模型 | 通用语言理解 | 第三方 + Fine-tune(2027 Q4 选型) |
| 领域模型 | 声学/DSP 专业 | Xisound 自研 Fine-tune |
| 代码模型 | C/C++ 生成 | Code-LLM Fine-tune |
| 调音模型 | 参数推理 | Xisound 自研(基于历史调音数据) |
4.2 RAG 检索
- 向量库:Milvus · 存储 XiAlgo 文档 / 历史 Bug / 调音案例
- Embedding:2048-dim · 领域 Fine-tune
- 检索:HNSW 索引 · Top-K 20 + Rerank Top-5
4.3 工具调用(Function Calling)
- 协议:OpenAI Function Calling 风格 / MCP(Model Context Protocol)
- 工具注册:静态注册 XiForge/XiStudio/XiTest/XiTune 的核心 API
- 权限:基于用户角色限制可调工具范围
5. 车端 Agent 规格
5.1 车端 Agent(XiAmp AI / XiBox AI 内置)
| 参数 | 规格 |
|---|---|
| 运行环境 | Linux(ARM)或 XiDSP AI 核心 |
| 内存占用 | ≤ 100 MB |
| 本地推理 | 小模型(< 1B 参数)· 场景识别 + 快速响应 |
| 云协同 | MQTT + HTTPS |
| 离线能力 | 支持离线 7 天基础功能 |
| 安全 | 硬件 SE 存储证书 + 端到端加密 |
5.2 场景识别(本地)
| 场景 | 输入特征 | 本地模型输出 |
|---|---|---|
| 隧道 | GPS + 环境噪声 | 高频提升 + 人声增强 |
| 高速 | 车速 + 路噪 | 路噪抑制 + 动态 EQ |
| 停车 | 车速 = 0 + 长时 | 低功耗 + 柔和音色 |
5.3 云端增强(复杂场景)
- 本地无法决定 → 上传特征到云
- 云端 XiMind 精调 → 下发新参数
- 车端缓存该场景策略
6. 数据平台
6.1 数据分类
| 类型 | 存储 | 保留 |
|---|---|---|
| 用户对话历史 | PostgreSQL | 1 年 · 可用户删除 |
| 算法文档 / 案例 | 向量库 + 对象存储 | 永久 |
| 车端匿名遥测 | ClickHouse | 2 年 |
| 调用计费日志 | ClickHouse | 2 年 |
| 模型训练数据 | S3/MinIO | 永久(加密) |
6.2 数据合规
- 车端数据:匿名化 + 用户同意后采集
- 中国境内车辆数据:中国境内存储(不出境)
- GDPR 支持:欧盟用户数据欧盟存储
- 用户数据导出/删除 API:24 小时内响应
7. 安全规格
7.1 认证与授权
- 认证:OAuth 2.0 / OIDC · 支持 SSO
- API Key:企业客户可生成长期 API Key
- 车端证书:硬件 SE 绑定 · X.509 证书
- 权限模型:RBAC + ABAC(基于用户角色 + 资源属性)
7.2 传输与存储
- 传输:TLS 1.3(强制)
- 静态存储:AES-256
- 密钥管理:KMS(AWS KMS / 阿里云 KMS / 自建 HSM)
7.3 模型安全
- Prompt Injection 检测(输入过滤 + 异常模式识别)
- 输出内容合规过滤(违禁词 + 注入危险代码检测)
- 速率限制(单用户 / 单 IP)
- DDoS 防护(网关层)
7.4 审计
- 全 API 调用记录:用户 / IP / 时间 / 请求 / 响应摘要
- 保留期:2 年
- 支持合规审计导出
8. 性能与可靠性
8.1 性能指标
| 指标 | 目标 |
|---|---|
| Chat 首 Token 响应 | ≤ 1 s P95 |
| Chat 完整响应(500 Token) | ≤ 3 s P95 |
| CodeGen 响应 | ≤ 30 s P95 |
| 车端下发 | ≤ 500 ms P99 |
| 吞吐量 | 10000+ QPS(总) |
8.2 SLA
- SaaS 可用性 ≥ 99.9%
- 车端 MQTT 可用性 ≥ 99.5%
- 故障恢复 RTO ≤ 10 分钟
- 数据恢复 RPO ≤ 1 小时
8.3 容灾
- 多区域多活(华东 + 华南)
- 数据跨区同步(PostgreSQL 流复制 + 对象存储跨区)
- 故障自动切流量
9. 与其他产品的接口
| 产品 | 接口 | 说明 |
|---|---|---|
| XiForge | REST + WS | 代码生成 API |
| XiStudio | REST | 流图编排 API |
| XiTest | REST | 用例生成 API |
| XiTune | REST | 调音决策 API |
| XiAmp AI / XiBox AI | MQTT + HTTPS | 参数下发 + 遥测回传 |
| XiAlgo | 向量库检索 | RAG 知识来源 |
| 第三方客户 IDE | REST + OAuth 2.0 | 开放 API(企业套餐) |
10. 已知限制与路线
10.1 v1.0 GA 已知限制
- 多语言:v1.0 优先中英;其他语言 v1.1+
- 大规模并发(10 万+ QPS):v1.0 支持万级,v2.0 优化百万级
- 自研基础模型:v1.0 依赖第三方 + Fine-tune;v2.0 探索自研
10.2 路线图
- v1.0(2029 Q2):5 大核心能力 GA
- v1.1(2029 Q4):私有化部署版本 + 多语言扩展
- v2.0(2030+):自研基础模型 + 车端大模型升级
11. 附录
11.1 关联文档
- XiMind 产品概述
- XiMind PRD v0.1 规划版
- XiForge 产品规格书
- XiStudio 产品规格书
- XiTest 产品规格书
- XiAlgo 产品规格书
- Xisound 产品矩阵 V1.1
11.2 标准与开源组件
- OAuth 2.0 / OIDC / JWT 标准
- MQTT 5.0(ISO/IEC 20922)
- gRPC + Protocol Buffers
- Kubernetes + Istio
- OpenTelemetry 规范
- Model Context Protocol(MCP)
- Milvus / PostgreSQL / ClickHouse(开源)
11.3 版本历史
| 版本 | 日期 | 要点 |
|---|---|---|
| v1.0 | 2026-05-05 | 首版(规划版)· 总体架构 + API 骨架 + Token 计费模型 |
spec.md · D2-P8-SPEC-001 · v1.0 · 2026-05-05 · Xisound 研发中心 · 云端与算法团队