MIGRATED
XiMind 产品规格书(规划版)
规划版提示
本 Spec 是 v0.1 规划版(2028 启用)。技术细节(基础模型选型、确切算法管线、数据架构)将在 2027 Q4 立项后 v1.0 正式版中细化。
本文档优先建立总体架构、API 骨架、关键接口约定。
摘要
XiMind(羲音智脑)是 Xisound 六层矩阵中的 L5 云端 AI Agent 服务。
本文档规划其 v1.0 GA 目标架构(2029 Q2):云原生 SaaS + 车端 Agent + 私有化授权三形态;REST + gRPC + WebSocket 三协议 API;Token 计费与多区域部署。
1. 总体架构
1.1 系统全景
graph TB
Clients[客户端层]
Clients --> CCli[XiStudio/XiForge<br/>桌面]
Clients --> WAPP[Web APP]
Clients --> CAPP[车主 APP]
Clients --> Vehicle[车端 Agent<br/>XiAmp AI / XiBox AI]
Gateway[API Gateway<br/>REST+gRPC+WS]
Clients --> Gateway
Gateway --> AI[AI Orchestrator]
AI --> LLM[LLM 推理服务<br/>vLLM + 专用 Fine-tune]
AI --> RAG[RAG 检索<br/>向量库]
AI --> Tools[Tool 调用层]
Tools --> XF[XiForge API]
Tools --> XS[XiStudio API]
Tools --> XT[XiTest API]
Tools --> XTu[XiTune API]
Tools --> Vehicle
AI --> Data[(数据平台)]
Data --> Vec[(向量库<br/>Milvus)]
Data --> TS[(时序库<br/>车端回传)]
Data --> OLAP[(OLAP<br/>ClickHouse)]
Data --> OBJ[(对象存储<br/>S3/MinIO)]
class Clients,CCli,WAPP,CAPP,Vehicle xyL4
class Gateway xyL2
class AI,LLM,RAG,Tools xyL5
class XF,XS,XT,XTu xyL3
class Data,Vec,TS,OLAP,OBJ xySuccess
1.2 技术栈(规划)
| 层 |
技术 |
| API 网关 |
Kong / Envoy + JWT/OAuth 2.0 |
| 编排 |
Python + FastAPI + Celery |
| LLM 推理 |
vLLM + 专用 Fine-tune 模型(基础模型 2027 Q4 选型) |
| RAG |
LangChain + Milvus 向量库 |
| 工具调用 |
Function Calling / MCP(Model Context Protocol) |
| 实时下发 |
MQTT + WebSocket |
| 数据平台 |
PostgreSQL + Milvus + ClickHouse + S3/MinIO |
| 部署 |
Kubernetes + Istio(Service Mesh) |
| 监控 |
Prometheus + Grafana + OpenTelemetry |
1.3 部署拓扑
| 区域 |
节点 |
用途 |
| 华东(主) |
50+ K8s 节点 |
SaaS 主区域 + 训练 |
| 华南 |
20+ 节点 |
多活容灾 + 车端就近 |
| 北美(海外) |
20+ 节点 |
海外客户 |
| 私有化 |
客户自建 |
高保密定制部署 |
2. API 规格
2.1 核心 API 总览
| 接口 |
协议 |
方法 |
说明 |
/api/v1/chat |
REST + SSE |
POST |
对话接口(多轮) |
/api/v1/codegen |
REST + WS |
POST |
代码生成(驱动 XiForge) |
/api/v1/flow |
REST |
POST |
算法链路编排(驱动 XiStudio) |
/api/v1/tune |
REST |
POST |
调音决策(驱动 XiTune) |
/api/v1/test/generate |
REST |
POST |
测试用例生成(驱动 XiTest) |
/api/v1/vehicle/dispatch |
MQTT + HTTPS |
- |
车端参数下发 |
/api/v1/auth/token |
REST |
POST |
Token 认证 |
/api/v1/billing/usage |
REST |
GET |
计费查询 |
2.2 Chat API(流式)
POST /api/v1/chat
Authorization: Bearer <token>
Content-Type: application/json
Accept: text/event-stream
{
"session_id": "sess-001",
"messages": [
{ "role": "user", "content": "帮我做一个 8 通道环绕 DSP 方案" }
],
"context": {
"project_id": "proj-abc",
"user_role": "algorithm_engineer"
},
"stream": true
}
返回(Server-Sent Events):
data: {"delta": "好的,", "type": "text"}
data: {"delta": "我先从 XiAlgo 拼装", "type": "text"}
data: {"tool_call": {"name": "xistudio.create_flow", "args": {...}}}
data: {"result": {...}, "type": "complete"}
2.3 CodeGen API(v1.1+)
POST /api/v1/codegen
{
"template": "fx-eq",
"description": "低频增强算法 60Hz +3dB",
"constraints": { "target": "XiDSP-D2", "max_mips": 30 },
"project_id": "proj-abc"
}
响应:
{
"request_id": "req-001",
"status": "success",
"code_diff": "--- a/src/eq.c ...",
"explanation": "基于 Butterworth shelving 实现 ...",
"confidence": 0.85,
"tokens_used": 1500,
"billing_units": 1
}
2.4 车端下发 API(MQTT)
- Topic:
xisound/vehicle/{vin}/params/apply
- Payload(JSON):
{
"version": "1.0",
"scene": "highway_vocal",
"xialgo_params": {
"fx.eq.vocal_boost": { "enabled": true, "gain": 3 }
},
"expire_at": "2026-06-05T00:00:00Z",
"signature": "base64..."
}
2.5 数据回传 API(车端 → 云)
- Topic:
xisound/vehicle/{vin}/telemetry
- 频率:默认每 5 分钟上报一次,或事件触发
- 内容:使用场景 / 用户调整记录 / 匿名声学特征
3. Token 计费模型
3.1 计量单位
- Token:以基础模型标准定义(约 1 个汉字 = 1-2 Token)
- Billing Unit:计费单位,1 BU = 1000 Token
3.2 消耗规则
| 操作 |
输入 Token 权重 |
输出 Token 权重 |
| 纯对话 |
1× |
1× |
| 代码生成 |
1× |
3×(输出代码权重高) |
| 调音决策 |
2×(RAG 检索) |
1× |
| 车端下发 |
2×(实时 QoS) |
1× |
3.3 套餐(规划)
| 套餐 |
月度 Token |
月费(参考) |
| Free |
10 万 |
0 |
| 基础 |
100 万 |
¥500 |
| 标准 |
500 万 |
¥5000 |
| 企业 |
5000 万 |
¥100000 |
| 车端 Token(含) |
车内消耗记账 |
含于 XiAmp AI / XiBox AI |
3.4 计费接口
GET /api/v1/billing/usage?period=2029-05
{
"user_id": "u-001",
"period": "2029-05",
"plan": "enterprise",
"tokens_used": 32450000,
"tokens_included": 50000000,
"overage_tokens": 0,
"estimated_cost": 100000.0,
"breakdown": {
"chat": 12000000,
"codegen": 15000000,
"tune": 3000000,
"vehicle": 2450000
}
}
4. LLM / AI 模型架构
4.1 模型层次
| 层次 |
用途 |
模型(规划) |
| 基础模型 |
通用语言理解 |
第三方 + Fine-tune(2027 Q4 选型) |
| 领域模型 |
声学/DSP 专业 |
Xisound 自研 Fine-tune |
| 代码模型 |
C/C++ 生成 |
Code-LLM Fine-tune |
| 调音模型 |
参数推理 |
Xisound 自研(基于历史调音数据) |
4.2 RAG 检索
- 向量库:Milvus · 存储 XiAlgo 文档 / 历史 Bug / 调音案例
- Embedding:2048-dim · 领域 Fine-tune
- 检索:HNSW 索引 · Top-K 20 + Rerank Top-5
4.3 工具调用(Function Calling)
- 协议:OpenAI Function Calling 风格 / MCP(Model Context Protocol)
- 工具注册:静态注册 XiForge/XiStudio/XiTest/XiTune 的核心 API
- 权限:基于用户角色限制可调工具范围
5. 车端 Agent 规格
5.1 车端 Agent(XiAmp AI / XiBox AI 内置)
| 参数 |
规格 |
| 运行环境 |
Linux(ARM)或 XiDSP AI 核心 |
| 内存占用 |
≤ 100 MB |
| 本地推理 |
小模型(< 1B 参数)· 场景识别 + 快速响应 |
| 云协同 |
MQTT + HTTPS |
| 离线能力 |
支持离线 7 天基础功能 |
| 安全 |
硬件 SE 存储证书 + 端到端加密 |
5.2 场景识别(本地)
| 场景 |
输入特征 |
本地模型输出 |
| 隧道 |
GPS + 环境噪声 |
高频提升 + 人声增强 |
| 高速 |
车速 + 路噪 |
路噪抑制 + 动态 EQ |
| 停车 |
车速 = 0 + 长时 |
低功耗 + 柔和音色 |
5.3 云端增强(复杂场景)
- 本地无法决定 → 上传特征到云
- 云端 XiMind 精调 → 下发新参数
- 车端缓存该场景策略
6. 数据平台
6.1 数据分类
| 类型 |
存储 |
保留 |
| 用户对话历史 |
PostgreSQL |
1 年 · 可用户删除 |
| 算法文档 / 案例 |
向量库 + 对象存储 |
永久 |
| 车端匿名遥测 |
ClickHouse |
2 年 |
| 调用计费日志 |
ClickHouse |
2 年 |
| 模型训练数据 |
S3/MinIO |
永久(加密) |
6.2 数据合规
- 车端数据:匿名化 + 用户同意后采集
- 中国境内车辆数据:中国境内存储(不出境)
- GDPR 支持:欧盟用户数据欧盟存储
- 用户数据导出/删除 API:24 小时内响应
7. 安全规格
7.1 认证与授权
- 认证:OAuth 2.0 / OIDC · 支持 SSO
- API Key:企业客户可生成长期 API Key
- 车端证书:硬件 SE 绑定 · X.509 证书
- 权限模型:RBAC + ABAC(基于用户角色 + 资源属性)
7.2 传输与存储
- 传输:TLS 1.3(强制)
- 静态存储:AES-256
- 密钥管理:KMS(AWS KMS / 阿里云 KMS / 自建 HSM)
7.3 模型安全
- Prompt Injection 检测(输入过滤 + 异常模式识别)
- 输出内容合规过滤(违禁词 + 注入危险代码检测)
- 速率限制(单用户 / 单 IP)
- DDoS 防护(网关层)
7.4 审计
- 全 API 调用记录:用户 / IP / 时间 / 请求 / 响应摘要
- 保留期:2 年
- 支持合规审计导出
8. 性能与可靠性
8.1 性能指标
| 指标 |
目标 |
| Chat 首 Token 响应 |
≤ 1 s P95 |
| Chat 完整响应(500 Token) |
≤ 3 s P95 |
| CodeGen 响应 |
≤ 30 s P95 |
| 车端下发 |
≤ 500 ms P99 |
| 吞吐量 |
10000+ QPS(总) |
8.2 SLA
- SaaS 可用性 ≥ 99.9%
- 车端 MQTT 可用性 ≥ 99.5%
- 故障恢复 RTO ≤ 10 分钟
- 数据恢复 RPO ≤ 1 小时
8.3 容灾
- 多区域多活(华东 + 华南)
- 数据跨区同步(PostgreSQL 流复制 + 对象存储跨区)
- 故障自动切流量
9. 与其他产品的接口
| 产品 |
接口 |
说明 |
| XiForge |
REST + WS |
代码生成 API |
| XiStudio |
REST |
流图编排 API |
| XiTest |
REST |
用例生成 API |
| XiTune |
REST |
调音决策 API |
| XiAmp AI / XiBox AI |
MQTT + HTTPS |
参数下发 + 遥测回传 |
| XiAlgo |
向量库检索 |
RAG 知识来源 |
| 第三方客户 IDE |
REST + OAuth 2.0 |
开放 API(企业套餐) |
10. 已知限制与路线
10.1 v1.0 GA 已知限制
- 多语言:v1.0 优先中英;其他语言 v1.1+
- 大规模并发(10 万+ QPS):v1.0 支持万级,v2.0 优化百万级
- 自研基础模型:v1.0 依赖第三方 + Fine-tune;v2.0 探索自研
10.2 路线图
- v1.0(2029 Q2):5 大核心能力 GA
- v1.1(2029 Q4):私有化部署版本 + 多语言扩展
- v2.0(2030+):自研基础模型 + 车端大模型升级
11. 附录
11.1 关联文档
11.2 标准与开源组件
- OAuth 2.0 / OIDC / JWT 标准
- MQTT 5.0(ISO/IEC 20922)
- gRPC + Protocol Buffers
- Kubernetes + Istio
- OpenTelemetry 规范
- Model Context Protocol(MCP)
- Milvus / PostgreSQL / ClickHouse(开源)
11.3 版本历史
| 版本 |
日期 |
要点 |
| v1.0 |
2026-05-05 |
首版(规划版)· 总体架构 + API 骨架 + Token 计费模型 |
spec.md · D2-P8-SPEC-001 · v1.0 · 2026-05-05 · Xisound 研发中心 · 云端与算法团队