MIGRATED

XiMind 产品规格书（规划版）

规划版提示

本 Spec 是 v0.1 规划版（2028 启用）。技术细节（基础模型选型、确切算法管线、数据架构）将在 2027 Q4 立项后 v1.0 正式版中细化。本文档优先建立总体架构、API 骨架、关键接口约定。

摘要

XiMind（羲音智脑）是 Xisound 六层矩阵中的 L5 云端 AI Agent 服务。本文档规划其 v1.0 GA 目标架构（2029 Q2）：云原生 SaaS + 车端 Agent + 私有化授权三形态；REST + gRPC + WebSocket 三协议 API；Token 计费与多区域部署。

1. 总体架构

1.1 系统全景

graph TB
    Clients[客户端层]
    Clients --> CCli[XiStudio/XiForge<br/>桌面]
    Clients --> WAPP[Web APP]
    Clients --> CAPP[车主 APP]
    Clients --> Vehicle[车端 Agent<br/>XiAmp AI / XiBox AI]

    Gateway[API Gateway<br/>REST+gRPC+WS]
    Clients --> Gateway

    Gateway --> AI[AI Orchestrator]
    AI --> LLM[LLM 推理服务<br/>vLLM + 专用 Fine-tune]
    AI --> RAG[RAG 检索<br/>向量库]
    AI --> Tools[Tool 调用层]

    Tools --> XF[XiForge API]
    Tools --> XS[XiStudio API]
    Tools --> XT[XiTest API]
    Tools --> XTu[XiTune API]
    Tools --> Vehicle

    AI --> Data[(数据平台)]
    Data --> Vec[(向量库<br/>Milvus)]
    Data --> TS[(时序库<br/>车端回传)]
    Data --> OLAP[(OLAP<br/>ClickHouse)]
    Data --> OBJ[(对象存储<br/>S3/MinIO)]

    class Clients,CCli,WAPP,CAPP,Vehicle xyL4
    class Gateway xyL2
    class AI,LLM,RAG,Tools xyL5
    class XF,XS,XT,XTu xyL3
    class Data,Vec,TS,OLAP,OBJ xySuccess

1.2 技术栈（规划）

层	技术
API 网关	Kong / Envoy + JWT/OAuth 2.0
编排	Python + FastAPI + Celery
LLM 推理	vLLM + 专用 Fine-tune 模型（基础模型 2027 Q4 选型）
RAG	LangChain + Milvus 向量库
工具调用	Function Calling / MCP（Model Context Protocol）
实时下发	MQTT + WebSocket
数据平台	PostgreSQL + Milvus + ClickHouse + S3/MinIO
部署	Kubernetes + Istio（Service Mesh）
监控	Prometheus + Grafana + OpenTelemetry

1.3 部署拓扑

区域	节点	用途
华东（主）	50+ K8s 节点	SaaS 主区域 + 训练
华南	20+ 节点	多活容灾 + 车端就近
北美（海外）	20+ 节点	海外客户
私有化	客户自建	高保密定制部署

2. API 规格

2.1 核心 API 总览

接口	协议	方法	说明
`/api/v1/chat`	REST + SSE	POST	对话接口（多轮）
`/api/v1/codegen`	REST + WS	POST	代码生成（驱动 XiForge）
`/api/v1/flow`	REST	POST	算法链路编排（驱动 XiStudio）
`/api/v1/tune`	REST	POST	调音决策（驱动 XiTune）
`/api/v1/test/generate`	REST	POST	测试用例生成（驱动 XiTest）
`/api/v1/vehicle/dispatch`	MQTT + HTTPS	-	车端参数下发
`/api/v1/auth/token`	REST	POST	Token 认证
`/api/v1/billing/usage`	REST	GET	计费查询

2.2 Chat API（流式）

POST /api/v1/chat
Authorization: Bearer <token>
Content-Type: application/json
Accept: text/event-stream

{
  "session_id": "sess-001",
  "messages": [
    { "role": "user", "content": "帮我做一个 8 通道环绕 DSP 方案" }
  ],
  "context": {
    "project_id": "proj-abc",
    "user_role": "algorithm_engineer"
  },
  "stream": true
}

返回（Server-Sent Events）：

data: {"delta": "好的,", "type": "text"}
data: {"delta": "我先从 XiAlgo 拼装", "type": "text"}
data: {"tool_call": {"name": "xistudio.create_flow", "args": {...}}}
data: {"result": {...}, "type": "complete"}

2.3 CodeGen API（v1.1+）

POST /api/v1/codegen
{
  "template": "fx-eq",
  "description": "低频增强算法 60Hz +3dB",
  "constraints": { "target": "XiDSP-D2", "max_mips": 30 },
  "project_id": "proj-abc"
}

响应：

{
  "request_id": "req-001",
  "status": "success",
  "code_diff": "--- a/src/eq.c ...",
  "explanation": "基于 Butterworth shelving 实现 ...",
  "confidence": 0.85,
  "tokens_used": 1500,
  "billing_units": 1
}

2.4 车端下发 API（MQTT）

Topic：xisound/vehicle/{vin}/params/apply

Payload（JSON）：

{
  "version": "1.0",
  "scene": "highway_vocal",
  "xialgo_params": {
    "fx.eq.vocal_boost": { "enabled": true, "gain": 3 }
  },
  "expire_at": "2026-06-05T00:00:00Z",
  "signature": "base64..."
}

2.5 数据回传 API（车端 → 云）

Topic：xisound/vehicle/{vin}/telemetry
频率：默认每 5 分钟上报一次，或事件触发
内容：使用场景 / 用户调整记录 / 匿名声学特征

3. Token 计费模型

3.1 计量单位

Token：以基础模型标准定义（约 1 个汉字 = 1-2 Token）
Billing Unit：计费单位，1 BU = 1000 Token

3.2 消耗规则

操作	输入 Token 权重	输出 Token 权重
纯对话	1×	1×
代码生成	1×	3×（输出代码权重高）
调音决策	2×（RAG 检索）	1×
车端下发	2×（实时 QoS）	1×

3.3 套餐（规划）

套餐	月度 Token	月费（参考）
Free	10 万	0
基础	100 万	¥500
标准	500 万	¥5000
企业	5000 万	¥100000
车端 Token（含）	车内消耗记账	含于 XiAmp AI / XiBox AI

3.4 计费接口

GET /api/v1/billing/usage?period=2029-05
{
  "user_id": "u-001",
  "period": "2029-05",
  "plan": "enterprise",
  "tokens_used": 32450000,
  "tokens_included": 50000000,
  "overage_tokens": 0,
  "estimated_cost": 100000.0,
  "breakdown": {
    "chat": 12000000,
    "codegen": 15000000,
    "tune": 3000000,
    "vehicle": 2450000
  }
}

4. LLM / AI 模型架构

4.1 模型层次

层次	用途	模型（规划）
基础模型	通用语言理解	第三方 + Fine-tune（2027 Q4 选型）
领域模型	声学/DSP 专业	Xisound 自研 Fine-tune
代码模型	C/C++ 生成	Code-LLM Fine-tune
调音模型	参数推理	Xisound 自研（基于历史调音数据）

4.2 RAG 检索

向量库：Milvus · 存储 XiAlgo 文档 / 历史 Bug / 调音案例
Embedding：2048-dim · 领域 Fine-tune
检索：HNSW 索引 · Top-K 20 + Rerank Top-5

4.3 工具调用（Function Calling）

协议：OpenAI Function Calling 风格 / MCP（Model Context Protocol）
工具注册：静态注册 XiForge/XiStudio/XiTest/XiTune 的核心 API
权限：基于用户角色限制可调工具范围

5. 车端 Agent 规格

5.1 车端 Agent（XiAmp AI / XiBox AI 内置）

参数	规格
运行环境	Linux（ARM）或 XiDSP AI 核心
内存占用	≤ 100 MB
本地推理	小模型（< 1B 参数）· 场景识别 + 快速响应
云协同	MQTT + HTTPS
离线能力	支持离线 7 天基础功能
安全	硬件 SE 存储证书 + 端到端加密

5.2 场景识别（本地）

场景	输入特征	本地模型输出
隧道	GPS + 环境噪声	高频提升 + 人声增强
高速	车速 + 路噪	路噪抑制 + 动态 EQ
停车	车速 = 0 + 长时	低功耗 + 柔和音色

5.3 云端增强（复杂场景）

本地无法决定 → 上传特征到云
云端 XiMind 精调 → 下发新参数
车端缓存该场景策略

6. 数据平台

6.1 数据分类

类型	存储	保留
用户对话历史	PostgreSQL	1 年 · 可用户删除
算法文档 / 案例	向量库 + 对象存储	永久
车端匿名遥测	ClickHouse	2 年
调用计费日志	ClickHouse	2 年
模型训练数据	S3/MinIO	永久（加密）

6.2 数据合规

车端数据：匿名化 + 用户同意后采集
中国境内车辆数据：中国境内存储（不出境）
GDPR 支持：欧盟用户数据欧盟存储
用户数据导出/删除 API：24 小时内响应

7. 安全规格

7.1 认证与授权

认证：OAuth 2.0 / OIDC · 支持 SSO
API Key：企业客户可生成长期 API Key
车端证书：硬件 SE 绑定 · X.509 证书
权限模型：RBAC + ABAC（基于用户角色 + 资源属性）

7.2 传输与存储

传输：TLS 1.3（强制）
静态存储：AES-256
密钥管理：KMS（AWS KMS / 阿里云 KMS / 自建 HSM）

7.3 模型安全

Prompt Injection 检测（输入过滤 + 异常模式识别）
输出内容合规过滤（违禁词 + 注入危险代码检测）
速率限制（单用户 / 单 IP）
DDoS 防护（网关层）

7.4 审计

全 API 调用记录：用户 / IP / 时间 / 请求 / 响应摘要
保留期：2 年
支持合规审计导出

8. 性能与可靠性

8.1 性能指标

指标	目标
Chat 首 Token 响应	≤ 1 s P95
Chat 完整响应（500 Token）	≤ 3 s P95
CodeGen 响应	≤ 30 s P95
车端下发	≤ 500 ms P99
吞吐量	10000+ QPS（总）

8.2 SLA

SaaS 可用性 ≥ 99.9%
车端 MQTT 可用性 ≥ 99.5%
故障恢复 RTO ≤ 10 分钟
数据恢复 RPO ≤ 1 小时

8.3 容灾

多区域多活（华东 + 华南）
数据跨区同步（PostgreSQL 流复制 + 对象存储跨区）
故障自动切流量

9. 与其他产品的接口

产品	接口	说明
XiForge	REST + WS	代码生成 API
XiStudio	REST	流图编排 API
XiTest	REST	用例生成 API
XiTune	REST	调音决策 API
XiAmp AI / XiBox AI	MQTT + HTTPS	参数下发 + 遥测回传
XiAlgo	向量库检索	RAG 知识来源
第三方客户 IDE	REST + OAuth 2.0	开放 API（企业套餐）

10. 已知限制与路线

10.1 v1.0 GA 已知限制

多语言：v1.0 优先中英；其他语言 v1.1+
大规模并发（10 万+ QPS）：v1.0 支持万级，v2.0 优化百万级
自研基础模型：v1.0 依赖第三方 + Fine-tune；v2.0 探索自研

10.2 路线图

v1.0（2029 Q2）：5 大核心能力 GA
v1.1（2029 Q4）：私有化部署版本 + 多语言扩展
v2.0（2030+）：自研基础模型 + 车端大模型升级

11. 附录

11.1 关联文档

11.2 标准与开源组件

OAuth 2.0 / OIDC / JWT 标准
MQTT 5.0（ISO/IEC 20922）
gRPC + Protocol Buffers
Kubernetes + Istio
OpenTelemetry 规范
Model Context Protocol（MCP）
Milvus / PostgreSQL / ClickHouse（开源）

11.3 版本历史

版本	日期	要点
v1.0	2026-05-05	首版（规划版）· 总体架构 + API 骨架 + Token 计费模型

spec.md · D2-P8-SPEC-001 · v1.0 · 2026-05-05 · Xisound 研发中心 · 云端与算法团队