跳转至
XiMind · Technical Spec (Planning)

XiMind 产品规格书(规划版)

云端 AI Agent · 云架构 / API / Token 计费 / 部署规格
文档编号:D2-P8-SPEC-001 · 版本:v1.0(规划)· 发布:2026-05-05
规划版架构骨架 · 2028 立项后迭代 v1.0 正式版
2028
启用年份
K8s
云原生部署
JSON-RPC
核心协议

XiMind 产品规格书(规划版)

规划版提示

本 Spec 是 v0.1 规划版(2028 启用)。技术细节(基础模型选型、确切算法管线、数据架构)将在 2027 Q4 立项后 v1.0 正式版中细化。 本文档优先建立总体架构、API 骨架、关键接口约定

摘要

XiMind(羲音智脑)是 Xisound 六层矩阵中的 L5 云端 AI Agent 服务。 本文档规划其 v1.0 GA 目标架构(2029 Q2):云原生 SaaS + 车端 Agent + 私有化授权三形态;REST + gRPC + WebSocket 三协议 API;Token 计费与多区域部署。


1. 总体架构

1.1 系统全景

graph TB
    Clients[客户端层]
    Clients --> CCli[XiStudio/XiForge<br/>桌面]
    Clients --> WAPP[Web APP]
    Clients --> CAPP[车主 APP]
    Clients --> Vehicle[车端 Agent<br/>XiAmp AI / XiBox AI]

    Gateway[API Gateway<br/>REST+gRPC+WS]
    Clients --> Gateway

    Gateway --> AI[AI Orchestrator]
    AI --> LLM[LLM 推理服务<br/>vLLM + 专用 Fine-tune]
    AI --> RAG[RAG 检索<br/>向量库]
    AI --> Tools[Tool 调用层]

    Tools --> XF[XiForge API]
    Tools --> XS[XiStudio API]
    Tools --> XT[XiTest API]
    Tools --> XTu[XiTune API]
    Tools --> Vehicle

    AI --> Data[(数据平台)]
    Data --> Vec[(向量库<br/>Milvus)]
    Data --> TS[(时序库<br/>车端回传)]
    Data --> OLAP[(OLAP<br/>ClickHouse)]
    Data --> OBJ[(对象存储<br/>S3/MinIO)]

    class Clients,CCli,WAPP,CAPP,Vehicle xyL4
    class Gateway xyL2
    class AI,LLM,RAG,Tools xyL5
    class XF,XS,XT,XTu xyL3
    class Data,Vec,TS,OLAP,OBJ xySuccess

1.2 技术栈(规划)

技术
API 网关 Kong / Envoy + JWT/OAuth 2.0
编排 Python + FastAPI + Celery
LLM 推理 vLLM + 专用 Fine-tune 模型(基础模型 2027 Q4 选型)
RAG LangChain + Milvus 向量库
工具调用 Function Calling / MCP(Model Context Protocol)
实时下发 MQTT + WebSocket
数据平台 PostgreSQL + Milvus + ClickHouse + S3/MinIO
部署 Kubernetes + Istio(Service Mesh)
监控 Prometheus + Grafana + OpenTelemetry

1.3 部署拓扑

区域 节点 用途
华东(主) 50+ K8s 节点 SaaS 主区域 + 训练
华南 20+ 节点 多活容灾 + 车端就近
北美(海外) 20+ 节点 海外客户
私有化 客户自建 高保密定制部署

2. API 规格

2.1 核心 API 总览

接口 协议 方法 说明
/api/v1/chat REST + SSE POST 对话接口(多轮)
/api/v1/codegen REST + WS POST 代码生成(驱动 XiForge)
/api/v1/flow REST POST 算法链路编排(驱动 XiStudio)
/api/v1/tune REST POST 调音决策(驱动 XiTune)
/api/v1/test/generate REST POST 测试用例生成(驱动 XiTest)
/api/v1/vehicle/dispatch MQTT + HTTPS - 车端参数下发
/api/v1/auth/token REST POST Token 认证
/api/v1/billing/usage REST GET 计费查询

2.2 Chat API(流式)

POST /api/v1/chat
Authorization: Bearer <token>
Content-Type: application/json
Accept: text/event-stream

{
  "session_id": "sess-001",
  "messages": [
    { "role": "user", "content": "帮我做一个 8 通道环绕 DSP 方案" }
  ],
  "context": {
    "project_id": "proj-abc",
    "user_role": "algorithm_engineer"
  },
  "stream": true
}

返回(Server-Sent Events):

data: {"delta": "好的,", "type": "text"}
data: {"delta": "我先从 XiAlgo 拼装", "type": "text"}
data: {"tool_call": {"name": "xistudio.create_flow", "args": {...}}}
data: {"result": {...}, "type": "complete"}

2.3 CodeGen API(v1.1+)

POST /api/v1/codegen
{
  "template": "fx-eq",
  "description": "低频增强算法 60Hz +3dB",
  "constraints": { "target": "XiDSP-D2", "max_mips": 30 },
  "project_id": "proj-abc"
}

响应:

{
  "request_id": "req-001",
  "status": "success",
  "code_diff": "--- a/src/eq.c ...",
  "explanation": "基于 Butterworth shelving 实现 ...",
  "confidence": 0.85,
  "tokens_used": 1500,
  "billing_units": 1
}

2.4 车端下发 API(MQTT)

  • Topicxisound/vehicle/{vin}/params/apply
  • Payload(JSON):
    {
      "version": "1.0",
      "scene": "highway_vocal",
      "xialgo_params": {
        "fx.eq.vocal_boost": { "enabled": true, "gain": 3 }
      },
      "expire_at": "2026-06-05T00:00:00Z",
      "signature": "base64..."
    }
    

2.5 数据回传 API(车端 → 云)

  • Topicxisound/vehicle/{vin}/telemetry
  • 频率:默认每 5 分钟上报一次,或事件触发
  • 内容:使用场景 / 用户调整记录 / 匿名声学特征

3. Token 计费模型

3.1 计量单位

  • Token:以基础模型标准定义(约 1 个汉字 = 1-2 Token)
  • Billing Unit:计费单位,1 BU = 1000 Token

3.2 消耗规则

操作 输入 Token 权重 输出 Token 权重
纯对话
代码生成 3×(输出代码权重高)
调音决策 2×(RAG 检索)
车端下发 2×(实时 QoS)

3.3 套餐(规划)

套餐 月度 Token 月费(参考)
Free 10 万 0
基础 100 万 ¥500
标准 500 万 ¥5000
企业 5000 万 ¥100000
车端 Token(含) 车内消耗记账 含于 XiAmp AI / XiBox AI

3.4 计费接口

GET /api/v1/billing/usage?period=2029-05
{
  "user_id": "u-001",
  "period": "2029-05",
  "plan": "enterprise",
  "tokens_used": 32450000,
  "tokens_included": 50000000,
  "overage_tokens": 0,
  "estimated_cost": 100000.0,
  "breakdown": {
    "chat": 12000000,
    "codegen": 15000000,
    "tune": 3000000,
    "vehicle": 2450000
  }
}

4. LLM / AI 模型架构

4.1 模型层次

层次 用途 模型(规划)
基础模型 通用语言理解 第三方 + Fine-tune(2027 Q4 选型)
领域模型 声学/DSP 专业 Xisound 自研 Fine-tune
代码模型 C/C++ 生成 Code-LLM Fine-tune
调音模型 参数推理 Xisound 自研(基于历史调音数据)

4.2 RAG 检索

  • 向量库:Milvus · 存储 XiAlgo 文档 / 历史 Bug / 调音案例
  • Embedding:2048-dim · 领域 Fine-tune
  • 检索:HNSW 索引 · Top-K 20 + Rerank Top-5

4.3 工具调用(Function Calling)

  • 协议:OpenAI Function Calling 风格 / MCP(Model Context Protocol)
  • 工具注册:静态注册 XiForge/XiStudio/XiTest/XiTune 的核心 API
  • 权限:基于用户角色限制可调工具范围

5. 车端 Agent 规格

5.1 车端 Agent(XiAmp AI / XiBox AI 内置)

参数 规格
运行环境 Linux(ARM)或 XiDSP AI 核心
内存占用 ≤ 100 MB
本地推理 小模型(< 1B 参数)· 场景识别 + 快速响应
云协同 MQTT + HTTPS
离线能力 支持离线 7 天基础功能
安全 硬件 SE 存储证书 + 端到端加密

5.2 场景识别(本地)

场景 输入特征 本地模型输出
隧道 GPS + 环境噪声 高频提升 + 人声增强
高速 车速 + 路噪 路噪抑制 + 动态 EQ
停车 车速 = 0 + 长时 低功耗 + 柔和音色

5.3 云端增强(复杂场景)

  • 本地无法决定 → 上传特征到云
  • 云端 XiMind 精调 → 下发新参数
  • 车端缓存该场景策略

6. 数据平台

6.1 数据分类

类型 存储 保留
用户对话历史 PostgreSQL 1 年 · 可用户删除
算法文档 / 案例 向量库 + 对象存储 永久
车端匿名遥测 ClickHouse 2 年
调用计费日志 ClickHouse 2 年
模型训练数据 S3/MinIO 永久(加密)

6.2 数据合规

  • 车端数据:匿名化 + 用户同意后采集
  • 中国境内车辆数据:中国境内存储(不出境)
  • GDPR 支持:欧盟用户数据欧盟存储
  • 用户数据导出/删除 API:24 小时内响应

7. 安全规格

7.1 认证与授权

  • 认证:OAuth 2.0 / OIDC · 支持 SSO
  • API Key:企业客户可生成长期 API Key
  • 车端证书:硬件 SE 绑定 · X.509 证书
  • 权限模型:RBAC + ABAC(基于用户角色 + 资源属性)

7.2 传输与存储

  • 传输:TLS 1.3(强制)
  • 静态存储:AES-256
  • 密钥管理:KMS(AWS KMS / 阿里云 KMS / 自建 HSM)

7.3 模型安全

  • Prompt Injection 检测(输入过滤 + 异常模式识别)
  • 输出内容合规过滤(违禁词 + 注入危险代码检测)
  • 速率限制(单用户 / 单 IP)
  • DDoS 防护(网关层)

7.4 审计

  • 全 API 调用记录:用户 / IP / 时间 / 请求 / 响应摘要
  • 保留期:2 年
  • 支持合规审计导出

8. 性能与可靠性

8.1 性能指标

指标 目标
Chat 首 Token 响应 ≤ 1 s P95
Chat 完整响应(500 Token) ≤ 3 s P95
CodeGen 响应 ≤ 30 s P95
车端下发 ≤ 500 ms P99
吞吐量 10000+ QPS(总)

8.2 SLA

  • SaaS 可用性 ≥ 99.9%
  • 车端 MQTT 可用性 ≥ 99.5%
  • 故障恢复 RTO ≤ 10 分钟
  • 数据恢复 RPO ≤ 1 小时

8.3 容灾

  • 多区域多活(华东 + 华南)
  • 数据跨区同步(PostgreSQL 流复制 + 对象存储跨区)
  • 故障自动切流量

9. 与其他产品的接口

产品 接口 说明
XiForge REST + WS 代码生成 API
XiStudio REST 流图编排 API
XiTest REST 用例生成 API
XiTune REST 调音决策 API
XiAmp AI / XiBox AI MQTT + HTTPS 参数下发 + 遥测回传
XiAlgo 向量库检索 RAG 知识来源
第三方客户 IDE REST + OAuth 2.0 开放 API(企业套餐)

10. 已知限制与路线

10.1 v1.0 GA 已知限制

  • 多语言:v1.0 优先中英;其他语言 v1.1+
  • 大规模并发(10 万+ QPS):v1.0 支持万级,v2.0 优化百万级
  • 自研基础模型:v1.0 依赖第三方 + Fine-tune;v2.0 探索自研

10.2 路线图

  • v1.0(2029 Q2):5 大核心能力 GA
  • v1.1(2029 Q4):私有化部署版本 + 多语言扩展
  • v2.0(2030+):自研基础模型 + 车端大模型升级

11. 附录

11.1 关联文档

11.2 标准与开源组件

  • OAuth 2.0 / OIDC / JWT 标准
  • MQTT 5.0(ISO/IEC 20922)
  • gRPC + Protocol Buffers
  • Kubernetes + Istio
  • OpenTelemetry 规范
  • Model Context Protocol(MCP)
  • Milvus / PostgreSQL / ClickHouse(开源)

11.3 版本历史

版本 日期 要点
v1.0 2026-05-05 首版(规划版)· 总体架构 + API 骨架 + Token 计费模型

spec.md · D2-P8-SPEC-001 · v1.0 · 2026-05-05 · Xisound 研发中心 · 云端与算法团队