XiAlgo 产品需求文档
XiAlgo 产品需求文档 PRD v1.0
摘要
XiAlgo(羲音算法库)是 Xisound 六层矩阵中的 L3 算法资产层——提供覆盖音效、降噪、AI、KTV、多音区、空间音频六大套件的车规级 DSP 算法 IP。 本 PRD 定义六大套件的算法清单、性能指标、授权体系、交付形态、里程碑与验收标准。
1. 产品定位
1.1 一句话定位
XiAlgo:可复用、可商用、跨平台的车载声学算法 IP 库。
1.2 核心价值
- 客户视角:拖拽即用,无需重复造轮子
- 商业视角:一次研发,N 颗芯片 Royalty 收入
- 生态视角:XiStudio 的"积木箱",XiDSP 的"灵魂"
1.3 目标用户
- 主:Tier1 方案工程师 / 主机厂声学团队
- 次:后装调音工程师 / 开发者
- 辅:学术机构 / 开源贡献者(Free Tier)
2. 六大套件详细需求
2.1 XiAlgo-FX(基础音效)
定位:所有产品必装,Free Tier 标配
核心算法:
| 算法 | Free | Pro | 说明 |
|---|---|---|---|
| 参数 EQ(PEQ) | ✅ 5 段 | ✅ 31 段 | Biquad + Shelf + Bell |
| 图示 EQ(GEQ) | ✅ 10 段 | ✅ 31 段 | ISO 八度 / 三分之一八度 |
| 动态压缩(Compressor) | ✅ 1 段 | ✅ 多段 | Threshold / Ratio / Attack / Release |
| 扩展器(Expander) | — | ✅ | 降低静音段噪音 |
| 限幅器(Limiter) | ✅ | ✅ | 短时峰值限制 |
| 时延对齐(Delay) | ✅ 4ch | ✅ 16ch | 扬声器距离补偿 |
| 混响(Reverb) | — | ✅ | 车厢声场模拟 |
| 高低音分频(Crossover) | ✅ 2 路 | ✅ 8 路 | Butterworth / LR |
性能指标:
- MIPS:FX 全量 @ 48kHz/8ch ≤ 100 MIPS
- 延迟:≤ 3 ms
- 精度:24-bit 定点 Q1.23
2.2 XiAlgo-NR(降噪)
定位:Pro Tier 核心卖点
核心算法:
| 算法 | 目标场景 | MIPS(D1) |
|---|---|---|
| 风噪抑制 | 窗户半开 / 天窗场景 | 30 |
| 路噪自适应(NLMS) | 高速行驶 | 60 |
| 主动降噪(ANC) | 发动机 / 路面低频 | 80 |
| 通话降噪 | 免提电话 | 40 |
| 回声消除(AEC) | 扬声器自激 | 50 |
性能目标:
- 路噪衰减:≥ 10 dB @ 200-800 Hz
- ANC 衰减:≥ 15 dB @ 30-300 Hz
- 通话语音质量:PESQ ≥ 3.5
2.3 XiAlgo-AI(AI 算法)
定位:高端差异化,需 D2 及以上芯片支持
核心算法:
| 算法 | 说明 | 硬件需求 |
|---|---|---|
| AI 语音增强 | 基于 DNN 的降噪 | D2 + AI 协处理器 |
| 场景识别 | 识别路面 / 风噪 / 语音 | D2+ |
| AI 降噪 | 替代传统 NLMS | D2+ |
| 音源分离 | 分离人声 / 乐器 / 背景 | D3+ / A1 |
| 声纹识别 | 识别驾驶员身份 | A1 |
性能目标:
- AI 降噪 vs 传统:SNR 提升 ≥ 5 dB
- 场景识别准确率 ≥ 90%
- 延迟 ≤ 20 ms
2.4 XiAlgo-KTV(卡拉 OK)
定位:后装娱乐市场 / 车载 KTV
核心算法:
- 人声消除(Vocal Remover)
- 调性变换(Pitch Shift ±12 半音)
- 回声 / 混响(Karaoke Reverb)
- 麦克风混音
- 变声器(男变女 / 女变男 / 童声)
2.5 XiAlgo-Zone(多音区)
定位:中高端车型差异化
核心算法:
- 4-zone 独立音频(驾驶位 / 副驾 / 后排左右)
- 定向声场(Beamforming)
- 听觉隔离(Private Audio)
- 跨区混音(Crossfade)
典型应用:
- 主驾听导航,副驾听音乐互不干扰
- 后排 VIP 模式独立片源
2.6 XiAlgo-3D(空间音频)
定位:HiFi / 旗舰车型
核心算法:
- 全景声(Dolby Atmos 兼容格式)
- HRTF(头相关传递函数,个性化耳部响应)
- 波场合成(Wavefield Synthesis)
- 声源虚拟化(2ch → 7.1.4 上混)
硬件需求:D3 及以上(≥ 3000 MIPS)
3. 授权体系
3.1 Free Tier(引流)
包含:FX 基础(EQ 5 段 / DRC 1 段 / Limiter / Delay 4ch / 混响)+ NR 入门(通话降噪) 授权:免费在线注册,跟随 XiStudio Community 发布 限制: - 仅在 XiStudio Community 内运行 - 不可脱离 XiStudio 直接烧录到客户固件
3.2 Pro Tier(主力收入)
包含:六套件完整版 授权模型: - License 费:按套件 × 年度(¥几十万 / 套件 / 年 · 行业参考) - Royalty:按 XiDSP 芯片出货量(¥3-10 / 颗 · 行业参考) - 年度更新:免费升级(新算法 / 性能优化)
签约流程: 1. NDA → 评估期(3 个月 / 100 颗样品免费) 2. 签约 → 技术对接 + 集成支持 3. 量产 → Royalty 按季度结算
定价为行业通用参考 · 需 CFO / CBO 联合定稿
3.3 Custom Tier(定制)
适用: - 客户想要独家算法 - 客户希望 XiForge 团队 CO-develop - IDM 级深度合作
授权:项目制(一次性 + 可选 Royalty)+ 排他期选项
4. 交付形态
4.1 XiAlgo 算法包格式
- 文件:
.xipkg(签名压缩包) - 内容:
- 二进制算法模块(XiDSP 架构)
- 算法元数据(MIPS / 内存 / 参数范围)
- XiStudio 图标与 UI 描述
- 示例工程
- 版本:语义化(Major.Minor.Patch)
4.2 支持的 XiDSP 型号
| 算法包版本 | D1 | D2 | D3 | D4 | A1 |
|---|---|---|---|---|---|
| v1.x(2026-2027) | ✅ | ✅ | — | — | — |
| v2.x(2028) | ✅ | ✅ | ✅ | — | — |
| v3.x(2029+) | ✅ | ✅ | ✅ | ✅ | ✅ |
同一套算法包通过 XiCore 抽象层跨 XiDSP 型号运行(ABI v1.0 兼容)。
5. 研发流程
5.1 算法研发路径
graph LR
A[需求输入] --> B[原型 Python/Matlab]
B --> C[客观基准测试]
C --> D[C 定点实现]
D --> E[XiDSP 移植]
E --> F[XiTest 回归]
F --> G[发布到 XiAlgo]
class A xyL0
class B,C xyL1
class D,E xyL3
class F xyL2
class G xySuccess
5.2 基准测试
每个算法发布前必须通过:
- 客观指标:THD+N / SNR / 频响等(XiProbe 测量)
- 主观评价:MUSHRA 多名评审员
- 跨场景测试:静态 / 动态 / 极端工况
- MIPS 预算测试:实测占用 vs 标注值偏差 ≤ 10%
6. 里程碑
6.1 总体时间表
gantt
title XiAlgo 六大套件发布时间表
dateFormat YYYY-MM
axisFormat %Y-%m
section FX
FX Free v1.0 :2026-06, 2M
FX Pro v1.0 :2026-10, 3M
section NR
NR v1.0 :2026-10, 3M
section Zone & 3D
Zone v1.0 :2027-01, 2M
3D v1.0 :2027-02, 3M
section AI
AI v1.0 (D2) :2027-06, 4M
section KTV
KTV v1.0 :2027-09, 3M
section 2028+
全套件 v2.0 迭代 :2028-01, 12M
6.2 关键节点
- 2026 Q2:FX Free v1.0 · 伴随 XiStudio Community 发布
- 2026 Q4:FX Pro + NR v1.0 · XiDSP-D1 首发联调
- 2027 Q1:Zone + 3D v1.0
- 2027 Q3:AI v1.0(XiDSP-D2 适配)
- 2027 Q4:KTV v1.0 · 六套件齐全
7. 商业目标
7.1 首年(2027)
- Free Tier 注册:≥ 1 万
- Pro Tier 签约:5-10 家 Tier1 / 主机厂
- 覆盖 XiDSP 出货:10-30 万颗
- Royalty 收入:行业参考(需 CFO 定稿)
7.2 三年(2028)
- Free Tier 注册:≥ 10 万
- Pro Tier 签约:30+ 家
- 覆盖 XiDSP 出货:100 万+ 颗
- 算法专利:≥ 30 件
8. 质量与风险
8.1 质量保证
- 每个算法必须附 XiTest 回归脚本
- 每次发布跑 100% 回归
- 客户现场问题 48h 内响应
8.2 风险矩阵
| 风险 | 概率 | 影响 | 缓解 |
|---|---|---|---|
| AI 算法性能不达标 | 中 | 高 | 多方案并行 + 学术合作 |
| Royalty 追踪漏报 | 中 | 中 | 芯片内置唯一 ID + 云端对账 |
| IP 盗版 / 逆向 | 中 | 高 | 代码混淆 + 授权校验 + 法律诉讼 |
| 客户集成周期长 | 低 | 中 | 参考工程 + 技术支持 |
9. 验收标准(FX Pro v1.0)
9.1 功能
- 31 段 PEQ / GEQ 可用
- 多段 DRC 可用
- Delay 16ch 支持
- 分频器 8 路可配置
- 混响 3 种预设
9.2 性能
- FX 全量 ≤ 100 MIPS @ 48kHz/8ch(D1)
- 精度 ≥ 24-bit Q1.23
- 延迟 ≤ 3 ms
9.3 集成
- XiStudio Pro 拖拽可用
- XiDSP-D1 烧录运行稳定
- XiTest 全回归通过
10. 附录
10.1 关联文档
10.2 版本历史
| 版本 | 日期 | 要点 |
|---|---|---|
| v1.0 | 2026-05-05 | 首版 · 六大套件定义 + 三级授权 |
prd.md · D2-P5-PRD-001 · v1.0 · 2026-05-05 · Xisound 产品中心 · 算法产品组