部署方案选型
四种方案对比
| 维度 | ☁️ SaaS | 🏢 私有化 | 🔀 混合 | 🇨🇳 信创 |
|---|---|---|---|---|
| 数据位置 | 平台云 | 客户内网 | 应用内网 + 共享服务云 | 客户内网 + 国产化 |
| 代码位置 | 平台云 | 客户机房 | 客户机房 | 客户机房 |
| LLM | 合规渠道 | 自部署 / 内网 API | 自部署 + 外部 | 国产 LLM 自部署 |
| 硬件 | 无 | 客户提供 | 客户提供部分 | 客户提供(国产 CPU/GPU) |
| 运维 | 平台负责 | 客户自运维(可选托管) | 混合 | 客户自运维 |
| 授权 | 按用量订阅 | 非商业源码授权 | 按组合报价 | 非商业源码授权 |
| 适合 | 快速试用 · 小团队 | 大企业 · 数据敏感 | 跨境 · 主权敏感 | 军工 · 政府 · 涉密 |
SaaS 方案
适用
- 希望最快上线,不想投入运维
- 数据敏感度可接受云端处理
- 小团队(10–100 人)
交付范围
- 平台账号(按租户开通)
- 按座位或按用量计费
- 平台负责:更新、监控、备份、故障修复
- 内置所有主力技能(skill 市场)
限制
- LLM 成本由平台统一采购
- 不对外提供源码
- 跨境客户需确认合规边界
私有化方案(推荐大客户)
适用
- 数据不出内网
- 需要深度定制
- 长期使用(3 年以上)
交付范围
- 全量源码(前端 + API 后端 + Agent 运行时 + 技能库)
- 部署脚本(Docker Compose / Helm Chart)
- 运维手册 + 管理员培训
- 一年运维支持(季度升级 + Bug 修复)
- 若干定制技能(按项目)
硬件清单(参考)
| 规模 | 组件 | 推荐配置 |
|---|---|---|
| 小型(< 50 人) | 全栈单机 | 16C / 64G / 2T SSD |
| 中型(50–500 人) | 应用 × 3、数据 × 2 | 16C / 64G / 1T SSD 每台 |
| 大型(> 500 人) | 应用 × 5+、数据 × 3+、Worker × 5+ | 按流量评估 |
LLM 推理节点(自部署开源模型):按模型规模 1–8 张 A100 / H800 / 国产算力卡。
授权模式
开源非商业授权:
- ✅ 企业内部使用
- ✅ 内部分发(子公司 / 各部门)
- ✅ 二次开发
- ❌ 对外转售
- ❌ 以 SaaS 形式对外提供
详细授权条款在合同中约定。
混合方案
适用
- 跨国企业(数据主权各地不同)
- 部分数据敏感 + 部分可云
- 希望低部分维护成本但保留核心数据主权
组合示例
| 组件 | 位置 |
|---|---|
| Agent 运行时 + API 后端 | 客户内网 |
| 业务数据(KB / 会话) | 客户内网 |
| LLM | 客户自部署 或 合规云端通道 |
| 对象存储 | 客户内网 MinIO |
| 监控日志 | 平台云(脱敏后) |
信创方案
适用
- 军工 / 政府 / 涉密 / 关键信息基础设施
- 要求全链路国产化
- 合规要求:等保三级 / 密评 / 信创认证
技术栈国产化
| 层 | 选型 |
|---|---|
| CPU | 飞腾 / 龙芯 / 鲲鹏 / 兆芯 |
| 操作系统 | 统信 UOS / 麒麟 / openEuler |
| 数据库 | 达梦 / 人大金仓 / OceanBase |
| 中间件 | 华为 GaussDB / 国产 Redis 替代 |
| LLM | DeepSeek / Qwen / 智谱 GLM / 文心 / 星火 |
| 算力 | 昇腾 / 寒武纪 / 壁仞 |
合规能力
- 等保三级建设方案支持
- 密评配合(配合客户密评机构)
- 信创目录产品兼容性认证
选型决策树
Rendering diagram…