多模型支持
没有任何一个模型在所有事情上都是最好的。
Claude 的结构化推理无可匹敌。DeepSeek 在代码任务上有最佳的性价比。GPT-4o 在图像理解上最快。o1 系列在深度推理上领先。与其押注单一模型,不如让每个任务都使用最合适的那个。
Helix 支持所有主流 AI 模型,并允许你在对话中途自由切换。
模型选择指南
| 模型 | 适用场景 | 速度 | 成本 |
|---|---|---|---|
| Claude Sonnet 4 | 日常编码、综合表现均衡 | ⚡⚡⚡ | $$ |
| Claude Opus 4 | 复杂推理、架构设计 | ⚡⚡ | $$$ |
| DeepSeek Coder | 代码理解与补全,性价比高 | ⚡⚡ | $ |
| GPT-4o | 视觉任务、图像分析 | ⚡⚡⚡⚡ | $$ |
| GPT-4o-mini | 快速任务、对成本敏感 | ⚡⚡⚡⚡ | $ |
| Gemini 2.5 Pro | 长上下文、深度分析 | ⚡⚡ | $$ |
| o1 / o1-mini | 深度推理、数学、算法 | ⚡ | $$$$ |
按任务选模型的策略
不必所有任务都用同一个模型。根据任务灵活选择:
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 快速问答、小幅编辑 | GPT-4o-mini | 响应快、成本低 |
| 日常编码、特性开发 | Claude Sonnet / DeepSeek | 代码质量与成本最均衡 |
| 架构评审、设计决策 | Claude Opus / o1 | 需要深度推理与全局视角 |
| UI / 图像分析 | GPT-4o | 多模态能力最强 |
| 大文件分析 | Gemini 2.5 Pro | 超长上下文窗口 |
在对话中途切换模型
这是 Helix 的杀手级特性之一。你不需要开新对话来换模型:
你:[使用 DeepSeek] "实现这个用户认证模块"
→ DeepSeek 快速生成代码
你:[切换到 Claude] "评审一下你刚才生成的代码,重点关注安全性"
→ Claude 进行深度评审,识别潜在问题
你:[切换到 GPT-4o] "看下这张 UI 截图,告诉我布局有什么问题"
→ GPT-4o 分析图像,给出具体建议
切换时,对话历史完整保留——新模型可以看到之前所有的上下文。
后端如何实现
Helix 的后端模型适配层统一了四种 Provider 接口:
- Anthropic —— Claude 系列,支持 extended thinking
- DeepSeek —— 透传
reasoning_content - OpenAI —— 标准 Chat Completions API
- OpenAI Responses API —— GPT-5.x 的下一代接口
模型路由支持两种方式:
- 精确指定:
providerId:modelId(例如anthropic:claude-sonnet-4) - 前缀推断:只传模型名,系统根据名称前缀自动匹配 Provider
深度思考模式
对于复杂问题,你需要模型“先想清楚再说话”,而不是只输出一个浅层的快答。
Anthropic Extended Thinking
Claude 模型支持 Extended Thinking 模式,让模型在产出正式答案前进行深度推理:
- 默认思考预算:32K tokens——模型最多可使用 32K tokens 的“内部思考”来分析问题
- 思考过程可见 —— 你可以在 UI 中展开查看模型的推理步骤
- 最佳适用场景:架构决策、算法优化、bug 根因分析、安全漏洞研究、复杂重构规划
DeepSeek Reasoning
DeepSeek 的思考模式通过 reasoning_content 透传,展示模型的推理过程,且 token 消耗更少。是更具性价比的深度思考选项。
何时启用深度思考
| ✅ 值得启用 | ❌ 不必启用 |
|---|---|
| 架构决策——权衡多个方案 | 简单代码改动——重命名一个变量 |
| 算法优化——分析时间/空间复杂度 | 格式调整——修复缩进或样式 |
| Bug 根因分析——追踪复杂调用链 | 信息查询——“这个函数在哪个文件里?” |
| 安全评审——考虑各种攻击面 | 重复任务——批量修改相似代码 |
多模态支持
Helix 处理的不止是文本。具备多模态能力的模型(如 GPT-4o)可以理解图像输入:
- 📸 架构图分析 —— “解释一下这张系统图中的数据流”
- 📊 图表解读 —— “这张性能监控图说明了什么问题?”
- 🎨 UI 反馈 —— “这张设计稿可以怎样改进?”
- 📱 截图调试 —— “我的应用变成这样了——为什么?”
在 helix 中,直接把图像粘贴或拖入聊天即可发送。
Dual Agent 模式:双模型协作
当一个模型不够用时,就用两个。
Dual Agent 模式让两个不同的模型(通常是 Claude + DeepSeek)就同一个问题进行结构化的四阶段协作:
- 独立思考(Thinking) —— Claude 与 DeepSeek 各自独立思考同一个问题
- 交叉评审(Discussion) —— 每个模型看到对方的答案后指出优缺点,多轮进行
- 综合(Synthesis) —— Claude 综合两方优点形成最终方案
- 执行(Execution) —— 按最终方案执行(可选)
为什么比单模型更好?
每个模型都有盲点。Claude 可能过度关注安全而忽略性能;DeepSeek 可能给出快速方案但忽视边界情况。交叉评审让盲点被对方发现,最终方案更全面。
UI 体验
helix 通过清晰的阶段分隔展示整个过程:
- 每个阶段以
--- 阶段名 ---分隔符标记 - 不同模型的回复带角色标签
- 最终的综合方案标注为
🎯 Final Solution - 你可以观察两个模型如何相互启发、最终得出更好的答案
自定义配置
自定义 Provider
Helix 支持接入任意兼容 OpenAI 协议的模型端点。在设置中添加 Provider:
- 设置 Base URL 指向你的端点
- 选择接口类型:OpenAI 兼容 / OpenAI Responses API / Anthropic
- 填入 API Key
- 添加具体的模型,配置上下文窗口大小、最大输出 token、temperature 等
在 Agent Profile 中配置模型
通过 YAML 格式的 Agent Profile,你可以为不同任务预设模型与参数:
profiles:
code-reviewer:
model: claude-opus-4
system_prompt: |
You are a meticulous code reviewer focused on security,
performance, and maintainability. Always explain the
reasoning behind your suggestions.
thinking_enabled: true
quick-helper:
model: gpt-4o-mini
system_prompt: |
Answer questions quickly and concisely.
Prefer giving directly usable code.
temperature: 0.3
Temperature 控制
根据任务性质调整创造力与确定性的平衡:
| Temperature 区间 | 使用场景 |
|---|---|
| 0.0 – 0.3 | 高确定性:测试生成、bug 修复、精确代码 |
| 0.4 – 0.7 | 平衡:日常编码、重构 |
| 0.8 – 1.0 | 高创造力:头脑风暴、文档撰写、命名建议 |
相关文档
- Workspace 架构 —— 为不同 Workspace 选择不同模型
- 上下文管理 —— 所有模型共享上下文管理机制
- 功能总览 —— 返回核心能力总览