跳到主要内容

多模型支持

没有任何一个模型在所有事情上都是最好的。

Claude 的结构化推理无可匹敌。DeepSeek 在代码任务上有最佳的性价比。GPT-4o 在图像理解上最快。o1 系列在深度推理上领先。与其押注单一模型,不如让每个任务都使用最合适的那个

Helix 支持所有主流 AI 模型,并允许你在对话中途自由切换


模型选择指南

模型适用场景速度成本
Claude Sonnet 4日常编码、综合表现均衡⚡⚡⚡$$
Claude Opus 4复杂推理、架构设计⚡⚡$$$
DeepSeek Coder代码理解与补全,性价比高⚡⚡$
GPT-4o视觉任务、图像分析⚡⚡⚡⚡$$
GPT-4o-mini快速任务、对成本敏感⚡⚡⚡⚡$
Gemini 2.5 Pro长上下文、深度分析⚡⚡$$
o1 / o1-mini深度推理、数学、算法$$$$

按任务选模型的策略

不必所有任务都用同一个模型。根据任务灵活选择:

任务类型推荐模型原因
快速问答、小幅编辑GPT-4o-mini响应快、成本低
日常编码、特性开发Claude Sonnet / DeepSeek代码质量与成本最均衡
架构评审、设计决策Claude Opus / o1需要深度推理与全局视角
UI / 图像分析GPT-4o多模态能力最强
大文件分析Gemini 2.5 Pro超长上下文窗口

在对话中途切换模型

这是 Helix 的杀手级特性之一。你不需要开新对话来换模型:

你:[使用 DeepSeek] "实现这个用户认证模块"
→ DeepSeek 快速生成代码

你:[切换到 Claude] "评审一下你刚才生成的代码,重点关注安全性"
→ Claude 进行深度评审,识别潜在问题

你:[切换到 GPT-4o] "看下这张 UI 截图,告诉我布局有什么问题"
→ GPT-4o 分析图像,给出具体建议

切换时,对话历史完整保留——新模型可以看到之前所有的上下文。

后端如何实现

Helix 的后端模型适配层统一了四种 Provider 接口:

  • Anthropic —— Claude 系列,支持 extended thinking
  • DeepSeek —— 透传 reasoning_content
  • OpenAI —— 标准 Chat Completions API
  • OpenAI Responses API —— GPT-5.x 的下一代接口

模型路由支持两种方式:

  • 精确指定providerId:modelId(例如 anthropic:claude-sonnet-4
  • 前缀推断:只传模型名,系统根据名称前缀自动匹配 Provider

深度思考模式

对于复杂问题,你需要模型“先想清楚再说话”,而不是只输出一个浅层的快答。

Anthropic Extended Thinking

Claude 模型支持 Extended Thinking 模式,让模型在产出正式答案前进行深度推理:

  • 默认思考预算:32K tokens——模型最多可使用 32K tokens 的“内部思考”来分析问题
  • 思考过程可见 —— 你可以在 UI 中展开查看模型的推理步骤
  • 最佳适用场景:架构决策、算法优化、bug 根因分析、安全漏洞研究、复杂重构规划

DeepSeek Reasoning

DeepSeek 的思考模式通过 reasoning_content 透传,展示模型的推理过程,且 token 消耗更少。是更具性价比的深度思考选项。

何时启用深度思考

✅ 值得启用❌ 不必启用
架构决策——权衡多个方案简单代码改动——重命名一个变量
算法优化——分析时间/空间复杂度格式调整——修复缩进或样式
Bug 根因分析——追踪复杂调用链信息查询——“这个函数在哪个文件里?”
安全评审——考虑各种攻击面重复任务——批量修改相似代码

多模态支持

Helix 处理的不止是文本。具备多模态能力的模型(如 GPT-4o)可以理解图像输入:

  • 📸 架构图分析 —— “解释一下这张系统图中的数据流”
  • 📊 图表解读 —— “这张性能监控图说明了什么问题?”
  • 🎨 UI 反馈 —— “这张设计稿可以怎样改进?”
  • 📱 截图调试 —— “我的应用变成这样了——为什么?”

在 helix 中,直接把图像粘贴或拖入聊天即可发送。


Dual Agent 模式:双模型协作

当一个模型不够用时,就用两个。

Dual Agent 模式让两个不同的模型(通常是 Claude + DeepSeek)就同一个问题进行结构化的四阶段协作:

  1. 独立思考(Thinking) —— Claude 与 DeepSeek 各自独立思考同一个问题
  2. 交叉评审(Discussion) —— 每个模型看到对方的答案后指出优缺点,多轮进行
  3. 综合(Synthesis) —— Claude 综合两方优点形成最终方案
  4. 执行(Execution) —— 按最终方案执行(可选)

为什么比单模型更好?

每个模型都有盲点。Claude 可能过度关注安全而忽略性能;DeepSeek 可能给出快速方案但忽视边界情况。交叉评审让盲点被对方发现,最终方案更全面。

UI 体验

helix 通过清晰的阶段分隔展示整个过程:

  • 每个阶段以 --- 阶段名 --- 分隔符标记
  • 不同模型的回复带角色标签
  • 最终的综合方案标注为 🎯 Final Solution
  • 你可以观察两个模型如何相互启发、最终得出更好的答案

自定义配置

自定义 Provider

Helix 支持接入任意兼容 OpenAI 协议的模型端点。在设置中添加 Provider:

  • 设置 Base URL 指向你的端点
  • 选择接口类型:OpenAI 兼容 / OpenAI Responses API / Anthropic
  • 填入 API Key
  • 添加具体的模型,配置上下文窗口大小、最大输出 token、temperature 等

在 Agent Profile 中配置模型

通过 YAML 格式的 Agent Profile,你可以为不同任务预设模型与参数:

profiles:
code-reviewer:
model: claude-opus-4
system_prompt: |
You are a meticulous code reviewer focused on security,
performance, and maintainability. Always explain the
reasoning behind your suggestions.
thinking_enabled: true

quick-helper:
model: gpt-4o-mini
system_prompt: |
Answer questions quickly and concisely.
Prefer giving directly usable code.
temperature: 0.3

Temperature 控制

根据任务性质调整创造力与确定性的平衡:

Temperature 区间使用场景
0.0 – 0.3高确定性:测试生成、bug 修复、精确代码
0.4 – 0.7平衡:日常编码、重构
0.8 – 1.0高创造力:头脑风暴、文档撰写、命名建议

相关文档