多模型支持

没有任何一个模型在所有事情上都是最好的。

Claude 的结构化推理无可匹敌。DeepSeek 在代码任务上有最佳的性价比。GPT-4o 在图像理解上最快。o1 系列在深度推理上领先。与其押注单一模型，不如让每个任务都使用最合适的那个。

Helix 支持所有主流 AI 模型，并允许你在对话中途自由切换。

模型选择指南

模型	适用场景	速度	成本
Claude Sonnet 4	日常编码、综合表现均衡	⚡⚡⚡	$$
Claude Opus 4	复杂推理、架构设计	⚡⚡	$$$
DeepSeek Coder	代码理解与补全，性价比高	⚡⚡	$
GPT-4o	视觉任务、图像分析	⚡⚡⚡⚡	$$
GPT-4o-mini	快速任务、对成本敏感	⚡⚡⚡⚡	$
Gemini 2.5 Pro	长上下文、深度分析	⚡⚡	$$
o1 / o1-mini	深度推理、数学、算法	⚡	$$$$

按任务选模型的策略

不必所有任务都用同一个模型。根据任务灵活选择：

任务类型	推荐模型	原因
快速问答、小幅编辑	GPT-4o-mini	响应快、成本低
日常编码、特性开发	Claude Sonnet / DeepSeek	代码质量与成本最均衡
架构评审、设计决策	Claude Opus / o1	需要深度推理与全局视角
UI / 图像分析	GPT-4o	多模态能力最强
大文件分析	Gemini 2.5 Pro	超长上下文窗口

在对话中途切换模型

这是 Helix 的杀手级特性之一。你不需要开新对话来换模型：

你：[使用 DeepSeek] "实现这个用户认证模块"
    → DeepSeek 快速生成代码

你：[切换到 Claude] "评审一下你刚才生成的代码，重点关注安全性"
    → Claude 进行深度评审，识别潜在问题

你：[切换到 GPT-4o] "看下这张 UI 截图，告诉我布局有什么问题"
    → GPT-4o 分析图像，给出具体建议

切换时，对话历史完整保留——新模型可以看到之前所有的上下文。

后端如何实现

Helix 的后端模型适配层统一了四种 Provider 接口：

Anthropic —— Claude 系列，支持 extended thinking
DeepSeek —— 透传 reasoning_content
OpenAI —— 标准 Chat Completions API
OpenAI Responses API —— GPT-5.x 的下一代接口

模型路由支持两种方式：

精确指定：providerId:modelId（例如 anthropic:claude-sonnet-4）
前缀推断：只传模型名，系统根据名称前缀自动匹配 Provider

深度思考模式

对于复杂问题，你需要模型“先想清楚再说话”，而不是只输出一个浅层的快答。

Anthropic Extended Thinking

Claude 模型支持 Extended Thinking 模式，让模型在产出正式答案前进行深度推理：

默认思考预算：32K tokens——模型最多可使用 32K tokens 的“内部思考”来分析问题
思考过程可见 —— 你可以在 UI 中展开查看模型的推理步骤
最佳适用场景：架构决策、算法优化、bug 根因分析、安全漏洞研究、复杂重构规划

DeepSeek Reasoning

DeepSeek 的思考模式通过 reasoning_content 透传，展示模型的推理过程，且 token 消耗更少。是更具性价比的深度思考选项。

何时启用深度思考

✅ 值得启用	❌ 不必启用
架构决策——权衡多个方案	简单代码改动——重命名一个变量
算法优化——分析时间/空间复杂度	格式调整——修复缩进或样式
Bug 根因分析——追踪复杂调用链	信息查询——“这个函数在哪个文件里？”
安全评审——考虑各种攻击面	重复任务——批量修改相似代码

多模态支持

Helix 处理的不止是文本。具备多模态能力的模型（如 GPT-4o）可以理解图像输入：

📸 架构图分析 —— “解释一下这张系统图中的数据流”
📊 图表解读 —— “这张性能监控图说明了什么问题？”
🎨 UI 反馈 —— “这张设计稿可以怎样改进？”
📱 截图调试 —— “我的应用变成这样了——为什么？”

在 helix 中，直接把图像粘贴或拖入聊天即可发送。

Dual Agent 模式：双模型协作

当一个模型不够用时，就用两个。

Dual Agent 模式让两个不同的模型（通常是 Claude + DeepSeek）就同一个问题进行结构化的四阶段协作：

独立思考（Thinking） —— Claude 与 DeepSeek 各自独立思考同一个问题
交叉评审（Discussion） —— 每个模型看到对方的答案后指出优缺点，多轮进行
综合（Synthesis） —— Claude 综合两方优点形成最终方案
执行（Execution） —— 按最终方案执行（可选）

为什么比单模型更好？

每个模型都有盲点。Claude 可能过度关注安全而忽略性能；DeepSeek 可能给出快速方案但忽视边界情况。交叉评审让盲点被对方发现，最终方案更全面。

UI 体验

helix 通过清晰的阶段分隔展示整个过程：

每个阶段以 --- 阶段名 --- 分隔符标记
不同模型的回复带角色标签
最终的综合方案标注为 🎯 Final Solution
你可以观察两个模型如何相互启发、最终得出更好的答案

自定义配置

自定义 Provider

Helix 支持接入任意兼容 OpenAI 协议的模型端点。在设置中添加 Provider：

设置 Base URL 指向你的端点
选择接口类型：OpenAI 兼容 / OpenAI Responses API / Anthropic
填入 API Key
添加具体的模型，配置上下文窗口大小、最大输出 token、temperature 等

在 Agent Profile 中配置模型

通过 YAML 格式的 Agent Profile，你可以为不同任务预设模型与参数：

profiles:
  code-reviewer:
    model: claude-opus-4
    system_prompt: |
      You are a meticulous code reviewer focused on security,
      performance, and maintainability. Always explain the
      reasoning behind your suggestions.
    thinking_enabled: true
  
  quick-helper:
    model: gpt-4o-mini
    system_prompt: |
      Answer questions quickly and concisely.
      Prefer giving directly usable code.
    temperature: 0.3

Temperature 控制

根据任务性质调整创造力与确定性的平衡：

Temperature 区间	使用场景
0.0 – 0.3	高确定性：测试生成、bug 修复、精确代码
0.4 – 0.7	平衡：日常编码、重构
0.8 – 1.0	高创造力：头脑风暴、文档撰写、命名建议

模型选择指南​

按任务选模型的策略​

在对话中途切换模型​

后端如何实现​

深度思考模式​

Anthropic Extended Thinking​

DeepSeek Reasoning​

何时启用深度思考​

多模态支持​

Dual Agent 模式：双模型协作​

为什么比单模型更好？​

UI 体验​

自定义配置​

自定义 Provider​

在 Agent Profile 中配置模型​

Temperature 控制​

相关文档​