腾讯混元Hy3 preview发布：295B参数快慢思考融合，三个月训练上线

📖 名词释义

AI Box（又称 AI盒子 / 智能体计算机 / Agent Computer），是一种专门运行 AI Agent 的本地硬件设备，预装智能体应用管理系统，开箱即用，7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。

摘要： 腾讯混元团队发布Hy3 preview模型，295B参数采用MoE架构，最大亮点是快慢思考融合——同一个模型既能秒回简单问题，也能深度推理复杂任务。从立项到上线仅三个月，训练效率显著提升。国产大模型又多了一个重量级选手。

6月16日，腾讯混元团队发布Hy3 preview模型。295B参数，MoE架构，激活参数约32B。这不是简单的参数堆叠——Hy3的核心创新是快慢思考融合，一个模型兼顾速度和深度。

快慢思考融合是什么意思

大多数大模型要么快要么深，难以两全。快模型（如GPT-5.6 Air）响应迅速但推理浅，深模型（如Claude Opus 4.8、GPT-5.6 Sol）推理强但响应慢、成本高。

Hy3的思路是：同一个模型内部设置两套推理模式。

快思考模式：遇到简单问题（日常对话、信息查询、翻译），模型走轻量推理路径，毫秒级响应。体验上像和一个快速助手聊天。

慢思考模式：遇到复杂问题（数学推导、代码生成、多步逻辑），模型自动切换到深度推理路径，花更多时间"想一想"再回答。质量上接近专用推理模型。

用户不需要手动选择模式，模型根据问题难度自动判断走哪条路径。这在实际使用中省心很多——你不用纠结"这个问题要不要开推理模式"。

关键参数

据腾讯混元团队发布的技术报告：

维度	参数
总参数量	295B
架构	MoE（混合专家）
激活参数	约32B
上下文长度	256K tokens
训练周期	约3个月
训练数据	20万亿tokens

295B总参数在国产模型中属于第一梯队。MoE架构的优势是推理时只激活部分专家网络，实际计算量远小于稠密模型。32B激活参数意味着推理成本和同级别稠密模型32B相当，但能力远超。

256K上下文比GPT-5.6的128K长一倍，适合处理超长文档。20万亿tokens的训练数据量也属于行业前列。

评测表现

据腾讯公布的数据，Hy3在多个基准测试中表现如下：

数学推理：GSM8K得分92.1%，MATH得分68.3%。接近GPT-5.5的水平，超过同参数级别的开源模型。

代码生成：HumanEval得分87.4%，MBPP得分81.2%。在国产模型中处于领先位置。

中文理解：C-Eval得分83.7%，CMMLU得分82.9%。中文能力是其优势领域，符合腾讯的产品定位。

快慢思考切换效果：在简单问答任务上，快思考模式响应速度比慢思考模式快4倍，准确率差异在2%以内。在复杂推理任务上，慢思考模式比快思考模式准确率高出15-20%。

三个月训练上线意味着什么

从立项到上线三个月，这个速度在千亿参数级模型中相当快。作为对比，GPT-5.5的训练周期据公开信息约6-8个月。

腾讯方面表示，训练效率的提升来自三个方面：更高效的数据配比策略、MoE架构的并行训练优化、以及自研训练框架的调度效率提升。

训练周期短的好处是迭代快。大模型领域每两个月格局就可能变化，训练周期越短越能快速跟上。Hy3是preview版本，正式版预计在后续迭代中进一步提升。

对行业格局的影响

国产大模型的竞争格局正在形成三足鼎立：智谱的GLM系列走开源路线，DeepSeek走性价比路线，腾讯混元走产品集成路线。Hy3的发布让腾讯在基础模型能力上有了和前两者正面竞争的资本。

对开发者来说，多一个强有力的选择是好事。Hy3的快慢思考融合减少了模型选择的纠结——不用在速度型和推理型之间二选一，一个模型自适应。

对铠盒AIBOX用户而言，混元Hy3的加入意味着可调用的云端大模型又多了一个。铠盒AIBOX采用本地多Agent+云端大模型架构，Agent根据任务类型自动选择模型：日常对话走快思考型模型，深度推理走慢思考型模型。Hy3的自适应快慢切换恰好简化了这层路由——Agent可以直接用Hy3一个模型应对全场景，由模型自己决定走快还是走慢。

数据来源

本文数据来自腾讯混元团队官方技术报告、CSDN技术社区评测报道及公开评测榜单数据。

-#铠盒AI #AI Agent #开源 #大模型

铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI智能体

腾讯混元Hy3 preview发布：295B参数快慢思考融合，三个月训练上线