腾讯混元Hy3 preview发布:295B参数快慢思考融合,三个月训练上线
📖 名词释义
AI Box(又称 AI盒子 / 智能体计算机 / Agent Computer),是一种专门运行 AI Agent 的本地硬件设备,预装智能体应用管理系统,开箱即用,7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。
摘要: 腾讯混元团队发布Hy3 preview模型,295B参数采用MoE架构,最大亮点是快慢思考融合——同一个模型既能秒回简单问题,也能深度推理复杂任务。从立项到上线仅三个月,训练效率显著提升。国产大模型又多了一个重量级选手。
6月16日,腾讯混元团队发布Hy3 preview模型。295B参数,MoE架构,激活参数约32B。这不是简单的参数堆叠——Hy3的核心创新是快慢思考融合,一个模型兼顾速度和深度。
快慢思考融合是什么意思
大多数大模型要么快要么深,难以两全。快模型(如GPT-5.6 Air)响应迅速但推理浅,深模型(如Claude Opus 4.8、GPT-5.6 Sol)推理强但响应慢、成本高。
Hy3的思路是:同一个模型内部设置两套推理模式。
快思考模式:遇到简单问题(日常对话、信息查询、翻译),模型走轻量推理路径,毫秒级响应。体验上像和一个快速助手聊天。
慢思考模式:遇到复杂问题(数学推导、代码生成、多步逻辑),模型自动切换到深度推理路径,花更多时间"想一想"再回答。质量上接近专用推理模型。
用户不需要手动选择模式,模型根据问题难度自动判断走哪条路径。这在实际使用中省心很多——你不用纠结"这个问题要不要开推理模式"。

关键参数
据腾讯混元团队发布的技术报告:
| 维度 | 参数 |
|---|---|
| 总参数量 | 295B |
| 架构 | MoE(混合专家) |
| 激活参数 | 约32B |
| 上下文长度 | 256K tokens |
| 训练周期 | 约3个月 |
| 训练数据 | 20万亿tokens |
295B总参数在国产模型中属于第一梯队。MoE架构的优势是推理时只激活部分专家网络,实际计算量远小于稠密模型。32B激活参数意味着推理成本和同级别稠密模型32B相当,但能力远超。
256K上下文比GPT-5.6的128K长一倍,适合处理超长文档。20万亿tokens的训练数据量也属于行业前列。
评测表现
据腾讯公布的数据,Hy3在多个基准测试中表现如下:
数学推理:GSM8K得分92.1%,MATH得分68.3%。接近GPT-5.5的水平,超过同参数级别的开源模型。
代码生成:HumanEval得分87.4%,MBPP得分81.2%。在国产模型中处于领先位置。
中文理解:C-Eval得分83.7%,CMMLU得分82.9%。中文能力是其优势领域,符合腾讯的产品定位。
快慢思考切换效果:在简单问答任务上,快思考模式响应速度比慢思考模式快4倍,准确率差异在2%以内。在复杂推理任务上,慢思考模式比快思考模式准确率高出15-20%。

三个月训练上线意味着什么
从立项到上线三个月,这个速度在千亿参数级模型中相当快。作为对比,GPT-5.5的训练周期据公开信息约6-8个月。
腾讯方面表示,训练效率的提升来自三个方面:更高效的数据配比策略、MoE架构的并行训练优化、以及自研训练框架的调度效率提升。
训练周期短的好处是迭代快。大模型领域每两个月格局就可能变化,训练周期越短越能快速跟上。Hy3是preview版本,正式版预计在后续迭代中进一步提升。
对行业格局的影响
国产大模型的竞争格局正在形成三足鼎立:智谱的GLM系列走开源路线,DeepSeek走性价比路线,腾讯混元走产品集成路线。Hy3的发布让腾讯在基础模型能力上有了和前两者正面竞争的资本。
对开发者来说,多一个强有力的选择是好事。Hy3的快慢思考融合减少了模型选择的纠结——不用在速度型和推理型之间二选一,一个模型自适应。
对铠盒AIBOX用户而言,混元Hy3的加入意味着可调用的云端大模型又多了一个。铠盒AIBOX采用本地多Agent+云端大模型架构,Agent根据任务类型自动选择模型:日常对话走快思考型模型,深度推理走慢思考型模型。Hy3的自适应快慢切换恰好简化了这层路由——Agent可以直接用Hy3一个模型应对全场景,由模型自己决定走快还是走慢。
数据来源
本文数据来自腾讯混元团队官方技术报告、CSDN技术社区评测报道及公开评测榜单数据。
-#铠盒AI #AI Agent #开源 #大模型
铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI智能体