白虎女腾讯混元深度想考模子T1郑再版来了，吐字快、能秒回，解码速率提高2倍

发布日期：2025-03-23 07:01 点击次数：127

腾讯混元 3 月 21 日周五书记白虎女，崇敬推出自研深度想考模子混元 T1 郑再版，已在腾讯云官网上线，输入价钱为每百万 token 1 元，输出价钱为每百万 token 4 元。

腾讯混元轮廓，混元 T1 郑再版的特色为"吐字快、能秒回"、"擅长超长文处理"，称它是腾讯自研的强推理模子。

速率方面，混元 T1 郑再版在可比参数目下的解码性能高于行业 2 倍，首字秒出，吐字速率每秒 60 至 80token，具备优秀的长文处明智力。多项筹画达到业界逾越推理模子的水平，成果方面，混元 T1 郑再版逻辑强、文风精真金不怕火、复杂辅导奴隶准确，纲目幻觉低。

通过大界限强化学习，真人性交图片并纠合数学、逻辑推理、科学和代码等理科贫瘠的专项优化，混元 T1 郑再版进一步提高了推明智力。

在体现推理模子基础智力的常见评算筹画中，如诳言语模子（LLM）评估增强数据集 MMLU-PRO 中，混元 T1 获得 87.2 分，仅次于得分 89.3 的 OpenAI o1，高于得分 86.1 的 OpenAI GPT 4.5 和得分 84 的 DeepSeek R1。

在 CEval、AIME、Zebra Logic 等中英文常识及竞赛级数学、逻辑推理的公开基准测试中，混元 T1 的获利也达到业界逾越推理模子的水平白虎女，其中，逻辑推理得分 93.1，高于前述三个模子 o1、GPT 4.5 和 R1。

混元 T1 郑再版的浩大推明智力源于，腾讯沿用混元 Turbo S 的架构，接收 Hybrid-Mamba-Transformer 会通形式。这是工业界初度将夹杂 Mamba 架构无损阁下于超大型推理模子。

上述架构灵验镌汰了传统 Transformer 结构的盘算复杂度，减少了 KV-Cache 的内存占用，从而显贵镌汰了磨砺和推理资本。

混元 T1 在超长文本推理界限也展现出特有上风。

基于出色的长文捕捉智力，混元 T1 能灵验处理长文推理中常见的凹凸文丢成仇长距离信息依赖问题。同期，夹杂 Mamba 架构针对长序列处理进行了专项优化，通过高效的盘算神情，在确保长文本信息捕捉智力的同期大幅镌汰资源浮滥，在左近的激活参数目下，扫尾了解码速率提高2倍。

在上线全新推理模子之前，本周一，腾讯混元模子初度登上了国外泰斗大模子竞技场 Chatbot Arena 的榜单，置身民众 Top 15。一同上榜的还有阿里巴巴本月 6 日发布的通义千问最新开源模子 QwQ-32B。

不同于其他测评，Chatbot Arena 的测评东说念主是 C 端用户——用户在平台上以匿名神情与多个模子互动，然后投票决定哪个模子更好，从而左证分数生成排名榜。这种测评也被四肢是大模子成功 PK 的竞技场，通俗成功。

腾讯混元模子在华文基础智力测试中也推崇隆起。本周二发布的《华文大模子测评基准 SuperCLUE 3 月发挥》中，腾讯混元位列基础模子国内第二，综合实力稳居国内大模子第一梯队。

白虎女

相关资讯

热点资讯

白虎 女 腾讯混元深度想考模子T1郑再版来了，吐字快、能秒回，解码速率提高2倍