腾讯混元 3 月 21 日周五书记白虎 女,崇敬推出自研深度想考模子混元 T1 郑再版,已在腾讯云官网上线,输入价钱为每百万 token 1 元,输出价钱为每百万 token 4 元。
腾讯混元轮廓,混元 T1 郑再版的特色为"吐字快、能秒回"、"擅长超长文处理",称它是腾讯自研的强推理模子。
速率方面,混元 T1 郑再版在可比参数目下的解码性能高于行业 2 倍,首字秒出,吐字速率每秒 60 至 80token,具备优秀的长文处明智力。多项筹画达到业界逾越推理模子的水平,成果方面,混元 T1 郑再版逻辑强、文风精真金不怕火、复杂辅导奴隶准确,纲目幻觉低。
通过大界限强化学习,真人性交图片并纠合数学、逻辑推理、科学和代码等理科贫瘠的专项优化,混元 T1 郑再版进一步提高了推明智力。
在体现推理模子基础智力的常见评算筹画中,如诳言语模子(LLM)评估增强数据集 MMLU-PRO 中,混元 T1 获得 87.2 分,仅次于得分 89.3 的 OpenAI o1,高于得分 86.1 的 OpenAI GPT 4.5 和得分 84 的 DeepSeek R1。
在 CEval、AIME、Zebra Logic 等中英文常识及竞赛级数学、逻辑推理的公开基准测试中,混元 T1 的获利也达到业界逾越推理模子的水平白虎 女,其中,逻辑推理得分 93.1,高于前述三个模子 o1、GPT 4.5 和 R1。
混元 T1 郑再版的浩大推明智力源于,腾讯沿用混元 Turbo S 的架构,接收 Hybrid-Mamba-Transformer 会通形式。这是工业界初度将夹杂 Mamba 架构无损阁下于超大型推理模子。
上述架构灵验镌汰了传统 Transformer 结构的盘算复杂度,减少了 KV-Cache 的内存占用,从而显贵镌汰了磨砺和推理资本。
混元 T1 在超长文本推理界限也展现出特有上风。
基于出色的长文捕捉智力,混元 T1 能灵验处理长文推理中常见的凹凸文丢成仇长距离信息依赖问题。同期,夹杂 Mamba 架构针对长序列处理进行了专项优化,通过高效的盘算神情,在确保长文本信息捕捉智力的同期大幅镌汰资源浮滥,在左近的激活参数目下,扫尾了解码速率提高2倍。
在上线全新推理模子之前,本周一,腾讯混元模子初度登上了国外泰斗大模子竞技场 Chatbot Arena 的榜单,置身民众 Top 15。一同上榜的还有阿里巴巴本月 6 日发布的通义千问最新开源模子 QwQ-32B。
李月 反差不同于其他测评,Chatbot Arena 的测评东说念主是 C 端用户——用户在平台上以匿名神情与多个模子互动,然后投票决定哪个模子更好,从而左证分数生成排名榜。这种测评也被四肢是大模子成功 PK 的竞技场,通俗成功。
腾讯混元模子在华文基础智力测试中也推崇隆起。本周二发布的《华文大模子测评基准 SuperCLUE 3 月发挥》中,腾讯混元位列基础模子国内第二,综合实力稳居国内大模子第一梯队。
白虎 女