腾讯，深夜放大招！腾讯发布自研混元T1正式版

admin2天前商业3

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　【导读】腾讯混元T1正式版发布：创新混合Mamba架构，能秒回、吐字快、擅长超长文推理

　　中国基金报记者张燕北

　　腾讯最近在大模型领域动作频频。

　　继2月底推出新一代快思考模型混元Turbo S后，3月21日深夜，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。

　　腾讯发布自研混元T1正式版

　　腾讯混元T1正式版如期发布。

　　之所以称之为“如期发布”，是因为前不久腾讯混元自研的快思考模型混元Turbo S正式发布时，腾讯就曾表示，正式版的腾讯混元T1模型API也将很快上线，对外提供接入服务。

　　据知情人士介绍，腾讯混元T1正式版以混元Turbo S为基座打造，亮点在于其是能够秒回、吐字快、擅长超长文处理的强推理模型，性能保持业界领先。

　　“混元T1正式版沿用了混元Turbo S的创新架构，采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。”上述知情人士说，这一架构显著降低了训练和推理成本，让混元T1实现首字秒出，吐字速度达到最快80 tokens/s。

　　混元T1在超长文本推理领域也展现出独特优势，能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合Mamba架构针对长序列处理进行了专项优化，提升了解码速度。

　　通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的混元T1-preview模型相比，综合效果明显提升。

　　腾讯方面提供的数据显示，在体现推理模型基础能力的常见Benchmark上，以及在中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元T1的成绩也达到业界领先推理模型的水平。此外，T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

　　值得一提的是，目前，混元T1已在腾讯云官网上线。定价方面，输入价格为每百万tokens 1元，输出价格为每百万tokens 4元。

　　腾讯混元大模型持续快速迭代

　　今年以来，腾讯混元大模型持续快速迭代，AI似乎已成为腾讯内部最大的驱动力。

　　其推出了深度思考模型T1 Preview和快思考模型Turbo S，并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。腾讯混元积极拥抱开源，其开源模型全面覆盖文本、图像、视频和3D生成等多个模态。

　　业内认为，这一战略选择的背后，一方面基于腾讯长期以来坚持技术普惠的理念，另一方面也得益于腾讯在用户与产业多端的场景与生态优势，为AI技术的落地提供了广阔空间。

　　在日前公布的2024年财报中，腾讯年研发投入707亿元创下纪录。对于业务侧，AI技术对微信新芽业务的提振效应，推动了腾讯营销服务板块的快速增长。其2024年第四季度在AI领域的资本开支超390亿元，2025年将持续加码，AI战略已进入重投入期。

　　腾讯董事会主席兼首席执行官马化腾表示，“受益于AI赋能的广告平台升级、视频号用户参与度提升以及长青游戏的增长，我们2024年第4季取得双位数的收入增长，并持续提升运营效率。数月前，我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发，增加了AI相关的资本开支，并加大了我们对原生AI产品的研发和营销力度。”他表示。

　　巨头竞逐AI

　　我国AIGC应用或已进入加速期

　　随着2025年我国进入科技突破大年，各大互联网巨头持续加大AI领域的投入。

　　近期，字节跳动豆包大模型团队官宣开源一项针对MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。

　　据悉，该技术叫COMET，已实际应用于字节的万卡集群训练，累计帮助节省了数百万 GPU 小时训练算力。

　　阿里巴巴近日宣布推出AI旗舰应用——新夸克，将“深度思考”能力融入AI搜索。据介绍，用户在“AI超级框”中输入指令后，夸克智能中枢可以自动识别意图，规划梳理后调动各种不同模型和智能体（Agent）模块，帮助用户完成任务。

　　百度日前连发两款免费新模型，分别是文心大模型4.5和文心大模型X1。据百度相关负责人介绍，文心大模型4.5在多模态理解能力方面显著提升。文心大模型X1为深度思考模型，在性能上对标DeepSeek-R1，具备“长思维链”，擅长中文知识问答、文学创作、逻辑推理等，而且大幅降低推理成本。

　　值得关注的是，国产大模型开源步伐持续加速。阿里巴巴在基础模型和原生应用方面持续发力，近期相继发布了Qwen2.5-VL、Qwen2.5-Max、通义万相2.1、千问QWQ-32B等性能领先的开源模型。百度方面则表示，将在6月30日正式将文心大模型开源，并在今年下半年发布文心大模型5.0。

　　业内分析认为，在技术创新与商业应用的双轮驱动下，AI有望在互联网等数字原生领域率先形成规模化落地。

　　华富人工智能ETF基金经理郜哲表示，结合腾讯财报和近期互联网巨头竞逐AI的情况来看，我国AIGC应用或已进入加速期。随着AI在各行业深入渗透，有望诞生更多AI创新模式与高质量产品，进一步推动人工智能产业链向更加现实、业绩可落地的方向发展。

本站非盈利性质，内容来源于互联网。

返回列表