腾讯,深夜放大招!腾讯发布自研混元T1正式版

admin2天前商业3

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

腾讯,深夜放大招!腾讯发布自研混元T1正式版

  【导读】腾讯混元T1正式版发布:创新混合Mamba架构,能秒回、吐字快、擅长超长文推理

  中国基金报 记者 张燕北

  腾讯最近在大模型领域动作频频。

  继2月底推出新一代快思考模型混元Turbo S后,3月21日深夜,腾讯宣布推出自研深度思考模型混元T1正式版,并同步在腾讯云官网上线。

  腾讯发布自研混元T1正式版

  腾讯混元T1正式版如期发布。

  之所以称之为“如期发布”,是因为前不久腾讯混元自研的快思考模型混元Turbo S正式发布时,腾讯就曾表示,正式版的腾讯混元T1模型API也将很快上线,对外提供接入服务。

  据知情人士介绍,腾讯混元T1正式版以混元Turbo S为基座打造,亮点在于其是能够秒回、吐字快、擅长超长文处理的强推理模型,性能保持业界领先。

  “混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。”上述知情人士说,这一架构显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度达到最快80 tokens/s。

  混元T1在超长文本推理领域也展现出独特优势,能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,提升了解码速度。

  通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的混元T1-preview模型相比,综合效果明显提升。

  腾讯方面提供的数据显示,在体现推理模型基础能力的常见Benchmark上,以及在中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。此外,T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

  值得一提的是,目前,混元T1已在腾讯云官网上线。定价方面,输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。

  腾讯混元大模型持续快速迭代

  今年以来,腾讯混元大模型持续快速迭代,AI似乎已成为腾讯内部最大的驱动力。

  其推出了深度思考模型T1 Preview和快思考模型Turbo S,并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。腾讯混元积极拥抱开源,其开源模型全面覆盖文本、图像、视频和3D生成等多个模态。

  业内认为,这一战略选择的背后,一方面基于腾讯长期以来坚持技术普惠的理念,另一方面也得益于腾讯在用户与产业多端的场景与生态优势,为AI技术的落地提供了广阔空间。

  在日前公布的2024年财报中,腾讯年研发投入707亿元创下纪录。对于业务侧,AI技术对微信新芽业务的提振效应,推动了腾讯营销服务板块的快速增长。其2024年第四季度在AI领域的资本开支超390亿元,2025年将持续加码,AI战略已进入重投入期。

  腾讯董事会主席兼首席执行官马化腾表示,“受益于AI赋能的广告平台升级、视频号用户参与度提升以及长青游戏的增长,我们2024年第4季取得双位数的收入增长,并持续提升运营效率。数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发,增加了AI相关的资本开支,并加大了我们对原生AI产品的研发和营销力度。”他表示。

  巨头竞逐AI

  我国AIGC应用或已进入加速期

  随着2025年我国进入科技突破大年,各大互联网巨头持续加大AI领域的投入。

  近期,字节跳动豆包大模型团队官宣开源一项针对MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。

  据悉,该技术叫COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。

  阿里巴巴近日宣布推出AI旗舰应用——新夸克,将“深度思考”能力融入AI搜索。据介绍,用户在“AI超级框”中输入指令后,夸克智能中枢可以自动识别意图,规划梳理后调动各种不同模型和智能体(Agent)模块,帮助用户完成任务。

  百度日前连发两款免费新模型,分别是文心大模型4.5和文心大模型X1。据百度相关负责人介绍,文心大模型4.5在多模态理解能力方面显著提升。文心大模型X1为深度思考模型,在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且大幅降低推理成本。

  值得关注的是,国产大模型开源步伐持续加速。阿里巴巴在基础模型和原生应用方面持续发力,近期相继发布了Qwen2.5-VL、Qwen2.5-Max、通义万相2.1、千问QWQ-32B等性能领先的开源模型。百度方面则表示,将在6月30日正式将文心大模型开源,并在今年下半年发布文心大模型5.0。

  业内分析认为,在技术创新与商业应用的双轮驱动下,AI有望在互联网等数字原生领域率先形成规模化落地。

  华富人工智能ETF基金经理郜哲表示,结合腾讯财报和近期互联网巨头竞逐AI的情况来看,我国AIGC应用或已进入加速期。随着AI在各行业深入渗透,有望诞生更多AI创新模式与高质量产品,进一步推动人工智能产业链向更加现实、业绩可落地的方向发展。

本站非盈利性质,内容来源于互联网。

相关文章

如何精确计算生产情资金?这种计算方法有哪些实际意义?

如何精确计算生产情资金?这种计算方法有哪些实际意义?

在企业的生产经营过程中,精确计算生产资金是至关重要的环节。它不仅关系到企业的资金合理配置,还直接影响到企业的生产效率和经济效益。要精确计算生产资金,首先需要对生产过程中的各项成本进行细致的分类和核算。...

:长城哈弗h6怎么样-马上评︱“套牌”参赛是对跑者精神的冒犯

2月24日,有网友在社交平台爆料,2025眉山仁寿半程马拉松赛事中,一位女网红疑似“套牌”参赛。在比赛中,有两个佩戴C4567号码布的跑者,其中一名被网友认出是女网红星星(化名),而另一名被套牌的女子...

“砍头息”再现!“3·15”晚会曝光电子签高利贷

“砍头息”再现!“3·15”晚会曝光电子签高利贷

专题:2025年金融315投诉曝光台   来源:金融时报   3月15日,中央广播电视总台举办“3·15”晚会,曝光了电子签高利贷乱象,“借贷宝”等平台被点名。   据央视财经报道,眼下,在一些平台热...

中昊芯英创始人杨龚轶凡:浙江很早就有很强的眼光布局AI

3月17日,中昊芯英创始人及CEO杨龚轶凡在接受界面新闻采访时表示,“2020年的时候,没有人相信大模型,更没有人相信用我们现在生产的芯片跑大模型这件事。当时的主流观点是AI马上要退潮,算法公司在裸...

:奔驰e200多少钱-10位外企高管话两会:扎根中国就是投资未来

:奔驰e200多少钱-10位外企高管话两会:扎根中国就是投资未来

中新网北京 3 月 12 日电 ( 宫宏宇 张尼 吴家驹 ) 全国两会是世界观察中国的窗口,也是外界倾听中国声音的机会。扩内需、稳外资、促创新、激活力的积极信号对外释放。" 扎根中国就是投资未来 ",...

13:16,A股发生了什么?

13:16,A股发生了什么?

3月19日,市场全天震荡调整,三大指数小幅下跌,北证50指数跌近3%。截至收盘,沪指跌0.1%,深成指跌0.32%,创业板指跌0.28%。板块方面,电力、银行、脑机接口、黄金概念等板块涨幅居前,CPO...