:东风日产原厂配件官网-计算成本低于DeepSeek?蚂蚁集团回应自研大模型用国产AI芯片训练

admin1周前旅游10

3月24日,针对媒体对蚂蚁百灵大模型训练成本的报道,蚂蚁集团方面回应界面新闻称,蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

此前有报道称,蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术,这将使成本降低20%。知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用混合专家(MoE)机器学习方式来训练模型。他们表示,蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。

其中一位知情人士称,蚂蚁集团仍在使用英伟达的产品进行人工智能开发,但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。

另据钛媒体报道,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。

该技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已在预印版Arxiv平台上发表。

除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已通过备案,重点布局在生活服务、金融服务、医疗健康等场景的应用。

 

本站非盈利性质,内容来源于互联网。

相关文章

腾讯控股因购股权获行使而发行132.22万股

腾讯控股因购股权获行使而发行132.22万股

  腾讯控股(00700)发布公告,该公司于2025年3月20日根据于2023年5月17日采纳的2023年购股权计划行使购股权而发行132.22万股。   于同日,根据于2023年5月17日采纳的股...

金龙机电股价波动的原因是什么?这种股价波动对该公司的市场形象有何影响?

金龙机电股价波动的原因是什么?这种股价波动对该公司的市场形象有何影响?

金龙机电股价波动的背后因素及对公司市场形象的影响股价波动是金融市场中常见的现象,对于金龙机电而言,其股价波动的原因是多方面的。首先,宏观经济环境的变化对金龙机电的股价产生着重要影响。经济的增长或衰退、...

招商基金蛇口租赁住房 REIT:27 日跌 0.42% 规模 13.69 亿

招商基金蛇口租赁住房 REIT:27 日跌 0.42% 规模 13.69 亿

快讯摘要 2 月 27 日招商基金蛇口租赁住房 REIT 低开高走,收报 3.588 元跌 0.42%,基金规模...

:大众4s店价格表-长二丁火箭发射四维高景三号02星,首次采用射程抛罩技术

点火升空  本问题均为 中国航天科技集团 供图2025年3月15日12时11分,长征二号丁运载火箭在酒泉卫星发射中心点火升空,成功将四维高景三号02星、天雁23星准确送入预定轨道,发射任务取...

期权一般在何时发挥作用?这种作用会受到哪些因素影响?

期权一般在何时发挥作用?这种作用会受到哪些因素影响?

期权在金融市场中具有多种作用场景,其发挥作用的时机以及效果受到多种因素的综合影响。首先,期权在市场不确定性较高时能发挥重要作用。当投资者对标的资产的未来价格走势存在较大疑虑,但又不想错过潜在的收益机会...

现货黄金本周跌超2.7% 2月累涨超2.1%

现货黄金本周跌超2.7% 2月累涨超2.1%

  周五(2月28日)纽约尾盘,现货黄金下跌0.68%,报2857.83美元/盎司,本周累跌2.76%,2月份累计上涨2.13%,2月24日美股盘前涨至2956.19美元创历史新高,随后回吐月内稍早部...