华侨网 财经 螞蟻集團用國產「芯」訓練AI 成本降20%
公益广告

螞蟻集團用國產「芯」訓練AI 成本降20%

  圖:螞蟻集團一直在致力於提高大語言模型的訓練效率,並突破這一限制。

  綜合中國基金報、鳳凰網報道:螞蟻集團使用國產芯片開發了一種訓練人工智能模型的技術,可將成本降低20%。近期,螞蟻集團Ling團隊發表了最新的技術成果論文《無需高級GPU即可擴展3000億參數混合專家LING大模型》。論文提到,儘管稠密模型(神經網絡中最為常見的模型之一,每個神經元都與輸入數據中的每個元素相連)取得了顯著進展,專家混合(MoE)模型如DeepSeek系列、Qwen系列和MiniMax-01系列等在某些特定任務中已展現出優於傳統稠密模型的性能。

  然而,MoE模型的訓練通常依賴於高性能計算資源(例如H100、H800等先進AI加速器)。為了給業界提供一種適用於資源受限場景的模型訓練新路徑,論文介紹了兩款開源MoE模型:Ling-Lite與Ling-Plus,在資源成本與模型性能之間取得良好平衡。例如Ling-Plus模型在五種不同硬件配置下完成9萬億token的預訓練任務。若使用高性能硬件設備訓練1萬億token,預計成本為635萬元人民幣;而使用低規格硬件系統則成本約為508萬元,節省近20%。

  分析指,MoE模型的訓練通常依賴於如英偉達所售GPU這類高性能芯片,使得訓練成本對許多中小企業而言過於高昂,限制了更廣泛的應用。如果螞蟻集團研究成果屬實,將表明中國在人工智能領域正逐步走向自主可控,特別是在尋求成本更低、計算效率更高的模型架構來應對英偉達芯片的出口限制。

免责声明:本文仅代表作者个人观点,与华侨网无关联。其原创性及文中陈诉内容未经本网证实,对本文内容、文字的完整、真实性,以及时效性本网部作任何承诺,请读者自行核实相关内容。如发现稿件侵权,或作者无意愿在华侨网发布文章,请版权拥有者通知华侨网处理。

联系我们

联系我们

514-3979969

邮箱: cpress@chinesepress.com

工作时间:周一至周五,10:00-16:00,节假日休息
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部