ad1

您当前位置:首页 > 综合资讯

AI公司MosaicML推出300亿参数模型MPT-30B,号称训练成本

来源:IT之家
时间: 2023-06-26 09:04
阅读量:4250       

,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。

图源 MosaicML

MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。

据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。

除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。

MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。

IT之家注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

推荐阅读

 毕业季叠加暑期临近,今年的端午小长假延续五一火热出行盛况,造就史上最火端午。据T3出行大数据,6月22日至6月24日期间,用户整体打车出行呼叫量同比增长超82%

2023-06-26 09:04

 对中腰部以下的GP来说,今年的目标是“活下去”。 近期,记者接触到一家机构,他们去年一年竟然设了十几只基金。记者不禁疑惑:现在募资形势这么严峻,况且他们还不是

2023-06-26 09:04

 政策利率接连调降后,保险业利率风险再次受到市场关注。 6月20日,LPR下调10个基点。6月中旬,7天逆回购、常备借贷便利(SLF)、中期借贷便利(MLF)利

2023-06-26 09:04

 当前,券商资管业务结构正逐步优化,主动管理能力及服务实体经济质效不断提升。中基协最新数据显示,截至4月末,券商私募资管产品存量规模为5.93万亿元,环比增长1.

2023-06-26 09:04

 A股市场的反复无常让股民备受煎熬,市场行情十分复杂,难以捉摸。为帮助广大股民提高进入股市的能力,益盟推出了智盈,旨在解决股民在选股过程中的痛点。智盈提供了简单易

2023-06-26 09:04

 ,WineHQ当前正以2个星期为周期,推进Wine8.x版本更新,团队于今天正式推出了8.11更新。 Wine8.11作为维护版本,并未引入大量的新功能,主要

2023-06-26 09:04

 ,苹果24核心的M2Ultra处理器已现身PassMark,单线程成绩为3868分,CPUMark总得分为47589分。 本次测试的M2Ultra配备了24个

2023-06-26 09:04

 ,华擎现已上架新款DeskMax主机,内置华擎A620M主板,支持锐龙7000处理器,准系统售价1499元。 商品页面显示,DeskMax系列主机由华擎授权国

2023-06-26 09:04

金融之家
关注我们
foot01
foot02
ewm
foot03
foota footb footc footd foote footf