零一万物发布AI模型 阿里云魔搭社区开源首发

  11月7日消息,李开复带队创办的AI2.0公司零一万物近日正式发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

  官方介绍,零一万物此次开源的Yi系列模型包含34B和6B两个版本;零一万物创始人及CEO李开复表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

图注:Yi-34B发布在魔搭社区

  图源:阿里云公众号

  据了解,Yi-34B已登顶全球英文及中文权威榜单No.1。在Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72分位列全球第一;在C-Eval中文权威榜单排行榜上,Yi-34B超越了全球所有开源模型;在全球大模型各项评测中最关键的MMLU(Massive Multitask Language Understanding大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

  与此同时,Yi-34B模型将发布支持200K超长上下文窗口(context window)版本。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要;为此零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

图注:Yi-34B登顶Hugging Face英文测试公开榜单

  图源:阿里云公众号

  另外,借助AI Infra,Yi-34B模型实现40%训练成本下降。AI Infra(AI Infrastructure人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等;零一万物Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。

  凭借强大的AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%;目前,零一万物Infra能力实现故障预测准确率超过90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。

图注:Yi-34B简介

  图源:零一万物官网

  同时,零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化;数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

  值得一提的是,未来零一万物将基于Yi系列大模型,打造更多To C超级应用。李开复强调:“AI 2.0是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。零一万物邀请开发者社群跟我们一起搭建Yi开源模型的应用生态系,协力打造AI 2.0时代的超级应用。”

电商资讯*版权声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。 本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。
文章网址:http://www.cnecn.com.cn/service/tech/2023-11-07/14375.html
赞 | 0