11月7日消息,李开复带队创办的AI2.0公司零一万物近日正式发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。
官方介绍,零一万物此次开源的Yi系列模型包含34B和6B两个版本;零一万物创始人及CEO李开复表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”
图注:Yi-34B发布在魔搭社区
图源:阿里云公众号
据了解,Yi-34B已登顶全球英文及中文权威榜单No.1。在Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72分位列全球第一;在C-Eval中文权威榜单排行榜上,Yi-34B超越了全球所有开源模型;在全球大模型各项评测中最关键的MMLU(Massive Multitask Language Understanding大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。
与此同时,Yi-34B模型将发布支持200K超长上下文窗口(context window)版本。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要;为此零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。
图注:Yi-34B登顶Hugging Face英文测试公开榜单
图源:阿里云公众号
另外,借助AI Infra,Yi-34B模型实现40%训练成本下降。AI Infra(AI Infrastructure人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等;零一万物Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。
凭借强大的AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%;目前,零一万物Infra能力实现故障预测准确率超过90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。
图注:Yi-34B简介
图源:零一万物官网
同时,零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化;数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。
值得一提的是,未来零一万物将基于Yi系列大模型,打造更多To C超级应用。李开复强调:“AI 2.0是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。零一万物邀请开发者社群跟我们一起搭建Yi开源模型的应用生态系,协力打造AI 2.0时代的超级应用。”