首批开源300+模子:那几家中国AI主力军,合力打造出「魔搭」社区
机器之心原创
做者;蛋酱
从今以后,中国 AI 开发者也有了专属的「模子即办事」社区。
「模子即办事(Model as a Service)代表了将来的行业趋向,而魔搭 ModelScope 迈出了最重要的第一步。」
11 月 3 日,2022 云栖大会杭州现场,全新的 AI 模子社区魔搭 ModelScope 横空出生避世。
魔搭社区 ModelScope 由阿里达摩院联手中国计算机学会(CCF)开源开展委员会配合推出,首批协做机构包罗澜舟科技、智谱 AI、深势科技、中国科学手艺大学等多家科研机构,首批开源模子超越 300 个,中文模子占比超越 1/3,SOTA 模子超越 150 个,还有 10 多个前沿的大模子,笼盖了计算机视觉、语音、语义、多模态等多个范畴,笼盖了 60 多个通用使命。那些优良的模子,从此面向行业免费开放。
为什么要做如许一件事?阿里巴巴集团副总裁、阿里达摩院副院长周靖人表达:「中文为母语的 AI 开发者人数浩瀚,但中文 AI 模子数量不多,难以称心现实需求,并且也没有鼓舞开发和利用中文 AI 模子的相关社区。因而,我们希望魔搭 ModelScope 的呈现可以填补那方面的空白。」
十多年来,AI 手艺的高速开展有目共睹,但若何让先辈手艺高效落地,始末是一大难题。
那是因为传统的 AI 模子存在手艺上的局限性,1 个模子只针对 1 个使命,1000 个使命需要 1000 个模子,研发成本过高,无法实现规模化利用。
而预训练模子的鼓起供给了一种新的可能。好比近年来降生的 Transformer、BERT 等预训练模子,那些模子通过上游同一的预训练后,面临下流各类使命场景只需要微调就能实现较好的效果。良多预训练模子也已经开源,所有开发者都能下载、安拆、利用。
开源并非全能的。关于通俗开发者来说,从源代码起头跑一个复杂的 AI 模子,过程较长,充满未知数。除了模子代码,开发者同样需要开源之后的模子利用办事,需要愈加简便易用。
展开全文
魔搭社区 ModelScope 就在如许的布景之下降生了。
模子即办事:AI 开源 2.0 新范式
践行模子即办事(Model as a Service)的新理念,魔搭社区供给了浩瀚预训练根底模子,只需针对详细场景再稍做调优,就能快速投入利用。
官网地址:/
比拟于行业内已有的其他 AI 开源社区,魔搭具备三大特征:易用性、本土化、开放兼容。
起首,魔搭供给了集模子摸索、情况安拆、推理验证、训练调优于一体的「一站式办事」。关于模子利用者来说,能够在魔搭平台通过多维度的标签,在线检索并间接体验模子。魔搭既撑持当地情况快速安拆,也撑持云端 NoteBook 免安拆,实正实现了「开箱即用」。
以「DCT-Net 人像卡通化模子」为例,开发者可在模子库主页快速阅读「模子介绍」,初步领会模子的架构和详细参数,还能一键链接到联系关系数据集或在线体验窗口。「快速利用」版块则供给了下载安拆、加载和推理的操做指南。
值得存眷的是,针对模子的推理和调优,魔搭通过封拆的 Python SDK,实现了一行代码即可实现模子推理;此外通过简单易用的挪用接口、灵敏的设置装备摆设文件设想,仅需十行代码就能够运行一个调优使命。
基于云的算力支持和手艺支持,魔搭供给了更佳的用户体验,使得 AI 模子的开发和利用更简单。以往,要让一个 AI 模子跑起来,从下载开源代码到当地设置装备摆设、情况摆设,得到评测成果往往需要数天时间,如今只需要几个小时以至几分钟。
其次,魔搭更存眷本土化需求,更懂中文 AI 范畴研究。
语言是从感知智能迈向认知智能的关键,理解中文,才气在中文世界的使命场景中获得更佳效果。社区鼓舞中文 AI 模子的开发和利用,希望实现中文 AI 模子的丰硕赐与。
目前已经上架的超越 100 个中文模子中,包罗了一系列摸索人工智能前沿的中文大模子。好比阿里通义大模子系列、澜舟科技的孟子系列模子、智谱 AI 的多语言预训练模子、中文版 GPT-3、中文版 CLIP。
1 亿参数量的中文 GPT-3 文本生成模子,在魔搭社区获得了近两千次下载。
魔搭社区对峙中立开放的原则,兼容 TensorFlow、PyTorch、Caffe 等多种支流进修框架,且撑持多种模子训练与办事摆设体例,供给更多自主可控的选择。
社区组织架构为理事会指导。所有开发者均可配合参与社区建立,不限机构,不限类型,旨在鞭策 AI 的大规模利用,不以盈利为目的。
从那个维度去看,魔搭摸索的是一种「AI 开源 2.0 新范式」。
鞭策「模子即办事」迈出重要一步
若是你对云办事行业有所涉猎,那么 IAAS(Infrastructure-as-a-Service,根底设备即办事),PAAS(Platform-as-a-Service,平台即办事) 和 SaaS(Software-as-a-Service,软件即办事) 那三个名词的涵义便不难理解。
但关于当下的行业来说,模子即办事(Model as a Service)还算一个小寡概念。魔搭为什么要选择如许一种运做形式?
达摩院副院长周靖人阐明说,AI 开展到今天,模子架构变得越来越复杂,参数量也越来越浩荡。除了模子自己之外,研发、应用的过程还会涉及到大量的数据和响应的算力。只要少数研究者或者一些大型科技企业能够承担昂扬的投入,通俗 AI 开发者要训练好一个模子仍是十分有难度的。况且,想要把各个范畴的模子操纵起来,也需要必然的手艺布景和比力深切的范畴 Know-How。今天,行业内还欠缺同一的框架,搀扶帮助开发者们敏捷把那些模子挪用起来。种种因素使得 AI 的财产化应用面对着挑战,AI 的潜力难以得到足够发扬。
基于对以上察看的思虑,魔搭社区背后的开创成员们决定采纳模子即办事(Model as a Service)的理念 。「人工智能开展到那个阶段,当前的学界和业界构成了一个共识:模子自己已经成为重要的载体,愈加需要的是围绕模子自己搭建相关办事。我们预估,那在接下来会是整个业界开展的重要趋向。」周靖人表达。
纵不雅 AI 范畴的手艺朝上进步过程,其实并非靠某小我或某家公司来实现继续鞭策的。一个不涉及贸易利益的、开放式的平台,才更可以吸引顶尖的手艺人才集聚,更快实现「手艺的布衣化」。
也就是说,不但是从手艺上降低门槛,也要从经济上要降低门槛。所以在搭建之初,魔搭就定下了原则:不考虑盈利,免费供给模子下载和二次开发的时机。
为此,魔搭此次开源开放了十多个大模子,尤其包罗针对中文的大模子,希望可以被开发者用起来,让各人根据大模子去定造开发下流使命的小模子。
中国科学院院士、CCF 开源开展委员会主任王怀民指出,开源是 AI 开展的重要驱动力,魔搭 ModelScope 做为新型的 AI 开源社区,不只将有力鞭策 AI 迈向普遍的落地应用,还将助力中国从开源世界的参与者逐渐生长为指导者。
在那个过程中,达摩院也成为了奉献先行者。「我们把本身更好的模子都拿了出来,包罗此前发布的达摩院通义大模子系列,那些全数通过社区供给响应的开发以及下载。」
关于各方参与机构来说,开源自研大模子不是「垂手可得」的事。若是想让浩瀚优良模子放弃贸易营收,进入到开源开放序列,就必需突破现有的利益格局,重塑共识。当然,要打造一个中文模子社区,不只需要达摩院等几家机构的参与,更需要高校、科研机构、企业、小我等各类主体的奉献,以鞭策行业开展为己任,配合建立中文 AI 的重生态。
「魔搭社区的推出,远远算不上一个里程碑,只是一个起点,将来需要各方通力合作。」周靖人总结道。
附:魔搭社区部门模子
达摩院做画 AI(阿里通义文生图大模子) ,撑持中文输入,体验入口
/
阿里通义文本生成视频大模子
阿里通义底座模子之 M6-OFA,可处置 10 多项跨模态使命;
阿里通义多模态大模子 mPLUG,初次在视觉问答榜单 VQA Leaderboard 上超越人类;
阿里通义 AliceMind-PLUG (270 亿参数),中文理解和生成大模子,撑持写小说、写手艺文档、常识问答等功用。
中文版 GPT-3,撑持 AI 生成代码、AI 写做文、续写小说
中文版 CLIP 模子(2 亿图文对),可用于图文检索和图像、文本的表征提取
澜舟科技的孟子系列模子,十亿参数的轻量化模子登顶中文语言理解榜单 CLUE;
智谱AI的多语言预训练模子,撑持101种语言
深势科技的卵白量构造预测模子 Uni-Fold,一个开源的超越 AlphaFold 的模子