财讯中国

从浪潮“源1.0”看巨量模型并非一味比大

来源:中关村在线 2021-11-10 06:37:38

人工智能在算法领域的不断突破,不同数值精度带来了跨度更大的计算类型,对计算芯片指令集、架构的要求更加细分。图灵奖获得者John Hennessy和David Patterson共同发表的《计算机架构的新黄金时代》中提出:当摩尔定律不再适用,一种更加以硬件为中心的DSA(Domain Specific Architecture)架构设计会成为主导,这种设计的核心在于针对特定问题或特定领域来定义计算架构。基于DSA思想设计的AI芯片,在特定AI工作负载上表现出远超通用芯片的处理能力,大大推动了AI芯片的多元化发展。


从浪潮“源1.0”看巨量模型并非一味比大(图片来自itpro.co.uk)

“人工智能如何发展出像人类具备逻辑、意识和推理的认知能力,是人工智能研究一直在探索的方向。目前来看,通过大规模数据训练超大参数量的巨量模型,被认为是非常有希望实现通用人工智能的一个重要方向。”在AICC 2021上,中国工程院院士、浪潮首席科学家王恩东认为,随着巨量模型的兴起,巨量化已成为未来人工智能发展非常重要的一个趋势。

目前,全球知名的AI领先公司在巨量模型上都予以重兵投入,谷歌、微软、英伟达、浪潮、智源研究院、百度、阿里等公司相继推出了各自的巨量模型。

巨量化的一个核心特征就是模型参数多、训练数据量大。以浪潮人工智能研究院开发的全球最大规模的中文AI巨量模型“源1.0”为例,其参数量高达2457亿,训练数据集规模达到5000GB。相比GPT3模型的1750亿参数量和570GB训练数据集,“源1.0”的参数规模增加了40%,训练数据集规模增加近10倍。

此外,巨量化也表现在模型应用规模大。互联网头部公司的AI开放平台已经吸引了超百万的AI开发者,这些AI开放平台每天承载着数万亿次的调用量,数百万小时的语音识别,超过百亿张图像识别,超过万亿句自然语言理解等等。如此巨量的调用对算力中心的应用支撑能力带来了极大的挑战。

差异化的场景需求为AI发展指出了一条新道路,泛化能力成为AI在各行各业应用时实现规模化创新的基础,而这离不开超大参数量模型对大规模数据的训练。事实上,包括谷歌、微软、英伟达、浪潮、阿里在内的企业都相继推出了各自的巨量模型。2020年,OpenAI发布了GPT-3深度学习模型,GPT-3模型凭借1750亿个参数,在文本分析、机器翻译、机器写作等自然语言处理领域表现出色。前不久,浪潮人工智能研究院开发出了全球最大规模的中文AI巨量模型“源1.0”,参数量达到2457亿,训练数据集规模达到5000GB。相比GPT-3模型的1750亿参数量和570GB训练数据集,“源1.0”的参数规模增加了40%,训练数据集规模增加近10倍。

OpenAI的GPT-3带来了较好的小样本学习和泛化能力,前者的小样本甚至是零样本的学习能力,可以削弱预训练阶段基础模型的复杂性,以及针对不同场景进行模型调整所引发的大量工作,后者可以使得模型训练一次后得到的大模型用于支持各类任务,具有更好的普适性。因此,大模型的特性更符合人们对于通用智能的期待。相比此前GPT-3完成训练需要1万块GPU,源1.0只需要2000多块GPU即可完成。为了训练源1.0,浪潮研发了业界最大规模的中文高质量数据集5TB,为此清洗了近860TB的互联网数据。在精度上,源1.0在自然语言处理任务CLUE零样本学习和小样本学习的榜单中排名第一,在中文问答任务如WebQA上也大幅提升了性能。

当然,模型并不是一味的在比大。斯坦福大学计算机科学系教授李飞飞曾指出,对于均质和突现来说,均质就是有更好的泛化能力,突现就是表现出来的零样本学习和小样本学习的能力,这些能力是模型参数量较小时看不到的,只有当参数量变大之后,才会出现一些独特的性质。“大不是目的。AI的下一步是从系统1到系统2、从感知到认知,从专用智能走向通用智能。”浪潮人工智能研究院首席科学家吴韶华称,“我们研究过不同尺寸的模型结构,发现随着模型参数量的增大,尤其是小样本学习的能力会持续改进,‘大’能带来在算法、结构等方面的改进,加速对于前沿技术的探索。”

不过,大模型也有一些局限性,有些问题同样困扰着深度学习相关的几乎所有模型,例如不可解释性,难度会随着模型参数量的增长而加大。除此之外,概率的不可控性,以及约束推理(在受限的条件下/给定的条件下对模型进行推理)等问题也需要被解决。在落地实践的过程中,模型的针对性、精准性都会根据行业应用场景而改善,这就离不开模型的开放性,要与合作伙伴共同优化。自源1.0上线以来,已经接收到很多来自产业各界的企业和机构申请使用。

吴韶华认为,任何技术的发展都会有从兴起到成熟再到落地的阶段,“从这个规律来看,大模型正处于兴起的阶段,大家正在围绕模型的体量,以及模型体量带来的精度效应开展持续探索,当大模型探索走向成熟之后,一定会考虑应用等具体问题,比如响应化,运用响应化、高性能的推理部署等等,会有一个比较科学的曲线。”

当模型算法进入到“巨量时代”,单靠任何一家企业或机构都难以完成大模型的研发、训练、交互,生态的重要性被提升到了更高的优先级。埃森哲的一份调研报告显示,70%以上有技术的研究机构、科技公司缺少需求场景、领域知识和数据,70%以上的行业用户缺少技术人才、AI平台和实践能力。因此,只有将AI算法、芯片等领域的前沿技术与行业场景连接起来,才能向客户交付整体解决方案。

联想ThinkSystem SR650(Xeon Silver 4210R/32GB/1.2TB*4)

[经销商]京东商城

[产品售价]32062元

进入购买

华为5G CPE Pro 2

[经销商]京东商城

[产品售价]7899元

进入购买

浪潮英信NF5280M5 2U机架式服务器主机:银牌4210*2/16G*4内存/4TSATA*3硬盘/PM8204 2G缓存/导轨/550W双电

[经销商]京东商城

[产品售价]30299元

进入购买

标签: 浪潮 模型

相关新闻

Windows 11终于获得全新的音量指示器
2022-01-13 10:05:49
Morefine推出S500+迷你电脑:最高配Ryzen 9 5900HX
2022-01-13 10:05:44
LG希望通过CLOi ServeBot机器人来帮助应对“大辞职潮”危机
2022-01-13 10:05:38
国外少年发现特斯拉漏洞:无需钥匙可开走 已入侵25辆
2022-01-13 10:05:29
iOS 15.3 Beta 2修改措辞:运营商并非iCloud隐私中继禁用的唯一原因
2022-01-13 10:05:23
奥密克戎会“隐身”引发“超级熔断”:一周取消142个回国航班
2022-01-13 10:05:16
省下的油钱用来交保费?如何让电车买得起也“保得起”
2022-01-13 10:05:08
元宇宙火爆:美国虚拟房地产吸引数百万美元投资
2022-01-13 10:05:01
传叮咚买菜大裁员:员工称少了上万人、核心部门最高裁50%?
2022-01-13 10:04:55
百度诉人工刷量平台干扰搜索引擎获赔200万
2022-01-13 10:04:48
大神在民间!黑苹果新增支持12代酷睿和Z690主板
大神在民间!黑苹果新增支持12代酷睿和Z690主板
2022-01-13 08:29:23
Win11第三方Files文件管理器版本更新新增ARM64支持并修复部分BUG
Win11第三方Files文件管理器版本更新新增ARM64支持并修复部分BUG
2022-01-13 08:27:53
Firefox 96正式发布:显著改进噪声抑制和回声消除功能
Firefox 96正式发布:显著改进噪声抑制和回声消除功能
2022-01-13 08:25:49
Windows11安卓子系统获更新:核显+独显用户性能提升明显
Windows11安卓子系统获更新:核显+独显用户性能提升明显
2022-01-13 08:24:48
微信新功能科支持朋友圈折叠图片!网友:再也不用选“不看他朋友圈”了
微信新功能科支持朋友圈折叠图片!网友:再也不用选“不看他朋友圈”了
2022-01-13 08:23:24
把iOS 15做进浏览器?这款浏览器插件谁用谁知道
把iOS 15做进浏览器?这款浏览器插件谁用谁知道
2022-01-13 08:21:58
Win11多任务切换界面更新曝光:应用程序窗口将以全屏形式呈现
Win11多任务切换界面更新曝光:应用程序窗口将以全屏形式呈现
2022-01-13 08:19:20
Win11新预览版22533优化更新亮度、音量控制条界面UI
Win11新预览版22533优化更新亮度、音量控制条界面UI
2022-01-13 08:17:53
仅3.8毫米世界最薄笔记本摄像头模组发布!搭载广角失真校正反扭曲算法
仅3.8毫米世界最薄笔记本摄像头模组发布!搭载广角失真校正反扭曲算法
2022-01-13 08:12:40
Intel Arc锐炫独立显卡驱动优化 全新架构可最多提升40%性能
Intel Arc锐炫独立显卡驱动优化 全新架构可最多提升40%性能
2022-01-13 08:11:31
AMDX370主板正式支持锐龙5000,但不在支持第七代APU Bristol Ridge
AMDX370主板正式支持锐龙5000,但不在支持第七代APU Bristol Ridge
2022-01-13 08:08:09
前谷歌工程师成立的Nuro公司推出第三代自动驾驶送货机器人
2022-01-13 07:30:44
iOS 15.2.1和iPadOS 15.2.1发布 解决HomeKit漏洞问题
2022-01-13 07:30:39
世卫组织:全球新冠肺炎新增死亡病例数保持稳定
2022-01-13 07:30:32
传屏下Face ID推迟到iPhone 15 Pro才会出现
2022-01-13 07:30:25
Windows 11多任务切换界面返璞归真?新设计曝光
2022-01-13 07:30:18
Wedbush分析师称如若失去中国市场 特斯拉股价将大跌
2022-01-13 07:30:13
投资公司称iPhone 13生产瓶颈已得到解决
2022-01-13 07:30:06
特斯拉创始人:电动汽车销量将起飞、但产量不一定
2022-01-13 07:30:01
美国加州正在评估特斯拉自动驾驶测试是否需要监管
2022-01-13 07:29:54
药丸形打孔屏!iPhone 14要大涨价 最高2TB
2022-01-13 07:03:32
重回一月一发巅峰节奏?魅蓝回归第二款新机入网
2022-01-13 07:03:27
影驰全家桶 新年新气象 从一套新机开始
2022-01-13 07:01:44
传递科技之善,守护小家之情 | 帅丰集成灶登陆央视3大频道、全国11大机场
2022-01-13 07:01:38
CF开挂乱封玩家?腾讯:系外包磷石膏
2022-01-13 07:01:29
《穿越火线》内部员工开挂被举报:外包员工开除处理
2022-01-13 07:01:23
小牛电动首款汽车亮相 定位智能高端新能源
2022-01-13 07:01:15
Intel独立显卡仅靠200行代码让性能提升40%
2022-01-13 07:01:07
种草了 魅族全透明移动电源开售 仅999元
2022-01-13 07:00:59
普通人也能买得起的布加迪新能源电动车
2022-01-13 07:00:52
罗技推出60美元的主播光源
2022-01-13 07:00:46
免费下载 快升级!微软发Win11更新 修复多个问题
2022-01-13 07:00:41
巴掌大小电脑预装Win11 配1TB固态 可轻松外接3台显示器
2022-01-13 07:00:27
18岁女玩家玩《原神》不到2月用父亲信用卡充9万
2022-01-13 07:00:21
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-13 06:31:06
一台干衣机每年可向外部环境排出多达1.2亿个微纤维
2022-01-12 23:45:57
罗技发布照明配件Litra Glow 为视频通话与内容创作中的人物补光
2022-01-12 23:45:51
金域医学:主动传播病毒等传言不实 请公众勿造谣传谣
2022-01-12 23:45:44
瑞银CEO:比特币价格今年或达7.5万美元 推动者正是大伙
2022-01-12 23:45:39
iPhone 14 Pro再次被传将配备4800万像素摄像头
2022-01-12 23:45:31
奥斯汀街头骗子盯上停车咪表:放置自制二维码以窃取付款信息
2022-01-12 23:45:23
英国监管机构正式对微软收购Nuance一案展开调查
2022-01-12 23:45:16
Red Hat/Fedora Anaconda迁移到基于网络的新UI
2022-01-12 23:02:56
年轻人的第一台布加迪!布加迪纯电动踏板车发布
2022-01-12 23:02:47
黑客组织Patchwork感染自己开发的恶意程序
2022-01-12 23:02:33
哈勃科技投资物联网的操作系统服务商开鸿
2022-01-12 23:02:26
罗技推出Signature M650鼠标 3款型号 售价249元
2022-01-12 23:02:17
微软发布补丁 修复HTTP协议栈远程执行代码漏洞
2022-01-12 23:02:08
发现最偏心系外行星,每隔几周就会变得非常热
2022-01-12 23:01:56
企查查数据:2021年我国商业航天融资超64.5亿元
2022-01-12 23:01:48
LG加入IBM Quantum Network 推进量子计算的应用
2022-01-12 23:01:41
Windows 11获累积更新 升至Build 22000.434
2022-01-12 23:01:33
T-Mobile声称未大规模屏蔽iCloud隐私中继功能
2022-01-12 23:01:25
Android端Firefox Focus新增隐私保护功能
2022-01-12 23:01:19
大量Wordle“克隆”应用从苹果App Store中消失
2022-01-12 23:01:08
Verizon、AT&T表示未阻止iCloud隐私中继功能
2022-01-12 23:00:57
微软前高管建议剥离Office和Windows 专攻云计算
2022-01-12 23:00:49
指纹解锁共享单车!美团公开新专利
2022-01-12 22:53:06
限制挖矿算力!微星发布三款RTX 3080 12G系列显卡
2022-01-12 22:52:11
三星重振中国市场再出大动作!和京东签署国内战略协议
2022-01-12 22:51:26
还是张朝阳会玩!集结明星在长白山直播三天三夜!
2022-01-12 22:50:17
小米 10S正式推送MIUI 13:桌面更加流畅
2022-01-12 22:48:36
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 22:00:38
19岁少年远程入侵25辆特斯拉汽车 称利用软件漏洞
2022-01-12 21:19:34
赴港上市前夜 美菜网被爆总部搬迁、裁员40%
2022-01-12 21:19:27
索尼推出《蜘蛛侠:英雄无归》联名款全新WALKMAN
2022-01-12 21:19:17
魅族冬季新品发布会:lipro、PANDAER、mblu 齐登场
2022-01-12 21:19:00
美国新冠住院人数突破去年峰值 福奇:奥密克戎会传到每一个美国人
2022-01-12 21:18:50
“最冷春节”即将上线 新能源车主开不回老家?
2022-01-12 21:18:42
GeForce RTX 3080 12GB上线电商平台 售价约为1万元
2022-01-12 21:18:34
韩国批准诺瓦瓦克斯新冠疫苗 辉瑞新冠口服药明日送达
2022-01-12 21:18:27
空客2021年共交付611架民用飞机
2022-01-12 21:18:19
Windows Subsystem for Android更新 开始支持GPU切换
2022-01-12 21:18:11
“假笑男孩”祝福视频450元一条:每月在中国都接到订单 量不是特别大
2022-01-12 21:18:02
微商噩梦:微信朋友圈折叠图片新功能悄然上线
2022-01-12 21:17:46
Moto G Stylus 2022最新渲染图揭示其完整外貌:三颗摄像头+打孔屏
2022-01-12 21:17:40
UNITEX推出支持USB连接的LTO-9磁带驱动器
2022-01-12 21:17:31
支持LTE Advanced的Surface Pro 8现在可以从微软官网订购
2022-01-12 18:13:39
Check Point安全报告显示去年企业受到的总体网络攻击量有明显增加
2022-01-12 18:13:33
LG新能源称凭借积压订单将很快击败宁德时代
2022-01-12 18:13:24
Intel NUC迷你机产品线调整 12代酷睿平民版被砍
2022-01-12 18:13:18
美国因感染新冠病毒住院治疗人数达到历史最高水平
2022-01-12 18:13:13
NVIDIA宣布DLDSR AI超分辨率技术:驱动集成、无需游戏优化
2022-01-12 18:13:08
5部手机同时抽中2300元“优惠券” 扫地机器人大奖背后是何套路?
2022-01-12 18:13:02
波音2021年飞机交付量大增 但仍落后于对手空客
2022-01-12 18:12:55
辉瑞疫苗合作商BioNTech:今年新冠疫苗的收入可能会减少
2022-01-12 18:12:50
加拿大研究显示因感染新冠病毒住院的儿童出现严重并发症的风险较高
2022-01-12 18:12:43
加拿大魁北克省将对拒绝接种新冠疫苗者处以高额罚款
2022-01-12 18:12:36
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
2022-01-12 16:50:28
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
2022-01-12 14:16:53

热门文章

热点专题