财讯中国

谁才是让AI产生偏见的幕后推手?不能只归咎于数据

来源:科技日报 2020-07-15 14:22:28

美国麻省理工学院媒体实验室研究项目显示,人工智能识别浅色皮肤男性的平均错误率不超过1%,识别深色皮肤女性的平均错误率达35%……

人脸识别所导致的偏见问题一直受到广泛关注。近期,一篇关于图像超分辨率的论文引发了对于产生偏见原因的新争论。

网友利用论文中的开源代码进行了模型推理,在使用时发现,非白人面孔的高糊照片被还原成了一张白人面孔。对此,2018年图灵奖得主、AI领军人物杨立昆(YannLeCun)在推特上指出,当数据有偏见时,机器学习系统就变得有偏见。而这一观点,掀起一场争论浪潮。有人说,机器学习系统产生偏见不应只归咎于数据集,这种甩锅的做法是不公平的,还有技术、人类观念等原因。

现在还没有100%无偏见的数据集

随着人工智能时代的到来,人脸识别技术正被越来越广泛地应用在执法、广告及其他领域。然而,这项技术在识别性别、肤色等过程中,存在着一定偏见。

“在美国,人脸识别系统中白人男性的识别率最高,而黑皮肤女性的识别率则最低;在亚洲国家的人脸识别系统中黄种人的识别率相比白种人的识别率差距就会小一些。”福州大学数学与计算机科学学院、福建省新媒体行业技术开发基地副主任柯逍博士说。

这次陷入争论中心的人脸识别偏见问题其实是一个存在很久、热度很高的话题。

早前,美国麻省理工学院媒体实验室主导的一项名为《GenderShades》的研究项目在研究了各个前沿科技公司的面部识别系统后发现,各系统在识别男性面脸与浅色面脸方面表现更佳,浅色皮肤男性的平均识别错误率不超过1%,浅色皮肤女性的平均识别错误率约为7%,深色皮肤男性的平均识别错误率约为12%,深色皮肤女性的平均识别错误率则高达35%。

那么本次争议中,杨立昆指出的数据集问题是如何产生偏见的?有无100%没有偏见的数据集?“不均衡的数据,导致了系统在学习时,更好地拟合了比重较大的数据,而对占比小的数据的拟合则表现不佳,这就可能最终导致了偏见的产生。”柯逍介绍说,如一个常见的人脸识别数据集LFW,数据集中有近77%的男性,同时超过80%是白人。

“目前,几乎可以肯定的是没有100%无偏见的数据集。”柯逍举例说,在收集数据时,可以针对性地让男性与女性数目一样,甚至也可以让各种肤色的数据数目都一样。但是,其中可能大部分人是没有戴眼镜的,这可能就对戴眼镜的人进行识别时带来了偏见。进一步讲,各个年龄段的人脸也很难做到完全一致,导致最后学习到的模型可能对戴眼镜、年长或年幼的人脸产生偏见。所以有时候讨论数据偏见的产生,会发现其产生的原因是考虑问题的角度不同。

出现偏见不能只归咎于数据

众多专家也指出,数据可能是机器学习系统中偏见的来源,但不是唯一的来源。

其实,在本次争议中,杨立昆在推特中已经很明确地表示,他的本意并不是说问题都出在数据集上,只是针对这篇论文,其算法在特定场景下,换个数据集就能解决问题,但并不是说所有的机器学习系统偏见都来源于数据集。

那么,谁才是产生偏见真正的“幕后推手”?

AI学习过程应该是架构、数据、训练算法等的相互作用。算法包括了特征的选择、损失函数的选择、训练方法的选择以及超参数调节等,其本身的缺陷也是偏见产生的一个原因。

2019年12月,美国国家标准技术研究院进行的一项研究发现,在大多数当前评估的人脸识别算法中,跨人种差异确实存在广泛的准确性偏差。

柯逍介绍说,在算法设计的时候,往往会选择L1损失函数或者L2损失函数。若在将一个低分辨率人脸图像还原成高分辨率人脸图像的方法中,使用L2损失函数,得到的大多数人脸图像更像白人;而使用L1损失函数,得到大多数人脸图像更像黑人。这说明由于损失函数的选择不同,某个群体(黑人或白人)在一定程度上就会受算法的忽视,进而产生偏见。

这当中还存在另一种情况,假如数据带有少量的偏见,算法系统会将其放大,并变得更具有偏见。一项研究表明,如果初始数据中,下厨与女性的联系概率是66%,将这些数据喂给人工智能后,其预测下厨与女性联系起来的概率会放大到84%。一般来说,机器学习系统会选择最符合通用情况的策略,然而这样会导致一些非典型情况或较为特殊情况被忽略。

除此之外,产生偏见的原因还有相似性的偏见。信息推送系统总会向用户推荐他已经看到、检索过的相关内容。最终的结果是导致流向用户的信息流都是基于现存的观点和看法。“系统会自动帮助用户屏蔽与他们意见相左的信息,这就催生了一个信息泡沫,用户看到的都是人工智能让你看到的。这种偏见根本上也是数据与算法共同作用产生的。”柯逍说。

“总体而言,偏见还是源于规则制定者。”中锐网络人工智能产品总监叶亮说,工程师从头到尾参与了整个系统设计,尤其是机器学习的目标设定。算法就好像一只嗅探犬,当工程师向它展示特定东西的气味后,它才能够更加精准地找到目标。

算法纠偏工具已经上岗

近期,国际多家机构相继宣布禁用人脸识别技术。有色人种被还原成白人的事件,再次掀起了人们对于人工智能系统产生偏见的批判浪潮,也再次警醒人们,技术带有偏见所带来的潜在危机。

偏见可能导致无辜者蒙冤。在2018年夏天,英国媒体就报道过,由于人脸识别技术的误判,导致一名年轻黑人男性被误认为嫌疑犯,在公众场合被警察搜身。

也有报告显示,一些国外执法机构可以根据AI识别出的发色、肤色和面部特征对视频中的人物进行检索。这种技术上的偏见也在一定程度上放大了人们的偏见。

除了对人种与性别的识别偏差之外,人脸识别技术还因其在侵犯隐私方面的问题而引起担忧。2020年初,美国一家人脸识别技术公司便受到了严密的审查,有关部门发现,其面部识别工具由超过30亿张图像构建而成,然而这些图像大部分都是通过抓取社交媒体网站收集的,并且已被许多企业广泛使用。

偏见存在的同时,一批新兴的算法纠偏工具也涌入了人工智能。

早在2018年,脸书曾发布一个算法模型,表示会在算法因种族、性别、年龄等因素做出不公正判断时发出警告以提醒开发者;2019年麻省理工学院就提出了一种纠偏算法,可以通过重新采样来自动消除数据偏见。

那么克服偏见还需要人工智能技术做出哪些努力?“开源方法和开源技术都有着极大的潜力改变算法偏见。”叶亮指出,开源方法本身十分适合消除偏见程序,开源社区已经证明它能够开发出强健的、经得住严酷测试的机器学习工具。如果线上社团、组织和院校能够接受这些开源特质,那么由开源社区进行消除算法偏见的机器设计将会顺利很多。

柯逍认为,可以看出偏见基本来源于数据与算法,加强对人工智能所使用的数据、算法以及模型的评估,能够在一定程度上缓解潜在的、可导致偏见与歧视的因素。同时,人工智能的偏见其实都是人类偏见的反映与放大,因此人们放下偏见才是最根本的解决方案。

标签: AI 偏见 幕后推手

相关新闻

曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-13 06:31:06
一台干衣机每年可向外部环境排出多达1.2亿个微纤维
2022-01-12 23:45:57
罗技发布照明配件Litra Glow 为视频通话与内容创作中的人物补光
2022-01-12 23:45:51
金域医学:主动传播病毒等传言不实 请公众勿造谣传谣
2022-01-12 23:45:44
瑞银CEO:比特币价格今年或达7.5万美元 推动者正是大伙
2022-01-12 23:45:39
iPhone 14 Pro再次被传将配备4800万像素摄像头
2022-01-12 23:45:31
奥斯汀街头骗子盯上停车咪表:放置自制二维码以窃取付款信息
2022-01-12 23:45:23
英国监管机构正式对微软收购Nuance一案展开调查
2022-01-12 23:45:16
Red Hat/Fedora Anaconda迁移到基于网络的新UI
2022-01-12 23:02:56
年轻人的第一台布加迪!布加迪纯电动踏板车发布
2022-01-12 23:02:47
黑客组织Patchwork感染自己开发的恶意程序
2022-01-12 23:02:33
哈勃科技投资物联网的操作系统服务商开鸿
2022-01-12 23:02:26
罗技推出Signature M650鼠标 3款型号 售价249元
2022-01-12 23:02:17
微软发布补丁 修复HTTP协议栈远程执行代码漏洞
2022-01-12 23:02:08
发现最偏心系外行星,每隔几周就会变得非常热
2022-01-12 23:01:56
企查查数据:2021年我国商业航天融资超64.5亿元
2022-01-12 23:01:48
LG加入IBM Quantum Network 推进量子计算的应用
2022-01-12 23:01:41
Windows 11获累积更新 升至Build 22000.434
2022-01-12 23:01:33
T-Mobile声称未大规模屏蔽iCloud隐私中继功能
2022-01-12 23:01:25
Android端Firefox Focus新增隐私保护功能
2022-01-12 23:01:19
大量Wordle“克隆”应用从苹果App Store中消失
2022-01-12 23:01:08
Verizon、AT&T表示未阻止iCloud隐私中继功能
2022-01-12 23:00:57
微软前高管建议剥离Office和Windows 专攻云计算
2022-01-12 23:00:49
指纹解锁共享单车!美团公开新专利
2022-01-12 22:53:06
限制挖矿算力!微星发布三款RTX 3080 12G系列显卡
2022-01-12 22:52:11
三星重振中国市场再出大动作!和京东签署国内战略协议
2022-01-12 22:51:26
还是张朝阳会玩!集结明星在长白山直播三天三夜!
2022-01-12 22:50:17
小米 10S正式推送MIUI 13:桌面更加流畅
2022-01-12 22:48:36
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 22:00:38
19岁少年远程入侵25辆特斯拉汽车 称利用软件漏洞
2022-01-12 21:19:34
赴港上市前夜 美菜网被爆总部搬迁、裁员40%
2022-01-12 21:19:27
索尼推出《蜘蛛侠:英雄无归》联名款全新WALKMAN
2022-01-12 21:19:17
魅族冬季新品发布会:lipro、PANDAER、mblu 齐登场
2022-01-12 21:19:00
美国新冠住院人数突破去年峰值 福奇:奥密克戎会传到每一个美国人
2022-01-12 21:18:50
“最冷春节”即将上线 新能源车主开不回老家?
2022-01-12 21:18:42
GeForce RTX 3080 12GB上线电商平台 售价约为1万元
2022-01-12 21:18:34
韩国批准诺瓦瓦克斯新冠疫苗 辉瑞新冠口服药明日送达
2022-01-12 21:18:27
空客2021年共交付611架民用飞机
2022-01-12 21:18:19
Windows Subsystem for Android更新 开始支持GPU切换
2022-01-12 21:18:11
“假笑男孩”祝福视频450元一条:每月在中国都接到订单 量不是特别大
2022-01-12 21:18:02
微商噩梦:微信朋友圈折叠图片新功能悄然上线
2022-01-12 21:17:46
Moto G Stylus 2022最新渲染图揭示其完整外貌:三颗摄像头+打孔屏
2022-01-12 21:17:40
UNITEX推出支持USB连接的LTO-9磁带驱动器
2022-01-12 21:17:31
支持LTE Advanced的Surface Pro 8现在可以从微软官网订购
2022-01-12 18:13:39
Check Point安全报告显示去年企业受到的总体网络攻击量有明显增加
2022-01-12 18:13:33
LG新能源称凭借积压订单将很快击败宁德时代
2022-01-12 18:13:24
Intel NUC迷你机产品线调整 12代酷睿平民版被砍
2022-01-12 18:13:18
美国因感染新冠病毒住院治疗人数达到历史最高水平
2022-01-12 18:13:13
NVIDIA宣布DLDSR AI超分辨率技术:驱动集成、无需游戏优化
2022-01-12 18:13:08
5部手机同时抽中2300元“优惠券” 扫地机器人大奖背后是何套路?
2022-01-12 18:13:02
波音2021年飞机交付量大增 但仍落后于对手空客
2022-01-12 18:12:55
辉瑞疫苗合作商BioNTech:今年新冠疫苗的收入可能会减少
2022-01-12 18:12:50
加拿大研究显示因感染新冠病毒住院的儿童出现严重并发症的风险较高
2022-01-12 18:12:43
加拿大魁北克省将对拒绝接种新冠疫苗者处以高额罚款
2022-01-12 18:12:36
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
2022-01-12 16:50:28
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
2022-01-12 14:16:53
iPhone14或采用药丸形打孔屏 最全外形渲染图都在这里了
2022-01-12 13:58:39
LG发布4K 160Hz游戏显示器32GQ950
2022-01-12 13:58:33
iPhone 13 Pro DxO续航测试59小时
2022-01-12 13:58:22
联想拯救者Y90已入网:68W祖传快充
2022-01-12 13:58:16
腾讯全新游戏品牌“腾讯先锋”公布:不用下载
2022-01-12 13:58:08
苹果抛光布重新上架 145元当天发货
2022-01-12 13:46:53
10秒销售额破亿!iQOO 9今日开售战报发布
2022-01-12 13:46:48
文战元宇宙
2022-01-12 13:46:44
下月见!Redmi K50电竞版跑分曝光
2022-01-12 13:46:39
小米有责任,捐赠1000万成立体育奖学金
2022-01-12 13:46:34
配备单色OLED屏 山灵正式发布UA系列便携解码耳放UA5
2022-01-12 13:46:29
荣耀50系列荣获“2021年度经典焕新品牌”
2022-01-12 13:46:23
机构发布报告称智能手表的销量将继续强劲增长
2022-01-12 13:46:17
可选RTX 3070 Ti 150W满功耗释放 联想拯救者 Y9000P 2022将发布
2022-01-12 13:46:12
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 13:34:39
2022环境检测机构使命再升级
2022环境检测机构使命再升级
2022-01-12 09:59:21
苹果搜歌神器Shazam推出可识别播放歌曲的Chrome浏览器扩展
苹果搜歌神器Shazam推出可识别播放歌曲的Chrome浏览器扩展
2022-01-12 08:30:09
微软突然公开macOS漏洞细节!苹果发文感谢并称已确认修复
微软突然公开macOS漏洞细节!苹果发文感谢并称已确认修复
2022-01-12 08:28:09
ColorOS 12.1南德TUV A级认证出炉:可坚持36个月流畅不卡顿
ColorOS 12.1南德TUV A级认证出炉:可坚持36个月流畅不卡顿
2022-01-12 08:26:11
企业微信4.0正式发布:强化品牌直播带货并全面接入腾讯文档
企业微信4.0正式发布:强化品牌直播带货并全面接入腾讯文档
2022-01-12 08:24:25
微软为Win11版Defender设计全新界面:调整UI并重构底层界面
微软为Win11版Defender设计全新界面:调整UI并重构底层界面
2022-01-12 08:22:56
曝iPhone 14三种屏幕对比图出炉:药丸打孔屏大幅增加屏占比
曝iPhone 14三种屏幕对比图出炉:药丸打孔屏大幅增加屏占比
2022-01-12 08:21:28
iPhone14或采用药丸形打孔屏:屏占比大幅提升,最高容量2TB
iPhone14或采用药丸形打孔屏:屏占比大幅提升,最高容量2TB
2022-01-12 08:19:22
曝三星Galaxy S22系列处理器标配高通骁龙8!频率可达1300MHZ
曝三星Galaxy S22系列处理器标配高通骁龙8!频率可达1300MHZ
2022-01-12 08:15:03
NVIDIA宣布DLDSR AI超分辨率技术:可提升任意游戏性能70%
NVIDIA宣布DLDSR AI超分辨率技术:可提升任意游戏性能70%
2022-01-12 08:13:37
PCIe 6.0正式发布:允许数据双向流动,x16带宽增至256GB/s
PCIe 6.0正式发布:允许数据双向流动,x16带宽增至256GB/s
2022-01-12 08:12:23
苹果:App开发者已经挣了2600亿
2022-01-12 06:16:47
米哈游侧目!腾讯人气手游一年吸金178亿:你贡献多少
2022-01-12 06:16:42
别老拿爱优腾跟Netflix比 根本不是一码事
2022-01-12 06:16:36
Windows 11效率将更高 提高文件管理器性能
2022-01-12 06:16:28
你用多沉的哑铃?这个智能产品对着说就行
2022-01-12 06:16:21
Intel人事调整:CFO退休 新女将接任PC业务主管
2022-01-12 06:16:06
最佳开发商 Xbox可以FaceTime 通话
2022-01-12 06:15:59
全球销量破亿!任天堂Switch OLED国行版开卖 只要2599元
2022-01-12 06:15:55
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 06:05:06
从核酸检测到健康码,为什么系统总是“崩了”?
2022-01-12 00:09:00
美联社宣布进军NFT 主打新闻摄影市场
2022-01-12 00:08:55
种植牙将纳入两级医保集采 降价幅度有望达到60%-90%
2022-01-12 00:08:46
1月28日至3月13日,北京禁飞“低慢小”航空器
2022-01-12 00:08:39
邢台18岁女孩百草枯中毒 肺移植后已经可以下床活动
2022-01-12 00:08:33
全球上层海洋温度连续第六年打破纪录
2022-01-12 00:08:28
女外卖骑手的飞驰人生:成为零差评收割机 在男人堆里杀出一条活路
2022-01-12 00:08:17
iPhone 14 Pro与iPhone 13 Pro同框照曝光:新老外形对比强烈
2022-01-12 00:08:10
Rivian在2021年生产了超1000辆电动汽车 符合下调预期
2022-01-11 23:39:04

热门文章

热点专题