财讯中国

数据挖掘、机器学习和深度学习之间有什么区别?

来源:网络 2022-01-29 18:00:05

机器学习,有时也称为计算智能,近年来已经突破了一些技术障碍,并在机器人、机器翻译、社交网络、电子商务,甚至医药和医疗保健等领域取得了重大进展。机器学习是人工智能的一个领域,其目标是开发学习计算技术以及构建能够自动获取知识的系统。

学习系统是一种计算机程序,它通过成功解决过去的问题积累的经验做出决策。尽管应用时间不长,但是有许多不同的学习算法,该领域是计算领域最热门的领域之一,并且定期发布一些新的技术和算法。

机器学习vs人工智能

许多人认为机器学习和人工智能的含义是一样的,但这并不十分准确。人工智能有几种定义,这其中包含机器学习的广泛概念。一个被广泛接受的定义是,人工智能由依赖人类行为来解决问题的计算机制组成。换句话说,技术使计算机就像人类一样“思考”来执行任务。

人类能够分析数据,发现其中的模式或趋势,从中进行更明智的分析,然后使用结论做出决策。在某种意义上,人工智能也遵循同样的原则。通常,人们完成任务越多,就越熟练。这是具有学习能力的结果。经常重复或执行相关程序对人们来说是一种培训。在人工智能系统中也会发生类似的事情:公开获取或记录在专用平台上的数据用作人工智能算法的培训。

那么培训是如何完成的?为此目的有几种算法。这一切都取决于应用程序以及它们背后的组织或人员。在这里,最重要的是知道在这一点上机器学习是有意义的。

什么是机器学习?

机器学习也是一个有多种定义的概念,但在其核心,机器学习是一个可以根据自身经验自主修改其行为的系统,其人为干扰很小。这种行为修改基本上包括建立逻辑规则,目的是提高任务的性能,或者根据应用程序做出最适合场景的决策。这些规则是根据分析数据中的模式识别生成的。

例如,如果一个人在搜索引擎中键入“勇敢”这个词,该服务需要分析一系列参数来决定是否显示类似于激怒或勇敢的结果,这可能有两种含义。在众多可用参数中有用户搜索历史:例如,如果在寻找“勇敢”之前几分钟,则最有可能出现第二种意义。这是一个非常简单的例子,但它说明了机器学习的一些重要方面。

重要的是,系统必须根据大量数据进行分析,这是搜索者必须放弃的一个标准,因为他们接收了数百万次访问,因此这是一个培训标准。

另一个方面是持续的数据输入,有利于识别新标准。假设“勇敢”这个词成为与文化运动相关的俚语,通过机器学习,搜索引擎将能够识别指向该术语的新含义的模式,并且在一段时间之后,将能够在搜索结果中考虑它。

机器学习有几种方法。众所周知的一种方法称之为“深度学习”,其中大量数据来自多层人工神经网络,这些算法受到解决复杂问题的大脑神经元结构的启发,例如图像中的物体识别。

机器学习的例子

机器学习的使用正在演变成各种各样的应用,人们当今拥有的许多技术资源都基于人工智能和机器学习。

自治数据库 - 借助机器学习,自治数据库处理以前由管理人员(DBA)执行的若干任务,允许这些专业人员处理其他活动,从而降低因为人为错误导致的应用程序不可用的风险。

打击支付系统中的欺诈行为 - 每秒都会产生各种信用卡欺诈和其他支付方式的尝试。机器学习允许反欺诈系统在成功之前识别其中的大部分。

文本翻译——翻译必须考虑场景、区域表达式和其他参数。由于采用机器学习,自动翻译越来越精确。

内容推荐——视频和音频流平台使用机器学习来分析用户查看或拒绝的内容的历史记录,以便为他们提供符合其意愿的建议。

营销和销售——根据以前的购买推荐产品和服务的网站使用机器学习来分析购买历史,并推广客户可能感兴趣的其他项目。这种捕获数据、分析数据并使用它来定制购物体验的能力或实施营销活动是零售业的未来。

运输——分析数据以识别模式和趋势对于运输行业至关重要,这取决于开发更有效的路线,并预测潜在问题以提高可靠性和盈利能力。机器学习数据建模和分析方面是运输厂商、公共交通和业内其他组织的重要工具。

石油和天然气 - 机器学习有助于发现新的能源,分析土壤中的矿物质,预测炼油厂传感器的故障,加速石油的分配,使其更加高效和经济。在这个行业中,机器学习应用程序的数量是巨大的,并且持续增长。

医疗保健 - 由于可穿戴设备和传感器的出现,使医疗保健专业人员能够实时访问患者数据,因此机器学习是医疗保健领域不断发展的趋势。该技术还可以帮助医学专家分析数据,以识别趋势或警报,从而改善诊断和治疗。

机器学习中使用的方法

两种最广泛采用的机器学习方法是监督学习和无监督学习,但它们并不是唯一的方法。

通过标记示例训练监督学习算法,作为已知所需输出的输入。例如,设备可能具有标记为“F”(失败)或“E”(执行)的数据点。学习算法接收一组输入以及相应的正确输出,并通过将实际输出与正确输出进行比较来学习以发现错误。然后它修改结算模型。通过分类、回归和梯度增强等方法,监督学习使用标准来预测附加的非标记数据中的标签值。监督学习通常用于历史数据预测可能的未来事件的应用中。例如,它可以预测信用卡交易何时可能是欺诈性的,或者哪些投保人倾向于要求其政策。

非监督学习用于针对没有历史标签的数据。“正确答案”未向系统报告。算法必须找出所显示的内容。目标是探索数据并在其中找到一些结构。无监督学习适用于交易数据。例如,它可以识别具有相似属性的客户群,然后可以在营销活动中对其进行类似处理;或者它可以找到分隔不同客户群的关键属性。常用的技术包括自组织映射、邻近映射、k-均值分组和分解为奇异值。这些算法还用于分割文本主题、推荐项目和识别数据中的差异点。

半监督学习用于与监督学习相同的应用程序,但处理有标签和无标签的数据进行培训——通常是用大量无标签数据标记的少量数据(因为没有标签的数据更便宜,并且需要花费更少的精力来获取)。这类学习可用于分类、回归和预测等方法。当与标签相关的成本太高而无法实现完全标记的培训过程时,半监督学习非常有用。其典型例子包括在网络摄像头上识别人脸。

强化学习通常用于机器人、游戏和导航。有了它,算法通过尝试和错误发现,哪些行为会带来更大的回报。这种类型的学习有三个主要组成部分:代理(学习者或决策者)、环境(代理与之交互的所有内容)和行动(代理可以做什么)。目标是让代理选择在给定时间段内最大化预期回报的行动。如果代理遵循一个好的政策,可以更快地实现目标。因此,强化学习的重点是找出最佳策略。

数据挖掘、机器学习和深度学习之间有什么区别?

虽然所有这些方法都有相同的目标,提取可用于决策的见解、模式和关系,但它们具有不同的方法和功能。

数据挖掘可以被视为从数据中提取洞察力的许多不同方法的超集。它可能涉及传统的统计方法和机器学习。数据挖掘应用来自多个区域的方法来识别数据中先前未知的模式。这可能包括统计算法、机器学习、文本分析、时间序列分析和其他分析领域。数据挖掘还包括数据存储和操作的研究和实践。

通过机器学习,目的是了解数据的结构。因此,统计模型背后有一个理论是经过数学证明的,但这要求数据也满足某些假设。机器学习是从使用计算机检查数据结构的能力发展而来的,即使人们不知道这种结构是什么样子的。机器学习模型的测试是新数据中的验证错误,而不是证明空假设的理论测试。由于机器学习通常使用迭代的方法从数据中学习,因此可以轻松地自动学习。这些步骤通过数据执行,直到找到一个可靠的标准。

深度学习结合了计算能力的进步和特殊类型的神经网络,以学习大量数据中的复杂模式。深度学习技术是当今最先进的技术,用于识别图片中的对象和语音中的单词。研究人员正在尝试将模式识别方面的成功应用于更复杂的任务,例如机器翻译、医疗诊断以及许多其他社会和企业问题。

尽管人工智能和机器学习的概念早已出现,但它们开始成为主流应用的一部分。但是,现在仍处于起步阶段。如果人工智能和机器学习有用并且令人印象深刻,当得到更好的训练和改进时,其实施将会更加有效。

关键词: 数据挖掘 机器学习 深度学习

相关新闻

数据挖掘、机器学习和深度学习之间有什么区别?
2022-01-29 18:00:05
Wi-Fi 6 是什么?和现在的Wi-Fi有何区别?
2022-01-29 18:00:00
微信推“拜年红包”:随机吉利数字 带不同动态效果
2022-01-29 16:51:38
工信部:2021年新建光缆319万公里,千兆光网具备覆盖3亿户家庭能力
2022-01-29 16:51:31
低端供应商推动印度智能手机出货量增长 2021全年达1.62亿台
2022-01-29 16:51:24
沃达丰英国计划2023年开始停用3G网络
2022-01-29 16:51:17
中天科技预计2021年净利1亿元—1.5亿元
2022-01-29 16:51:10
300多块的双核奔腾被玩出花了:超频冲上5.8GHz
2022-01-29 16:51:02
抽中“365天带薪休假”男子选择折现20万 为山区孩子捐款1万
2022-01-29 16:39:34
索尼Xperia手机摄影大赛报名出尴尬Bug:较早购买手机的用户无法参赛
2022-01-29 16:39:28
老人打响“出租车保卫战” 无辜新能源车遭殃
2022-01-29 16:39:22
北京通州部分下架民宿经审核重新上架 半天内已有房源被预订
2022-01-29 16:39:14
美国会议员致信加密货币挖矿企业 欲立法规范高能耗产业
2022-01-29 16:39:07
虎年见!Redmi K50 宇宙首款产品预热
2022-01-29 16:39:00
Rivian与三星SDI合资电池工厂谈判已结束 未取得进展
2022-01-29 16:39:00
隐士张一鸣
2022-01-29 16:38:53
微信版本更新 “支付”已改为“服务”
2022-01-29 16:38:51
中国广电5G核心网四川节点建设正式启动
2022-01-29 16:38:46
2月28日见!荣耀全球新品发布会来啦
2022-01-29 16:38:43
外媒起底“飞马”间谍软件:网络攻击武器如何崛起
2022-01-29 16:38:38
限购1台!398元买24英寸1080P 75Hz曲面无边框显示器
2022-01-29 16:38:35
12985亿元:蚂蚁非货基金保有规模再创新高
2022-01-29 16:38:30
加速赋能携手共赢 亚马逊云科技APN业务再升级
2022-01-29 16:38:26
京东方今年将向苹果iPhone供应4000万-5000万块OLED屏幕
2022-01-29 16:38:22
2022年显卡还能买吗?仅仅便宜一丢丢
2022-01-29 16:38:16
我国首个百万吨级碳捕集利用与封存项目建成
2022-01-29 16:38:13
AMD Zen 4锐龙7000处理器将极端紧俏
2022-01-29 16:38:04
特斯拉水土不服?1成三年车龄Model S无法通过德国质量检测
2022-01-29 16:38:02
双声道音频功率放大器电路图分析
2022-01-29 16:30:18
EMC测试简介
2022-01-29 16:30:12
一位从厌倦调试NRF24L01无线模块到成功的收发经验分享
2022-01-29 16:30:06
什么是视频分配器设备
2022-01-29 16:30:00
中国电信成立智能网络科技公司,注册资本9亿元
2022-01-29 15:22:36
Tachyum宣布被选中参与IPCEI 开发用于HPC/AI的Prodigy 2
2022-01-29 15:22:28
通用宣布向密歇根州4地投资超过70亿美元
2022-01-29 15:22:22
LG能源解决方案与通用汽车再合作于美国新建21亿美元电池工厂
2022-01-29 15:22:16
微软第二财季营收517亿美元 云相关业务贡献超过三分之一
2022-01-29 15:22:08
快手开通直播招聘功能:一键报名 无需投简历
2022-01-29 15:22:02
兰博基尼将推出四座版电动越野车和电动Urus
2022-01-29 15:21:56
联想于上海成立半导体公司,注册资本3亿元
2022-01-29 15:21:50
腾讯投资归芯科技
2022-01-29 15:21:43
PwnKit漏洞曝光:所有主流Linux发行版本均受影响
2022-01-29 15:21:37
顺丰控股注册资本增加至49.06亿,增幅7.68%
2022-01-29 15:21:30
腾讯投资心域科技,持股52.98%成大股东
2022-01-29 15:21:23
工信部:截至2021年底 我国建成10G PON端口786万个
2022-01-29 15:21:16
2021年我国电信业务收入累计完成1.47万亿元 比上年增长8%
2022-01-29 15:21:09
发售三个月 微软对Win11感到“高兴”:比以前的系统成功
2022-01-29 15:21:01
松下开发镜头成型新技术 高端远红外非球面镜头制造成本有望大降
2022-01-29 15:08:09
西班牙警方突击搜查加密货币矿场 起初因高能耗被怀疑种植大麻
2022-01-29 15:08:01
宝马公司设计 TteSPORTS level 10M拆解
2022-01-29 15:00:21
常见视频接口简介
2022-01-29 15:00:16
从惠普dv6拆解 深入解读CoolSense技术
2022-01-29 15:00:10
“毕昇杯”全国电子创新设计竞赛
2022-01-29 15:00:05
纯手工制作迷你逆变器(全图解)
2022-01-29 15:00:00
Note12还是11 Pro换芯?Redmi神秘骁龙690新机入网
2022-01-29 13:38:49
Q4手机出货量公布:国产品牌 荣耀第一
2022-01-29 13:38:42
小米Redmi 5G新机曝光:1亿像素 120Hz高刷 1000多元
2022-01-29 13:38:34
120W快充骁龙8旗舰!卢伟冰用这个字评价Redmi K50宇宙首款大作
2022-01-29 13:38:27
1亿像素+120Hz高刷屏!Redmi神秘新机入网
2022-01-29 13:38:20
三星Galaxy Watch4系列来拜年 健康时尚生活即刻开启
2022-01-29 13:38:12
vivo首款旗舰折叠屏NEX Fold来了!行业首发新技术
2022-01-29 13:38:03
九年销量25万+ 宝马i3纯电车型将于今夏停产
2022-01-29 13:38:00
一文读懂变频器的工作原理和应用
2022-01-29 13:30:32
顶级工业设计 360度翻转联想Yoga11拆解
2022-01-29 13:30:27
智能电表工作原理和结构
2022-01-29 13:30:21
简述特种电源及特种电源几种类型
2022-01-29 13:30:16
拆解 ThinkPad T410
2022-01-29 13:30:10
首届IPC ESTC展会聚焦产品开发到面世整体解决方案
2022-01-29 13:30:05
可控硅的作用是什么?又有哪些用途呢?
2022-01-29 13:29:59
字节跳动投资大寰机器人,后者专注机器人电动夹爪研发
2022-01-29 12:21:44
宝马在美推出2023款X2版GoldPlay
2022-01-29 12:21:37
NFT市场OpenSea推出新版列表管理器
2022-01-29 12:21:30
微软宣布Teams的月活跃用户数量突破2.7亿
2022-01-29 12:21:23
NOAA的GOES-T“高清地球”卫星将于3月从卡纳维拉尔角空军基地升空
2022-01-29 12:21:16
宝马发布2023款8系:造型、技术都获更新
2022-01-29 12:21:09
Google推出全新的.day域名系统
2022-01-29 12:21:02
眼不见为净:MIT研究团队展示InfraredTags红外隐藏标签方案
2022-01-29 12:08:55
一加手机副总裁李开新履新OPPO助理副总裁 管理IoT事业群
2022-01-29 12:08:48
机构:2021年Q4苹果以创纪录的市场份额登顶中国智能手机市场
2022-01-29 12:08:42
别去Costco买衣服了,亚马逊的线下服装店欢迎社恐的你
2022-01-29 12:08:35
比汽车更重要 马斯克押注自动驾驶和机器人软件业务
2022-01-29 12:08:28
为什么冬奥会要用人造雪?
2022-01-29 12:08:19
OPPO Find N已开启全款预售 首销秒售罄
2022-01-29 12:08:15
教育部:全面规范非学科类校外培训收费行为
2022-01-29 12:08:10
三星S22系列手机壳曝光:复古设计酷似充电宝
2022-01-29 12:08:05
电商虚假宣传被罚:邀网络博主下单并“好评”后全额返现
2022-01-29 12:08:01
节能灯电路原理分析
2022-01-29 12:00:26
开关式稳压电源工作原理
2022-01-29 12:00:21
滤波补偿模块与智能电容器区别是什么?
2022-01-29 12:00:16
BSI与无锡物联网产业研究院签订战略合作协议
2022-01-29 12:00:10
中国电子商务发展前景分析
2022-01-29 12:00:05
光伏发电的最大功率点跟踪控制
2022-01-29 12:00:00
Rise推出更适合团队会议日程安排的软件服务
2022-01-29 10:39:29
视频编码许可迎变局 Access Advance专利池在德国法院受挫
2022-01-29 10:39:24
英国批准美国引渡搜索巨鳄迈克·林奇:因惠普收购Autonomy面临刑事指控
2022-01-29 10:39:18
苹果iOS更新惹争议:新增“怀孕的男人”表情符号
2022-01-29 10:39:10
诺奖得主Paul Krugman:加密货币与次贷危机有“令人不安的”相似之处
2022-01-29 10:39:01
顺丰控股:预计去年净利润42亿至44亿元,同比下降四成
2022-01-29 10:38:53
“收费谁用啊?” - 三大运营商商用5G消息被指鸡肋产品
2022-01-29 10:38:45
谷歌云计算调整高层人事:欲洗刷市场“遥远第三名”尴尬
2022-01-29 10:38:37

热门文章

热点专题