您的手机 在你输入之前就知道你要输入什么。 网飞 知道你接下来会狂吃什么。 银行 知道自己是否会偿还贷款。 Spotify 知道你会重复播放哪些歌曲。
但怎么会呢?谁在暗中监视我们所有人?
通灵鸽子?会读心术的人组成的秘密社团?还是你的妈妈--因为她总是知道?
不是。是人工智能算法。
这些系统使 精准预言 通过阅读大量数据并分析模式。
但人工智能算法究竟是什么?它是如何工作的?
它有哪些不同类型,在实际应用中如何使用?今天的博客将为您一一道来。
让我们从头开始。
什么是人工智能算法?
人工智能算法在日常生活中的应用 技术 - 谷歌搜索、Siri、Netflix 推荐,但它们也被用于欺诈检测、自动驾驶汽车和医疗诊断。
人工智能的起源可以追溯到 20 世纪 40 年代,当时艾伦-图灵提出了一个问题、 "机器会思考吗?"
他在 20 世纪 50 年代发明了图灵机,后来用它进行了测试。 图灵测试 它展示了机器如何按照逻辑步骤解决问题。
再也不用担心人工智能检测到你的短信了 Undetectable AI 可以帮助您:
- 让人工智能辅助写作显现出来 像人一样
- 旁路 只需点击一下,就能使用所有主要的人工智能检测工具。
- 使用 人工智能 安全地 和 自信地 在学校和工作中。
上世纪五六十年代,一些程序(逻辑理论家)可以证明数学定理。
但有一个问题--它们无法学习。每一条规则都必须手动编程。
人工智能的核心是 只是一套说明-算法,帮助机器做出决策。
有些很简单,比如过滤垃圾邮件。有些则比较复杂,比如根据医疗记录预测疾病风险。
但我们要清楚,人工智能不会自己思考。它依赖于 人类编程和持续学习 以更好地开展工作。
让我们用一个 例如
人工智能有助于做出更大的决策。以银行审批贷款为例。它可能会使用 决策树 (一个简单的人工智能模型,其工作原理类似于流程图):
- 申请人有稳定的收入吗?否 → 拒绝贷款。有 → 检查信用评分。
- 信用评分良好?否 → 重新考虑。是 → 检查现有贷款。
- 贷款太多?高风险。贷款少?风险较低。
在流程结束时,人工智能会根据结构化逻辑批准或拒绝贷款。
现在是下一部分
人工智能算法如何实现机器学习和自动化
这样想吧。
想象一下,教孩子如何识别狗。
老师会给他们看图片,指出主要特征,随着时间的推移,他们就能更好地在现实生活中发现它们。
人工智能算法也是这样学习的 从海量数据中学习,进行预测并自动执行任务。
1 - 预测
回归算法研究过去的信息,从而进行实时自动预测。
例如 Netflix 根据预测为您推荐节目。如果你喜欢 怪事 它可能表明 黑暗或保护伞学院 因为其他人喜欢 怪事 我也看了
2 - 机器学习
但人工智能不仅仅是预测,它还能适应。
机器学习能让计算机从经验中学习和改进,而无需明确编程。
例如 如果你喜欢《怪奇物语》只是因为它的科幻元素,而讨厌恐怖片呢?如果你喜欢短小精悍的快节奏节目而不是慢热的剧情片呢?Netflix 的算法会分析你的深层次活动,并调整推荐内容。
3 - 自动化
然后是自动化。
自动化是利用技术来执行任务,尽量减少人工干预的过程。
例如 自动驾驶汽车也有类似的功能,利用计算机视觉来 "观察 "道路,识别停车标志,并从每一英里的行驶中学习。
它们处理的数据越多,就越聪明。
人工智能算法如何工作(逐步进行)
就像人学习新技能一样,人工智能也是循序渐进的。
让我们利用谷歌搜索引擎的图像识别功能来分析一下。
步骤 # 1 - 数据收集
一切从数据开始。人工智能需要成千上万的示例来学习。在图像识别中,它包括
- 数以百万计的标注图片(例如,猫的图片标注为 "猫",狗的图片标注为 "狗")。
- 光线、角度和质量的变化。
- 同一物体的不同尺寸、颜色和形状。
- 边缘情况(图像模糊、物体部分隐藏、对比度低)。
步骤 # 2 - 预处理
原始图像包含大量不必要的信息,如模糊或低质量的图像、不相关的物体和杂乱无章的图像等。
在训练人工智能之前,必须对数据进行清理和标准化。这包括
- 将图像调整为统一尺寸,以便统一处理。
- 灰度或色彩正常化,确保亮度和对比度不会误导人工智能。
- 去除噪音,如无助于识别物体的不必要背景元素。
步骤 # 3 - 培训
人工智能不会 "看" 图像的方式与人类相同。 它将图像视为数字--成千上万的像素,每个像素都有一个代表亮度和颜色的值。
为了理解这一点,人工智能使用了卷积神经网络(CNN),这是一种为图像识别而构建的特殊类型的深度学习模型。
以下是 CNN 如何分解图像的方法:
- 卷积层 人工智能会分段扫描图像,首先检测简单的形状(线条、曲线),然后识别复杂的特征(眼睛、耳朵、胡须)。
- 汇集层: 这些方法可以缩小图像,保留基本细节,同时舍弃不必要的像素。
- 完全连接的层: 人工智能将检测到的特征联系起来,做出最终预测--如果看到尖耳朵和胡须,就能识别出是一只猫。
这一过程包括 纪元.
想象一下,你正在学习识别不同种类的鸟。第一次看到麻雀和鸽子时,你可能会把它们搞混。
但在看了照片、研究了他们的特点并得到反馈后,你就会有所改进。
人工智能也是这样学习的。
一个纪元是一个完整的周期,在这个周期中,人工智能会查看所有训练数据、做出预测、检查错误并进行调整。
就像你多次练习以提高技能一样。
步骤 # 4 - 测试
在人工智能投入实际应用之前,需要对其进行测试。这包括
- 为它提供从未见过的图像。
- 衡量它的准确性--它是否能正确地将猫标记为猫?
- 检查是否存在过度拟合,即人工智能记住了训练数据,但在处理新图像时却举步维艰。
如果人工智能失败的次数太多,它就会回去接受更多的训练,直到能够可靠地识别出从未遇到过的图像。
步骤 # 5 - 部署
经过训练和测试后,人工智能模型就可以部署了。当我们给它输入图像时它就会
- 将其分解为像素值
- 运行所有已学过的层
- 为每个可能的标签生成概率分数
- 选择最可能的分类
典型的结果可能是这样的
- Cat: 99.7% 概率
- 狗:0.2% 概率
- 其他0.1% 概率
人工智能算法的类型和使用方法
就像人们有不同的学习方式--有的通过阅读,有的通过实践--人工智能也有不同类型的算法,每种算法都适合特定的任务。
1 - 监督学习
想象一下,一个孩子正在学习如何辨认苹果和橘子。老师给图片贴上标签:
"这是苹果"
"这是橘子"
随着时间的推移,它们就能学会区分。这就是监督学习--人工智能在标注数据的基础上接受训练,学会预测。
例如
的人工智能算法 垃圾邮件过滤器 扫描成千上万封标有 "垃圾邮件 "或 "非垃圾邮件 "的电子邮件,并学习其中的模式。
- 电子邮件是否包含某些关键词?
- 发件人可疑吗?
随着时间的推移,它能更好地在垃圾邮件进入收件箱之前将其捕获。
监督学习为回归模型和分类模型提供了动力,前者可以预测房价等情况,后者可以决定一封邮件属于垃圾邮件还是主收件箱。
2 - 无监督学习
现在想象一下,你给同一个孩子一篮子水果,却不告诉他们哪些是苹果,哪些是橘子。
相反,他们根据相似的颜色、形状和质地对它们进行分组。
这就是无监督学习--人工智能在没有标签的数据中发现模式。
例如
银行并不总能立即知道交易是否是欺诈性的,但 人工智能有助于防止欺诈。
它能扫描数百万次购物,了解每位顾客的 "正常 "消费和非正常消费。
假设您每周都购买日用品和汽油。然后,你突然想在另一个国家买一辆价值 $5,000 美元的豪华轿车。
人工智能会将其标记为可疑,可能会冻结您的银行卡或向您发送快速 "是你吗?" 留言
3 - 强化学习
现在,假设你给孩子一个挑战--每当他们正确地摘下一个苹果,就会得到一颗糖。如果他们摘错了水果,就会失去一颗糖。
随着时间的推移,他们学会了获取最多糖果的最佳方法。 这是 强化学习。
人工智能也是这样做的--它测试不同的行动,从错误中学习,并根据奖惩进行调整。
例如
自动驾驶汽车 不要一开始就知道怎么开车。
不过,在分析了数百万英里的道路数据后,它们在刹车、并入车流和避开障碍物方面的表现越来越好。
每一次错误都是一次教训。每一次成功都会让他们变得更聪明。
4 - 神经网络与深度学习
有些问题过于复杂,无法用简单的规则来解决。这就是神经网络的用武之地。
它们的工作原理与人脑类似,可以识别模式并做出决策,而不需要详细说明每一条指令。
例如
A 传统电脑 可能会在不同的角度、光线或表情下挣扎。
但深度学习模型(多层神经网络)可以学习识别人脸,无论条件如何。
就像人们有不同的学习方式--有的通过阅读,有的通过实践--人工智能也有不同类型的算法,每种算法都适合特定的任务。
现实世界中的人工智能算法应用
人工智能图像检测器如何利用算法识别人工智能创建的图像
现在,人工智能生成的图像非常逼真,人们几乎无法将它们与真实照片区分开来。
但人工智能图像检测器经过训练,可以看到表面之外的东西。
技术 # 1 - 异常检测
这个过程从异常检测开始,它可以查找任何不属于它的东西。
如果图像的纹理不自然、光照不一致或边缘模糊。 人工智能图像检测器 引起了人们的警觉。
技术 # 2 - 生成对抗网络
检测人工智能生成的图像的一种方法是查看创建图像的技术所留下的隐藏模式。
这些模式来自生成对抗网络(GAN),它为大多数人工智能图像提供了动力。
就像每个艺术家都有自己独特的风格一样,GAN 也能创造出现实世界照片中没有的图案。
人工智能图像检测器 经过训练,人工智能可以识别这些模式,从而帮助确定图像是否由人工智能生成。
技术 # 3 - 元数据
除了查看像素,还可以 人工智能图像检测器 还能检查元数据,元数据就像图像的数字指纹。
这些数据包括照片拍摄的时间、地点和拍摄设备等详细信息。
如果一张图片自称来自 2010 年,但实际上是上周由人工智能工具创建的、 人工智能图像检测器 会将其标记为可疑。
人工智能算法中的偏见及如何减少偏见
人工智能本应是公平的,但有时却并非如此。人工智能的偏见可能有两种情况:
- 数据偏差 - 当某些群体在训练数据中的代表性不足时,就会出现这种情况。
- 模型偏差--当人工智能为一个群体所犯的错误多于另一个群体,从而强化了不公平的结果时,就会出现这种情况。
亚马逊有偏见的招聘工具
2014 年 亚马逊不得不放弃人工智能招聘工具 因为它对妇女有偏见。
该系统从过去的招聘数据中了解到,男性在技术岗位上的受聘人数较多,因此它开始偏爱男性求职者,并对简历中包含 "女性"(如 "女子国际象棋俱乐部")等字眼的求职者进行惩罚。
人工智能并不想不公平,但它从有偏见的数据中学习,并将这种偏见发扬光大。
人工智能数据收集中的隐私问题
每次使用应用程序、浏览网页或购物时,数据都会被收集。
有些信息是显而易见的,比如您的姓名、电子邮件或付款详情。
但还有一些隐藏数据,如 GPS 定位、购买历史、打字行为和浏览习惯。
公司利用这些信息进行个性化体验、推荐产品和改进服务。
面对如此多的数据,风险在所难免:
- 数据泄露 - 黑客可以窃取用户信息。
- 重新识别 - 即使是匿名数据也能与个人联系起来。
- 未经授权的使用 - 公司可能会滥用数据来牟利或施加影响。
即使公司声称对数据进行匿名处理,但研究表明,只要有足够的信息,模式就能揭示用户身份。
为了保护用户隐私,公司正在使用
- 匿名化 - 删除数据集中的个人信息。
- 联合学习 - 人工智能模型在设备上进行训练,无需向中央服务器发送原始数据。(例如,谷歌的 Gboard)。
- 差异化隐私 - 在收集数据前为数据添加随机噪音,以防止被追踪(如苹果公司的 iOS 系统)。
人工智能算法能完全中立吗?
人工智能不是在真空中产生的。
它由人类制造,根据人类数据进行训练,并在人类社会中使用。那么,它能真正做到中立吗?
简短的回答:没有。 至少现在还没有。
人工智能从现实世界的数据中学习,而这些数据带有人类创建数据时的所有偏见、假设和不完善之处。
使用 COMPAS 累犯分析工具、 例如
它旨在预测哪些罪犯最有可能再次犯罪。
听起来很简单,对吗?
但研究表明,与白人被告相比,该算法过多地将黑人被告标记为高风险被告。
它之所以有偏见,并不是因为有人设计了它,而是因为它继承了有缺陷的刑事司法系统的模式。
那么,人工智能能否做到公平呢?
一些专家这样认为。
研究人员已经开发出公平性约束--旨在迫使人工智能模型更平等地对待不同群体的数学技术。
偏差审计和多样化的培训数据集也有助于减少结果偏差。
但是,即使有了这些保障措施,真正的中立也很棘手。
即使我们能让人工智能完全 "中立" 应该吗?
人工智能不会在泡沫中做出决定。它以真实的方式影响着真实的人。
现实情况是,人工智能反映的是我们为其提供的世界。
如果我们想让人工智能不带偏见,就必须首先解决系统中存在的偏见。
否则,我们只是在教机器照搬我们的缺陷--只是速度更快、规模更大而已。
关于人工智能算法的常见问题
最常见的人工智能算法是什么?
神经网络,尤其是深度学习,是当今大多数人工智能应用的核心。
它们为聊天工具(如 ChatGPT)、面部识别软件以及建议下一步观看或购买内容的推荐系统提供了动力。
人工智能算法与机器学习一样吗?
不尽然。人工智能是一把大伞,涵盖了许多不同的技术,而机器学习只是其中的一部分。
机器学习特指人工智能系统从数据中学习模式,而不是遵循严格的预编程规则。
但并非所有的人工智能都依赖于机器学习--有些人工智能使用其他方法,如基于规则的系统。
人工智能算法如何与时俱进?
人工智能通过经验不断进步,就像人类一样。
算法处理的数据越多,就越能发现模式并做出准确预测。
微调参数、使用强化学习等技术以及不断更新训练数据,都有助于提高其性能。
在下面的小工具中试用我们的人工智能检测器和人性化程序,以增强您的体验!
最后的思考人工智能算法的未来
那么,这一切对我们意味着什么呢?
人工智能每天都在影响着我们的决策。它决定我们看什么、买什么,甚至决定我们银行账户的安全程度。
但问题是
如果人工智能在向我们学习,我们在教它什么?
我们是否确保了它的公平、公正和帮助?还是让它重蹈人类的覆辙?
如果人工智能越来越聪明,接下来会发生什么?它将永远是我们控制的工具,还是有一天它会开始做出我们并不完全理解的选择?
也许最大的问题不是人工智能能做什么,而是我们应该让它做什么。
你怎么看?