flex-height
text-black

一位穿着白色实验服的研究人员坐在办公桌前工作,桌上放着几台电脑显示器,旁边还有一个小型机器人。

什么是深度学习?

深度学习是人工智能 (AI) 的一个子集,通过模仿大脑的神经网络从大量数据中学习,从而使机器能够解决复杂问题。

default

{}

default

{}

primary

default

{}

secondary

深度学习的定义

作为机器学习的一种类型,深度学习使计算机能够以类似人脑的方式处理信息。之所以称为“深度”学习,是因为它涉及多层神经网络,这些网络能帮助系统理解和解释数据。利用深度学习技术,计算机可以识别模式并处理复杂任务,例如多语种翻译和自动驾驶汽车。与人类从经验中学习的原理相似,深度学习系统通过分析海量数据不断提升技能与精确度,无需依赖人工手动更新。

了解神经网络

从提出概念到构建感知模型

在 20 世纪 40 年代,神经科学家 Warren McCulloch 和数学家 Walter Pitts 合作提出了首个人工神经网络的概念。为了探究大脑如何基于神经元的简单二元反应,产生复杂的思维模式,他们引入了一个神经元模型,并认为这个模型可以模仿大脑基于二元逻辑执行复杂计算的能力。

在 McCulloch 和 Pitts 开发的神经网络模型中,输入就像神经元接收到的电脉冲。如果某些输入对于特定结果更重要,模型就会通过增加权重来突出这些输入。当这些加权输入超过特定阈值后,神经元就会激活;否则,神经元就处于抑制状态。这种基本的开关机制使他们的模型能够模拟类似大脑的简单决策过程,为深度学习的发展奠定基础。

1957 年,计算机科学家兼心理学家 Frank Rosenblatt 建造了马克一号感知机 (Mark I Perceptron),这台房间大小的机器展示了人工神经元技术的首次实际应用。这台机器使用光电管和人工神经网络来识别图像并对其进行分类,验证了 McCulloch 和 Pitts 理论的有效性。Rosenblatt 的感知机不仅证实了机器学习技术的可行性,还为当今更复杂的深度学习技术的发展铺平了道路。

深度学习的工作原理

深度学习采用预测机制来确定神经网络中的哪些算法最能成功生成符合人类预期的输出。然后,神经网络使用反向传播 (backpropagation) 来优化这些算法,提高成功率。举个例子:

假设您正在训练计算机识别不同音乐流派。神经网络通过分析数以千计的音乐文件,逐步学习捕捉乐器编排、节拍及和弦进行等特征。计算机会先提出一个预测,例如将某个作品识别为摇滚乐,在被告知这个预测是否正确后,它会使用反向传播方法来调整自己的算法。

这与从错误中学习类似。例如,如果计算机错把古典钢琴奏鸣曲当作摇滚乐,那么它会从这个错误中吸取教训,优化算法,确保在今后的预测中更准确地区分古典乐和摇滚乐。经过不断迭代,人工神经网络将能够做出高度精确的预测,并作为一款高效的工具广泛应用在各种场景中,比如根据喜好推荐电影,支持自动驾驶汽车识别道路标志与信号等等。

深度神经网络层详解

下表阐释了深度神经网络的核心组件及其运作的一般顺序。不过,需要注意的是,神经元、激活函数和正则化技术并非孤立的元素,而是贯穿整个神经网络及其学习过程的功能特性。

  1. 输入层

输入层是神经网络的入口,每个神经元分别代表输入数据的一个特征。输入层的主要功能是接收原始数据,并将其传递到后续各层进行进一步处理。

  1. 神经元(节点)

神经元(或节点)是神经网络的基本处理单元。神经元接收并处理输入(先加权求和,再应用激活函数),然后将输出发送到下一层。

  1. 激活函数

激活函数如同神经网络中的决策者,帮助网络对学习内容做出取舍。这些函数提高了神经网络的灵活性,使其能够捕获和学习复杂的模式。常见的激活函数包括 sigmoid、ReLU(修正线性单元)和 tanh。

  1. 权重和偏置

权重是神经网络中的参数,决定了输入数据在网络各层输出中的影响程度。通过与权重相结合,偏置可以确保激活函数能够产生非零输出,从而增强网络的激活和学习效能。

  1. 隐藏层

隐藏层介于输入层和输出层之间,承担着神经网络中的大部分计算任务。之所以称为“隐藏”层,是因为它们不像输入和输出层那样与外部环境直接交互。神经网络的复杂性和功能,在很大程度上取决于隐藏层的数量和结构。

  1. 输出层

输出层是神经网络的最后一层,负责呈现结果,将隐藏层的信息转换为能够解决当前任务的输出形式,例如分类、回归或其他预测类型。

  1. 损失函数

损失函数(或成本函数)用于量化预测输出与实际输出之间的差异。训练的目标是尽量减小该函数,提高模型预测的准确度。

  1. 优化算法

优化算法主要用于对模型进行调优来不断提升其准确性,通过调整权重和偏置来减少预测误差。常见的优化方法包括随机梯度下降(Stochastic Gradient Descent)、Adam 算法和 RMSprop 算法。

  1. 反向传播

反向传播能够帮助模型从错误中学习并不断改进,因此非常重要。这种深度学习算法会计算模型权重变化对精确性的影响,然后逆向追溯误差并调整相关参数,从而提升模型的预测精确性。

  1. 正则化技术

模型常常会因为过度学习训练数据,而导致其在新数据上表现不佳,这一现象称为过拟合。为解决这一问题,可以采用 L1 正则化、L2 正则化和批量归一化等技术调整权重大小,加快训练进程。

  1. 批量归一化

批量归一化技术对每层的输入进行归一化处理,目的是提升神经网络的稳定性、性能和速度。这项技术还有助于降低模型对初始权重的敏感性。

  1. 丢弃法 (Dropout)

作为另一种正则化方法,丢弃法在训练过程中会随机忽略一部分神经元。这样可以防止网络过度依赖某单个神经元,从而减少过拟合现象。

深度学习技术的常见应用

自感知机问世以来,深度机器学习技术已经取得了长足发展。如今,企业无需安装房间大小的机器,而是可以基于云端构建深度学习解决方案。现代深度神经网络能够处理复杂的数据集,成为能够惠及各行各业的实用工具,开辟了曾被视作未来科技的全新应用场景。

汽车行业

深度学习技术可以帮助车辆通过解读传感器数据来进行导航;完善驾驶员辅助系统(如支持危险检测和防碰撞功能);助力优化车辆设计和制造。

业务运营

会话式 AI 聊天机器人虚拟助手智能副驾是热门的深度学习业务应用。通过自动执行手动任务,这些应用能够减少人为错误,加快数据分析和决策速度,并简化跨系统信息检索。

财务

深度学习驱动的算法交易可用于分析市场数据,提供预测性洞察,并通过识别复杂模式来增强欺诈检测。此外,深度学习还能帮助管理风险,评估信用风险和市场环境,推动制定更明智的决策。

深入了解 AI 技术在金融行业的应用

医疗卫生行业

深度学习算法能够帮助提高诊断准确率,从医学影像中发现早期肿瘤等异常情况。这类算法还可以通过预测分子行为来帮助发现新药,推动新疗法开发。

制造

预测性维护使用物联网和深度学习技术来预判设备故障,从而显著减少停机时间。基于大量图像数据集训练的视觉检测系统可通过识别产品缺陷来强化质量管控。

深入了解 AI 技术在制造行业的应用

媒体和娱乐行业

娱乐行业利用深度学习应用在流媒体平台提供内容推荐,并赋能创作人员借助生成式 AI 作曲和生成逼真的计算机生成图像 (CGI)。深度学习算法还可以分析观众偏好,协助创作人员提供定制化内容并预测未来趋势。

零售行业

通过提供个性化产品推荐,深度学习技术全面革新了零售客户体验。这项技术还可以采用预测性分析来预测需求并优化库存水平,从而完善库存管理。

深入了解 AI 技术在零售行业的应用

供应链

在物流运营方面,企业可以借助深度机器学习技术来实时识别交通中断情况,优化配送调度。此外,深度学习技术还能提升供需预测的准确性,支持主动调整策略。

深度学习的优势和挑战

尽管深度学习优势明显,但其技术复杂性也带来了诸多挑战。此外,由于深度学习解决方案需要周密计划和大量资源支撑,因此在设计和部署这项技术之前,企业必须制定明确的目标负责任的 AI 实践

优势
挑战
  • 提高图像和语音识别等任务的准确性
  • 能够处理和分析大量数据
  • 随着数据量的增加,其性能也随之提高
  • 自动提取特征,减少人工干预需求
  • 提供个性化的服务和产品体验
  • 需要大型数据集进行训练
  • 极为耗费计算资源,需要强大的计算处理能力
  • 有可能变成“黑盒”,难以理解模型的决策流程
  • 当训练数据存在错误时,可能会造成不公平的偏见
  • 需要持续的数据和监控,才能长期保持性能

深度学习、机器学习和人工智能的区别

传统机器学习与深度学习之间存在一些关键差异:

机器学习依赖人类手动识别和选择对任务重要的数据特征或特性,例如图像边缘或特定文本词汇。这一训练过程需要投入大量专业知识和人力。

深度学习技术使机器能够自动判定对执行特定任务最重要的数据特征。主要实现方法是,通过神经网络的多个层级处理原始数据(如图像的像素),每一层在前一层输出结果的基础上,将数据转化为更抽象的表示。随着数据量的增加,模型会持续优化这些转换过程,从而不断提升准确性和性能,最终变得越来越高效。

人工智能、深度学习和机器学习对比示例

对于人工智能、机器学习和深度学习的区别,你可能和很多人一样感到困惑。以下关于自动驾驶汽车的真实案例展示了三者之间的具体差异:

人工智能是赋予自动驾驶汽车类人智能和自主性的首要技术,包括机器学习和深度学习。

作为人工智能的子类型,机器学习使自动驾驶系统能够从数据中学习和改进,而无需针对每种场景进行专门编程。

深度学习则是机器学习的特殊子类型,能够处理和解读复杂输入(包括摄像机中的图像数据),实现对环境的实时感知与理解。

深度学习与深度学习模型的区别

“深度学习”和“深度学习模型”这两个术语经常互换使用,但二者之间存在细微差异:

深度学习辐射整个研究领域,涵盖用于训练人工神经网络的理论、技术、算法和流程。

深度学习模型特指经过设计和训练,用于解决特定问题或执行特定任务的具体神经网络。每个模型都是独一无二的,根据特定数据、训练方式和任务量身定制。模型的性能取决于以下因素:

什么是深度神经网络?

深度学习网络(通常称为“深度神经网络”)通过在训练过程中调整神经连接,从海量数据集中学习复杂模式。其主要类型包括:人工神经网络、卷积神经网络、循环神经网络、生成式神经网络和自动编码器。

深度神经网络的类型

特性/类型
人工神经网络
卷积神经网络
循环神经网络
生成式神经网络
自动编码器
主要用途
主要用于回归、分类等一般用途。
图像和视频识别、图像分类。
自然语言处理、语音识别。
图像生成、风格迁移、数据增强。
降维、去噪、特征学习和异常检测。
关键特征
简单性和多功能性。
使用卷积层,自适应地学习空间层级特征
能够按序列处理信息,并保留序列中每一步的信息。
能够生成与输入数据类似的新数据。
使用编码器压缩数据,再用解码器将其还原,从而学习高效的数据表示。
基本概念
模拟人脑的神经元/节点网络。
专门用于处理具有网格状拓扑结构的数据。
专为处理序列或时间序列数据而设计。
由生成器和判别器两个网络组成,通过对抗游戏相互竞争。
专为无监督学习设计,通常用于数据压缩和特征提取。
优点
灵活,可以应用于各种任务。
处理与视觉数据相关的任务时,效率更高,性能更优。
能够通过长短期记忆等改进,学习长期依赖关系。
能够生成新的数据实例,有效提升数据的真实性与多样性。
能高效进行数据压缩,无需标签即可学习显著特征,在其他任务的预训练中非常有用。
挑战
在处理原始高维数据时,可能难以识别复杂模式。
需要大量训练数据才能达到最佳性能。
由于梯度消失问题,难以训练长序列数据。
难以解决训练稳定性和模式崩溃方面的挑战。
若缺乏正则化或数据多样性不足,易出现过拟合问题;且潜在空间的调优较为复杂。
结构特点
完全连接的神经元层。
卷积层、池化层,之后是全连接层。
处理序列的重复单元链。
包含两个网络,一个用于生成数据的生成器和一个用于评估数据的判别器。
利用编码器和解码器对输入进行降维与重构。
数据处理
处理各种数据类型。
高效处理空间数据。
擅长处理序列数据或时间相关数据。
学会生成与真实数据别无二致的新数据。
能够高效地学习给定数据集的压缩表示。

深度学习对基础架构的要求

深度学习需要专门的计算和网络基础架构来处理复杂模型和海量数据集。在常规的计算机硬件或网络上运行深度学习模型并不现实,因此许多组织采用企业级人工智能平台来满足一些硬性要求。以下是基础架构方面的主要考量因素:

高性能 GPU

深度学习基础架构的支柱是高性能图形处理单元 (GPU)。GPU 的设计初衷是渲染视频游戏中的图形,其处理能力非常适合深度学习场景。GPU 能够同时执行多项计算,大幅缩短模型的训练时间,因此成为现代人工智能研究和应用不可或缺的要素。

可扩展存储解决方案

模型可学习的数据越多,其性能表现就越好。这就需要用到可扩展的高速存储解决方案,确保在处理 PB 级数据时不会产生数据检索瓶颈。为了满足此类需求,常常会使用固态硬盘和分布式文件系统来提供高速数据访问,配合 GPU 的高速计算。

高效的数据处理框架

TensorFlow、PyTorch 和 Keras 等框架和库能够提供预构建的函数,无需从头开始大量编码,从而简化深度学习模型的开发。这些工具不仅可以加快开发速度,还能优化训练和推理的计算效率,实现底层硬件的高效利用。

云计算平台

云计算平台在普及深度学习方面发挥着关键作用。此类平台能够按需提供高性能计算资源,无需大量的实体硬件前期投资。此外,云计算平台可以提供各类服务,包括 GPU 实例、可扩展存储和机器学习框架,帮助个人和机构更轻松地创建和部署深度学习模型。

网络基础设施

深度学习模型通常需要在多个 GPU 上甚至跨不同地理位置进行训练,因此必须依托强大的网络基础设施。高带宽连接能够确保数据和模型参数在分布式训练环境节点之间高效传输,尽可能减少延迟并优化训练流程。

深入了解专为商业构建的 AI

了解如何增强和优化人员、数据及流程的互联。

了解更多

常见问题

简单来说,什么是深度学习?
深度学习(又称“深度机器学习”)是一种人工智能技术,让计算机能够模仿人类通过示例进行学习。这项技术采用称之为神经网络的分层算法结构来处理数据、识别模式和进行决策。
深度学习的用例有哪些?
深度学习的一个典型用例是医学影像分析:算法通过分析 X 光、核磁共振 (MRI) 或计算机断层扫描 (CT) 等图像来检测癌症等疾病。这些深度学习系统基于海量医学影像数据集进行训练,能识别出人类肉眼可能忽略的细微模式,协助医生进行早期诊断和制定个性化治疗方案。
深度学习包括哪三种类型?
  1. 卷积神经网络:一个常见的例子是智能手机的面部解锁功能。卷积神经网络通过分析摄像头捕捉的面部特征来验证用户身份,支持快速安全地解锁设备。这一过程需要神经网络从各种图像中进行学习,才能准确识别和确认用户面部特征。
  2. 循环神经网络:非常适合处理序列相关任务,例如预测句子中的下一个词语。这使其在智能手机的输入法预测等应用场景中表现出色,在此类应用场景中,神经网络通过学习用户的输入序列,推荐可能需要输入的下一个词。
  3. 自动编码器:一个实际用例是图像压缩。自动编码器能够缩小图像尺寸进行存储或传输,并在需要时将其恢复至原图质量。该技术可以在保持图像质量的同时,节约图像存储空间。
机器学习和深度学习有何区别?
机器学习泛指计算机通过从数据中进行学习来作出决策或预测的过程。而深度学习是机器学习的一个子集,需要使用包含多个(深度)层次的神经网络。二者的主要区别在于学习的深度:深度学习会自动发现最适合学习的相关数据,而机器学习需要手动指定这类数据。此外,深度学习在处理大型数据集时表现更优,而传统机器学习更擅长操作小型数据集。

深入了解专为商业构建的 AI

了解如何增强和优化人员、数据及流程的互联。

了解更多