当前位置:主页 > 头条 >
    深度学习技术崭露头角 多领域应用落地在望
      时间:2017-09-27 09:45 作 者:

  从互联网搜索到语言翻译,乃至识别患有自闭症风险的基因……凡是需要从大量数据中预测未知信息的领域,都是深度学习可以一展拳脚的地方。那么,什么是深度学习技术?它将怎样改变人类的生活?

  所谓深度学习,就是用多层神经元构成的神经网络,以达到机器学习的功能。这些多层的电脑网络像人类大脑一样,可以收集信息,并基于收集到的信息产生相应的行为。

  人工智能的“机器学习”最早是在20世纪50年代,由英国数学家艾伦·图灵(Alan Turing)提出了。在上世纪60年代,生物学家在研究猫的脑皮层时,发现其独特的网络结构能有效降低反馈神经网络的复杂性,继而提出“卷积神经网络”。利用这种网络结构编写的深度学习程序,适应性很强,成为人工智能的突破口。

  2001年,美国三菱电机研究实验室的保罗·维奥拉和迈克尔·琼斯使用称为自适应增强技术的机器学习算法来实时检测图像中的人脸。

  到了2006年,深度学习开始崭露头脚,而在近几年取得飞速的发展,无论是学术研究还是企业应用均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度学习在多领域发力,取得一系列成功的应用。

  其中最为人所熟知的当属视觉功能。我们的相机可以像眼睛一样看到这个世界,却不能像大脑一样看懂这个世界,深度学习恰恰补上了这个短板。有了深度学习,百度识图可以准确识别照片中的物体类别,并对照片进行自动归类或搜索。有了深度学习,我们可以很方便地刷脸付款。有了深度学习,特制机器可以检测一定空间内所有人员、车辆的行踪,并对可疑和危险事件及时报警。

  同时,深度学习技术在语音识别方面,也有广泛的应用。在深度学习的帮助下,计算机拥有越来越强大的语音识别能力,这可能改变目前仍以键盘为主的人机交互模式。

  例如 音色的定制化,需要跟踪录大量的音库,重新训练一个模型;还有个性化表示方法的定制化,可以录一些数据,通过深度学习训练模型,自适应的方法来实现。

  语音合成主要采用波形拼接合成和统计参数合成两种方式。波形拼接语音合成需要有足够的高质量发音人录音才能够合成高质量的语音,它是商业产品中最常用的语音合成技术。统计参数语音合成虽然整体合成质量略低,但是在小规模语料、低占用资源的情况下,优势更为明显。

  现在,深度学习技术在语音识别、计算机视觉、语言翻译等领域,均战胜传统的机器学习方法,甚至在人脸验证、图像分类上还超过人类的识别能力。专家预计,再过些年,我们口袋里的手机也可以运行像人脑一样复杂的神经网络。





发表评论

最新评论
 
 
热点文章
浏览排行