人工智能发展的热点投影 近期,清华大学-中国工程院科学知识智能牵头研究中心、中国人工智能学会吴文俊人工智能科学技术奖票选基地牵头公布了《2019人工智能发展报告》,甄选了13个人工智能的重点领域,还包括深度自学、计算机视觉、语音辨识、机器人等热点前沿技术的基础及应用于研究、发展动向等。 深度自学让图像、语音等感官类问题获得突破 机器学习是一门多领域交叉学科,专门研究计算机怎样仿真或构建人类的自学不道德,以提供新的科学知识或技能。 1950年,阿兰·图灵建构了图灵测试来判断计算机否智能。
图灵测试指出,如果一台机器需要与人类进行对话而无法被分辨出有其机器身份,那么称之为这台机器具备智能。这一修改使得图灵需要令人信服地解释“思维的机器”是有可能的。
后来,IBM科学家亚瑟·塞缪尔研发的象棋程序,驳倒了普罗维登斯明确提出的机器无法打破人类的论点,像人类一样写出代码和自学的模式,他建构了“机器学习”这一术语。 然而,从20世纪60年代中期到70年代末期,机器学习的发展步伐完全衰退。无论是理论研究还是计算机硬件容许,整个人工智能领域的发展都遇上了相当大的瓶颈,神经网络学习机因理论缺失也没能超过预期效果而转至低潮。直到伟博斯在神经网络偏移传播(BP)算法中明确明确提出了多层感知机模型,机器学习以求挽回,并且直到今天BP算法依然是神经网络架构的关键因素。
神经网络研究人员陆续明确提出了用于BP算法训练的多参数线性规划的理念,沦为后来深度自学的基石。在另一个谱系中,昆兰明确提出了一种十分有名的机器学习算法,具体地说是ID3算法,这种算法至今依然活跃在机器学习领域中。 机器学习步入愈演愈烈期是神经网络研究领域领军者Hinton在2006年明确提出了神经网络Deep Learning算法,使神经网络的能力大大提高。
Hinton和他的学生 Salakhutdinov在《科学》上公开发表了一篇文章,打开了深度自学在学术界和工业界的浪潮。 2015年,为纪念人工智能概念明确提出60周年,LeCun、Bengio和Hinton发售了深度自学的牵头综述。
深度自学可以让那些享有多个处置层的计算出来模型来自学具备多层次抽象化的数据的回应,这些方法在许多方面都带给了明显的提高。深度自学的经常出现,让图像、语音等感官类问题获得了确实意义上的突破,离实际应用于已如此之近,将人工智能前进到一个新时代。 计算机视觉费伊人脸识别、智能视频监控等应用于 计算机视觉,顾名思义,是分析、研究让计算机智能化地超过类似于人类的双眼“看”的一门研究科学,即对于客观存在的三维立体化的世界的解读以及辨识依赖智能化的计算机去构建。
计算机视觉技术就是利用了摄像机以及电脑替代人眼使得计算机享有人类的双眼所具备的拆分、分类、辨识、追踪、判断、决策等功能。 马尔(David Marr)《视觉》一书的问世,标志着计算机视觉沦为了一门独立国家学科。计算机视觉40多年的发展中,尽管人们明确提出了大量的理论和方法,但总体上说道,计算机视觉经历了三个主要历程:马尔计算出来视觉、多视几何与分层三维重建和基于自学的视觉。 目前,在计算机下调“深度网络”来提升物体辨识的精度或许就相等专门从事“视觉研究”。
马尔的计算出来视觉分成三个层次:计算出来理论、传达和算法以及算法构建。由于马尔指出算法构建并不影响算法的功能和效果,所以马尔计算出来视觉理论主要辩论“计算出来理论”和“传达与算法”二部分内容。 马尔指出,大脑的神经计算和计算机的数值计算出来没本质区别,所以马尔没对“算法构建”展开任何探究。
从现在神经科学的进展看,“神经计算”与数值计算出来在有些情况下不会产生本质区别,如目前蓬勃发展的神经形态计算出来,但总体上说道,“数值计算出来”可以“仿真神经计算”。最少从现在看,“算法的有所不同构建途径”,并不影响马尔计算出来视觉理论的本质属性。 20世纪90年代初,计算机视觉从“不景气”南北“兴旺”,主要归功于以下二方面的因素:一方面,射击的应用领域从精度和鲁棒性拒绝太高的“工业应用于”并转到拒绝不太高,尤其是意味着必须“视觉效果”的应用领域,如远程视频会议、考古、虚拟现实、视频监控等;另一方面,人们找到,多视几何理论下的分层三维重建能有效地提升三维重建的鲁棒性和精度。 多视几何的代表性人物首数法国INRIA的O.Faugeras,美国 GE研究院的R.Hartely和英国牛津大学的A.Zisserman。
2000年Hartely和Zisserman年出版的书对这方面的内容得出了较为系统的总结。大数据必须全自动修复,而全自动修复必须重复优化,而重复优化必须花费大量计算资源。荐一个非常简单例子,假如要三维重建北京中关村地区,为了确保修复的完整性,必须提供大量的地面和无人机图像。
假如提供了1万幅地面高分辨率图像(4000×3000)、5千幅高分辨率无人机图像(8000×7000),三维重建要给定这些图像,借此挑选适合的图像集,然后对照相机方位信息展开标定并修复出有场景的三维结构,如此大的数据量,人工干预是不有可能的,所以整个三维重建流程必需全自动展开。 基于自学的视觉,则是指以机器学习为主要技术手段的计算机视觉研究。
基于自学的视觉研究,文献中大体上分成二个阶段:21世纪初的以流形自学为代表的子空间法和目前以深度自学为代表的视觉方法。 近年来,巨量数据的不断涌现与计算能力的较慢提高,给以非结构化视觉数据为研究对象的计算机视觉带给了极大的发展机遇与挑战性难题,计算机视觉也因此沦为学术界和工业界普遍认为的前瞻性研究领域,部分研究成果已实际应用于,费伊人脸识别、智能视频监控等多个极具表明度的商业化应用于。 语音辨识被应用于工业、通信、医疗等行业 语音辨识是让机器辨识和解读说出人语音信号内容的新兴学科,目的是将语音信号改变为文本字符或者命令的智能技术,利用计算机解读讲话人的语义内容,使其听不懂人类的语音,从而辨别说出人的意图,是一种十分大自然和有效地的人机交流方式。
语音辨识的研究工作可以追溯到20世纪50年代。在1952年,ATT贝尔研究所研究顺利了世界上第一个语音识别系统Audry 系统,可以辨识10个英文数字发音。这个系统辨识的是一个人讲出的孤立无援数字,并且相当大程度上依赖每个数字中的元音的共振峰的测量。
计算机的应用于推展了语音辨识技术的发展,用于了电子计算机展开语音辨识,明确提出了一系列语音辨识技术的新理论——动态规划线性预测分析技术,较好地解决了语音信号产生的模型问题。在20世纪70年代,语音辨识研究获得了根本性的具备里程碑意义的成果,预示着自然语言解读的研究以及微电子技术的发展,语音辨识领域获得了突破性进展。这世纪末的语音识别方法基本上是使用传统的模式识别策略。
后来,语音辨识研究更进一步南北了解。这世纪末所获得的重大进展有:隐马尔科夫模型(HMM)技术的成熟期和不断完善,并最后沦为语音辨识的主流方法;以科学知识为基础的语音辨识的研究日益受到重视。在展开倒数语音辨识的时候,除了辨识声学信息外,更好地利用各种语言科学知识,诸如构词、句法、语义、对话背景等方面的科学知识来协助更进一步对语音辨识和解读。
同时在语音辨识研究领域,还产生了基于统计资料概率的语言模型;人工神经网络在语音辨识中的应用于研究蓬勃发展。ANN具备较好的区分简单分类边界的能力,似乎它十分有助模式识别。
在这些研究中,大部分使用基于偏移传播算法(BP算法)的多层感官网络。 语音辨识技术渐渐南北实用化,在创建模型、萃取和优化特征参数方面获得了突破性的进展,使系统具备更佳的自适应性。
许多发达国家和知名公司都投放大量资金借以研发和研究实用化的语音辨识产品,从而许多具备代表性的产品问世。比如IBM公司研发的汉语ViaVoice系统,以及Dragon公司研发的DragonDictate系统,都具备说出人自适应能力,能在用户用于过程中大大提升识别率。
21世纪之后,深度自学技术很大地增进了语音辨识技术的变革,使其辨识精度大大提高,应用于获得普遍发展。2009年,Hinton将深度神经网络(DNN)应用于语音的声学建模,在TIMIT上取得了当时最差的结果。2011年底,微软公司研究院的俞栋、邓力又把DNN技术应用于在了大词汇量倒数语音辨识任务上,大大降低了语音辨识错误率。
从此语音辨识转入DNN-HMM时代。DNN带给的益处是仍然必须对语音数据分布展开假设,将邻接的语音帧拼凑又包括了语音的时序结构信息,使得对于状态的分类概率有了显著提高。
同时DNN还具备强劲环境自学能力,可以提高对噪声和口音的鲁棒性。 目前,语音辨识技术已渐渐被应用于工业、通信、商务、家电、医疗、汽车电子以及家庭服务等各个领域。
例如,现今风行的手机语音助手,就是将语音辨识技术应用于到智能手机中,需要构建人与手机的智能对话,其中还包括美国苹果公司的Siri语音助手、智能360语音助手、百度语音助手等。 机器人与有机生命更加相似 机器人广义上还包括一切仿真人类不道德或思想以及仿真其他生物的机械(如机器狗、机器猫等)。目前,智能机器人已沦为世界各国的研究热点之一,沦为取决于一国工业化水平的最重要标志。
机器人技术最先应用于工业领域,但随着机器人技术的发展和各行业市场需求的提高,在计算机技术、网络技术、MEMS技术等新技术发展的推展下,近年来,机器人技术于是以从传统的工业生产领域向医疗服务、教育娱乐、勘探勘测、生物工程、救灾救援等领域很快拓展,适应环境有所不同领域市场需求的机器人系统被深入研究和研发。过去几十年,机器人技术的研究与应用于,大大推展了人类的工业化和现代化进程,并逐步形成了机器人的产业链,使机器人的应用于范围也日益普遍。 在机器人崭露头角于工业生产的同时,机器人技术研究不断深入。
1961年,美国麻省理工学院Lincoln实验室把一个备有认识传感器的遥控操纵器的从动部分与一台计算机连结在一起,这样构成的机器人可以凭触觉要求物体的状态。随后,用电视摄像头作为输出的计算机图像处理、物体识别的研究工作也相继获得成果。
1968年,美国斯坦福人工智能实验室的J.McCarthy等人研究了精致的课题——研制具有手、眼、耳的计算机系统。于是,智能机器人的研究形象渐渐甜美一起。 20世纪70年代以来,机器人产业蓬勃蓬勃发展,机器人技术发展为专门的学科。工业机器人首先在汽车制造业的流水线生产中开始大规模应用于,随后,诸如日本、德国、美国这样的制造业发达国家开始在其他工业生产中也大量使用机器人作业。
后来,机器人朝着更加智能化的方向发展,这种机器人具有多种传感器,需要将多种传感器获得的信息展开融合,需要有效地适应环境变化的环境,具备很强的自适应能力、自学能力和自治权功能。 智能机器人的发展主要经历了三个阶段,分别是可编程试教、重现型机器人,有感官能力和自适应能力的机器人,智能机器人。
其中所牵涉到到的关键技术有多传感器信息融合、导航系统与定位、路径规划、机器人视觉智能控制和人机接口技术等。 转入21世纪,随着劳动力成本的大大提升、技术的不断进步,各国相继展开制造业的转型与升级,经常出现了机器人替代人的热潮。同时,人工智能发展日新月异,服务机器人也开始走出普通家庭的生活。 世界上许多机器人科技公司都在大力发展机器人技术,机器人的特质与有机生命更加相似。
最近,波士顿动力公司在机器人领域的成就早已沦为人们的焦点,其产品机器狗Spot和双足人形机器人Atlas都让人大为赞叹。Spot的功能十分先进设备,可以前往你告诉他它要去的目的地,避免障碍,并在极端情况下保持平衡。
Spot还可以身负多达四个硬件模块,为公司获取其他多款机器人已完成特定工作所需的任何技能;Atlas早已掌控了腿、360度旋转、转动等多项技能,时隔演出跑酷、后空翻等绝技之后,Atlas又掌控了一项新技能——体操,再度让人们大开眼界。
本文来源:竞博JBO官方网站入口-www.792586.com