技术跨界:当AI遇见VR/AR,会发生什么?
发布时间:2020-07-06 11:23 来源: 93913
AI与VR/AR,皆为当前高新技术的大热点。据全球最大的IT研究与咨询公司Gartner在2020年发布的未来五到十年内将带来重大机遇的十大技术趋势,前两大趋势分别与AI与VR有关。其中的趋势1:超自动化(Hyper automation),其目标是综合利用人工智能(AI)和机器学习(ML)等手段,实现流程自动化和增强人类的工作能力;趋势2:多元体验(Multi-experience),目标是通过AR,VR,MR等技术带来身临其境的体验,将目前的单点交互演变为以可穿戴设备和传感器等为基础的多点交互。那么,如果将AI与VR/AR结合呢,会发生什么?
AI(人工智能)
我们先来梳理一下人工智能(AI),以及相关的机器学习(ML)和深度学习(DL)等热点概念。大家所谈论的人工智能可以分为两个层面:“强人工智能”和“ 弱人工智能”。其中:
弱人工智能
希望借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动,类似于“高级仿生学”。
强人工智能
希望研制出达到甚至超越人类智慧水平的人造物,具有心智和意识、能根据自己的意图开展行动,可谓“人造智能”。
AI技术现在所取得的进展和成功,是缘于“弱人工智能”而不是“强人工智能”的研究。要想让AI借鉴人类的智能行为,关键的一个环节是让AI模拟人类的学习行为。
所以,这里面有个非常关键的技术,叫做机器学习。
机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
目前的机器学习可以分为三大类:
(1)有监督的学习
数据具备特征(features)和预测目标(labels),又分为:
二元分类
多元分类
回归分析
(2)无监督的学习
从现有数据并不知道预测的答案,无预测目标(labels)
(3)强化学习
通过定义的动作、状态和奖励不断训练,使其学会某种能力。
机器学习有一个很有意思的技术,叫做人工神经网络。
人工神经网络(ANN:Artificial Neural Network)是一种模拟人脑神经网络以期能够实现类人工智能的机器学习技术。它可实现函数逼近、数据聚类、模式分类、优化计算等功能。 因此,神经网络广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。
通过这两张图的对比,我们可以看到,机器学习中的人工神经网络很好地借鉴了人类神经网络的特点,是一种非常有意思的仿真。
而深度学习是一种特殊的机器学习,是机器学习研究中的一个新领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
深度学习能直接对大量数据进行表征学习,来替代手工获取特征。深度学习与传统机器学习最主要的区别在于:随着数据规模的增加其性能也不断增长。引发深度学习热潮的一个标志性事件是:2016年3月,AlphaGo(谷歌旗下DeepMind研发)击败了李世石九段。
相应的,深度学习有一个非常重要的技术,叫做卷积神经网络。卷积神经网络(Convolutional Neural Network, CNN)是一种典型的深度神经网络,它避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。
我们用一张图来梳理一下人工智能、机器学习、深度学习的关系:
VR/AR与AI的跨界关联
1. VR对AI的需求
(1)制约VR/AR发展的一个很重要因素,是3D内容的产能
3D内容(包括3D模型、3D动画,和3D交互等)是VR/AR核心之一。然而,目前各个领域的3D内容尚需要大量人工进行制作,而且对制作人员的门槛要求相对较高,因而产能非常低,这是制约相关行业发展的一大瓶颈。而AI则有望一定程度上实现3D内容制作的自动化,替代部分重复劳动,并提升制作效率。
(2)VR/AR需要更加自然的交互
VR和AR的目标都包含了更加自然的交互,这正是AI要解决的目标之一。
(3)VR/AR需要更强的智能
AlphaGo和AlphaZero证明了AI在一定领域内的智能,而这些领域与VR和AR存在重合,有望弥补VR和AR的智能性。
2. AI对VR的需求
(1)AI需要可视化的赋能效应呈现
AI的赋能效应,对于普通人而言是很难直观理解的,在诸如教育等很多场景中,人们都需要可视化的手段来呈现和辅助理解AI运用之后的效果。
(2)AI需要落地的应用场景
AI经历了自2016年以来的大热,到今天,不管是投资人,还是普通百姓,并没有完全看到AI在所有应用场景都能落地,于是,AI泡沫论喧嚣而上。而VR与AR能在很大程度上拉近AI与行业实际用户的距离,助力AI的落地。
3.与VR密切相关的人工智能
图像识别-分类
图像识别-检测
图像语义分割/实例分割
图像/图形检索
图像/图形生成
强化学习、模仿学习
声明:本站在转载文章时均注明来源出处,转载目的在于传递更多信息,未用于商业用途。如因本站的文章、图片等在内容、版权或其它方面存在问题 或异议,请与本站联系(电话:020-37784831,邮箱:edit@fly-tech.com.cn),本站将作妥善处理。
推荐阅读