友谊宾馆的甘·法明

量子位报告

人工智能驱动的上汤ar已经登陆多个场景。

刚才,由ieee主办的2019混合增强现实国际研讨会(ismar 2019)在北京召开。

汤晓鸥(Tang Xiaoou),汤棠科技创始人,香港中文大学教授,透露了汤棠最新的ar研究进展和布局。

此外,这不仅仅是展示你的肌肉。他还进一步介绍了ar目前在各个领域面临的挑战,以及相应的解决方案和核心技术。

在他看来,ar当时是:

今天的人工智能技术使我们能够更好地理解现实世界,而ar技术可以无缝地将现实世界和虚拟世界结合起来。

不仅仅是他有这种感觉。

目前,苹果和谷歌正在大批军队的条件下发展ar生态。高通公司和其他基础计算能力提供商也认为5g正在加速新计算平台的到来,而且它是ar。

汤小鸥说,汤已经摆了很多年了。

近年来,人工智能和增强现实技术已经深入到产品开发中,有效地拓展了增强现实应用的想象力。

那么,作为中国最有价值的人工智能公司,上塘是如何规划的呢?

核心技术和亮点是什么?~让我们看看~

唐晓鸥谈ar

唐先生演讲的主题是艾尔:空气中的魔法。

简单的开场白后,我马上就说到点子上了——怎么样?

在他看来,ar是一种在现实生活场景中无缝集成虚拟对象或信息的技术。

与传统的文本、图片和视频相比,它可以更有效、更直观地提供信息。

人工智能技术以现实世界的信号为输入,实现场景感知、语音交互、图像识别、人脸检测、情感认知等任务,现在已经成熟。

随着大数据、云计算和5g技术的发展,基础技术框架已经形成。

Ar是这个基本框架的应用和这些技术的直接立足点。

现在,随着这些技术的成熟和落地,ar也开始进入我们的生活,从黑色技术转变为日常应用。

与唐老师以前的大部分演讲不同,这次演讲刚刚开始,他就推出了自己最喜欢的电影《爱的心情》(In the Mood for Love),这部电影直观地展示了阿尔艾带来的“魔法”,并在现场引起了恐慌。

接下来,ar化妆是唐晓鸥演讲中提到的第一个场景。

在这个场景中,如何捕捉面部特征是核心。

他说,这是许多人脸应用的关键一步,如人脸识别、三维人脸重建和人脸编辑。

还有许多自然的挑战。例如,没有足够的特征点、缺乏准确的数据、遮挡下难以预测、运动模糊等。

针对这些挑战,唐先生还介绍了相应的解决方案:

虹膜轮廓特征点和耳朵特征点可以补充特征点。

半监督框架和结构感知去模糊网络可以解决数据缺乏、遮挡和运动模糊等问题。

之后是ar导航,这对于ar着陆来说也是一个非常困难的场景。

唐老师说,虽然传统的导航方案,如全球定位系统、无线网络和蓝牙,很受欢迎,但它们都有各种缺点。

例如,如果误差超过10米并且不能在室内使用(全球定位系统);硬件价格昂贵,需要额外部署(wifi、蓝牙等)。)。

相比之下,可视化解决方案具有成本低、精度高、效果直观等优点。

然而,也存在挑战,例如缺乏视觉特征、环境变化以及需要大量计算。

然而,这并没有阻止ar导航成为一个新的风向。

基于基于学习的视觉特征、云协作、同步定位和地图构建(slam)等技术,稀疏地图重建、密集地图重建和视觉定位等相关应用越来越成熟。

此外还有ar数字人,这也是近年来最流行的ar应用之一。

简而言之,ar Digital Man使用人工智能技术来驱动数字代理说话和行动。

说到使它实用,仍然有许多挑战,例如,很难将音频映射到3d,如何保持连续性等。

唐老师也给出了相应的思路,利用跨模态机器学习、连续时间序列建模等方法,可以更好地解决这些问题。

汤汤也提供了相应的解决方案,感知现实化身。

唐老师说,借助弱监督学习,可以有效完成基于视图合成的几何感知表示和基于图像的排名预测、运动捕捉、三维运动恢复和运动传递。

接下来是ar游戏,其背后的关键技术是同步定位和地图构建(slam)。

与大多数当前的ar游戏不同,尚唐专注于移动端的多人ar游戏,这也带来了新的挑战——如何让多个用户参与进来。

唐老师说要意识到这一点并不容易。不仅应在具有挑战性的环境中保持稳定性,还应考虑移动设备在大规模场景中的性能。

作为ar的一项关键技术,上塘在slam上也投入了大量的资源。与现有的传统方案相比,它不仅效率更高,而且更加稳定。

他还给出了相应的数据。支持多人ar游戏时,定位时间不到1秒。

汤老师谈到的最后一个场景,是ar尺子