最近,一款可以玩转所有人眼球的机器学习Demo创建——DeepWarp,可以通过深度架构移动静态人像上的眼球。它由Yaroslav Ganin、Daniil Kononenko、Diana Sungatullina和Victor Lempitsky联合创建,这项人脸识别技术可以对视频会议过程中目光进行纠错
最近,一款可以玩转所有人眼球的机器学习Demo创建——DeepWarp,可以通过深度架构移动静态人像上的眼球。
它由Yaroslav Ganin、Daniil Kononenko、Diana Sungatullina和Victor Lempitsky联合创建,这项人脸识别技术可以对视频会议过程中目光进行纠错。另外,它还能被运用到“演讲”场景。演讲者在看提词器时的眼球会不自然地盯着提词器,使用这项技术可以使演讲者在镜头面前眼神显得更加自然。
比如,“蒙娜丽莎”
包括下图的基努·里维斯
丝毫没有不自然!
DeepWarp致力于打造现实版的「凝视操控(gaze manipulation)」。虽然类似的项目已经存在,像微笑操纵器FaceApp,但Demo的创建者称其他家都没有像DeepWarp一样做到这么好这么专注于细节。
你如果觉得有趣,也想尝试一下,点击这是DeepWarp的Demo地址。
你只需选择一张人物面向正前方的大头照,水平视角的图像识别效果最好。上传图像后,你有四种移动眼球的选择方式,包括滚动式和十字式。DeepWarp最后会导出一个眼球转动之人的mp4文件。
deepwarp:改变图像的凝视
这项被称为deepwarp的新技术可以让眼镜部分改变,而且丝毫看不出不自然。
它是深度学习在人脸识别上的应用之一。这项神奇的技术是怎么实现的?
在这项工作中,我们会产生给定重定向的目光面对高度逼真的图像任务。我们把这个作为条件的图像生成一个具体的实例,并提出一个新的深层结构,通过与现有技术和用户研究显示数值比较,通过由粗到细的变形与单个像素的附加强度进行校正。操作前端进行时,与不同的操作相关的参数是在端到端的方式一起学习的。学习后,所产生的神经网络可以合成具有操纵凝视图像,而转向角度可任意选择一定范围和提供作为输入到网络。
如果不是专业的技术人员,可能都不太理解,但这不是最重要的。真正有趣的是你可以把任何16张面孔,他们可以向上和向下看,他们可以左移右移,或者他们的眼珠可以打滚。
DeepWarp在应对不同头部姿势时表现相当稳健,并能正确处理戴眼镜的情况。但也有失效的时候,例如,对应于极度倾斜的头部姿势或涉及眼睛不同部分的空洞的大的重定向角度,这些都并非模型设计所固有,设计者称并可运用适当示例增加训练数据来解决。
通过人脸识别了解深度学习
人脸的识别不是关于脸部识别,更多是关于脸部检测!
人脸识别不同于一般的传统模式识别,人脸图像较为复杂,包含丰富的层次信息,数据空间的维数很高。同一个人在不同姿态、不同光照等条件下的图像之间的差别往往比不同人同一成像条件下的图像之间的差别还要大,所以准确区分不同人变得极为困难。
在人脸识别的“浅时代”,机器自动人脸识别技术研究的早期研究者们尝试过用一些非常简单的几何特征来进行人脸识别,基于几何特征的人脸识别很长时间人脸识别都非常依赖于判别性特征的学习,最有代表性的工作莫过于fisherfaces,所谓判别性信息就是那种独一无二特征,就好像成龙的大鼻子,姚晨的大嘴,李勇的招牌马脸,姚明的魔性笑容。总而言之,只要能找到你独特的“气质”就能更好的认识你。
在深度学习出现以前关于人脸检测、特征点定位和人脸识别这三个子任务的研究都是相对独立的展开的。
但是从2012年左右,受深度学习在整个机器视觉领域迅猛发展的影响,人脸识别的“深”时代正式拉开序幕。同时在短短的四年时间里,基于深度卷积神经网络的方法不断在这三个子任务中刷新人工智能算法的世界记录。人脸识别“浅”时代让人眼花缭乱的各种技术和方法仿佛一页之间成为历史。
人脸识别研究人员,不需要在挖空心思的设计特征,也不需要担心后面需要什么样的学习算法。所有的经验的积累过程转换为了深度神经网路算法自动学习过程。这正式深度学习算法最大的优点:自动学习对特定任务最有用的特征!
目前已经证明,自动面部识别的第一步是在任意场景中精确检测人脸,这是最重要的过程。当面部可以精确地位于任何场景中时,之后的识别步骤不再那么复杂。而深度学习也会将带给我们更多意想不到的东西。
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!