当前位置: 网站首页 > 联系我们
联系我们
AI换脸背后的技术攻防战
时间:2019-10-27  来源:www.oaled.com

免责声明:本文来自深声微信公众号(ID:deep-echo),作者:赵宇丁仁直,授权业主联盟转载发布。

核心指向

ZAO应用的技术难度不大,没有改进的能力。

合成视频触及了许多人的心理底线:当视频也可以伪造时,你还可以说出真相吗?

为了提高人脸识别的安全性,研究人员做了许多尝试和努力。

除了面部识别,还有各种生物识别技术可用于个人识别。

经过一个周末的集中爆发后,变脸软件ZAO的热量终于降温了。它使用的技术并不新鲜,但它使面部合成视频第一次与普通用户如此接近。

广受批评的用户协议和合成视频的安全问题使得ZAO陷入了舆论的悖论之中。从爆破红色到质疑纠缠不到24小时。

但是,ZAO的担忧和抵制并没有解决普通人的隐私和安全风险问题。从面部合成技术诞生之日起,人们就不再担心使用技术来制造邪恶。

面部合成只是备受追捧的人工智能领域的一个分支。虽然技术为人类带来了许多新颖的经验和便利,但它也使个人担心他们的权利受到侵犯。

当人造技术变得更加强大甚至无所不能时,如何保持人类的领土和独特性成为值得考虑的问题。如今,人工智能的发展已逐渐加速,这种情况已经超出了许多人最乐观的估计。潘多拉的盒子已经打开了。

因此,对ZAO的关注反映了一个存在于每个人心中的根本问题:如果人工智能变得越来越无所不能,那么人类如何表现自己呢?在新一轮的产业转型中,人类如何保护隐私和其他利益?

如何正确使用该技术是一个始终没有标准答案的问题,但它是回答上述问题的关键。

“引爆隐私问题”

过去经过筛选的应用软件不仅仅是ZAO的一个

在朋友圈中,ZAO有很多前辈:face,foot和daily P .就像ZAO一样,过去被屏蔽的大多数应用程序都与图像有关,而且许多用户还需要上传个人照片,但从不引起了它。争议和质疑的规模。

合成视频的能力是ZAO引爆公众讨论的关键:在此之前,图像应用程序是基于静态照片播放的,而ZAO是第一个将视频面部带给每个普通用户的。

在一个从事计算机视觉研究的行业人士看来,ZAO应用的技术难度不是很大:“如果计算机视觉技术最简单,那是最难的,那么你给我一张脸部图片,我就能生成另一个姿势的图像,也许难度是三点,四点,复合视频是生成一系列图片,不再只是一个,难度是五六点,实际上并没有进入突破的顺序。

事实上,在计算机视觉领域,生成图片的技术已经存在:将A的脸部放在B的脸上,Photoshop也可以完成。在深度学习的帮助下,该程序可以快速且大量地绘制P.视频面部合成实际上是视频序列的帧,然后添加检测或视频序列技术以生成面部合成视频。

合成视频,触及许多人的心理底线:当视频也可以伪造时,你能说出什么呢?

无论是今年6月被篡改的马克扎克伯格的视频,还是嫁接在美国女演员脸上的色情视频,都足以让公众关注视频的真实性和安全性。例如,犯罪分子假装他们的孩子的声音被父母勒索。在面部合成的帮助下,视频验证无法确定事实的真相,正如一些网友提醒:“有手机号码,面部图像,由技术合成。罪犯可以为您与家人交谈。 “

大多数人并没有遇到上述极端情况,但人脸识别的广泛应用使得脸部合成更加可以想象。当面部合成加载到移动应用程序中并成为每个人都可以触及的技术时,类似的问题无疑会被放大,在安全性,支付,出勤和刑事调查方面更加现实和完美无瑕。合成技术确实带来了很多安全风险。

幸运的是,围绕人脸识别的攻防战已经开始,经过多次遭遇,技术升级后的人脸识别并不容易被打破。

“技术攻击和防御”

面部合成只是计算机视觉研究的一个细分。作为致力于使机器理解物体的科学,计算机视觉研究已经存在了很长时间。 1966年,人工智能科学家明斯基为学生分配了一项家庭作业:编写一个程序告诉计算机它通过摄像机看到了什么,这被认为是计算机视觉的最早任务描述。计算机视觉今天能够产生如此多的新颖和有趣的应用程序的原因与深度学习的发展是分不开的。

2006年,深度学习巨头Geofrey Hinton在《Science》发表了一篇论文《A fast learning algorithm for deep belief nets》,该论文推动了人工智能的浪潮,直到今天。

深度学习在国内产业中的普及与百度密切相关。

2013年1月,百度正式宣布成立深度学习研究所(IDL)。李艳红亲自成为院长,中国的“千人计划”全国专家和现任地平线创始人余凯是副总裁。 2014年,IDL的Deep Speech项目将嘈杂环境中的语音识别准确率提高到81%。与此同时,Bing,Google和Wit.AI的最高识别率仅为65%。这是国内产业深度学习应用的典范,引发了人们对深度学习的关注。

由于这一点,人工智能相关的应用程序在过去几年中迅速增长。其中,人脸识别是具有广泛应用的技术之一。如今,面部识别已被广泛应用于金融,安全和出勤等领域。例如,当用户从互联网金融公司借款时,平台需要做的第一件事就是“验证你是你。”因为它与金钱直接相关,所以拦截伪造的面部攻击很重要。

ZAO的面部合成技术引起人们担忧的一个场景是:合成面孔会导致安全问题吗?这个问题引起了研究人员的注意。为了提高人脸识别的安全性,他们做了很多尝试。

支付宝,超级热,知道你不必担心刷脸。

2018年7月,无知技术产品总监彭建红在一个开放的在线课程中表示,在人脸识别领域,目前最流行的攻击方法包括:图像攻击(使用合法用户的纸张打印欺骗,彩色打印照片) ,照片保存在手机等)。视频攻击(预先录制的视频播放,包括眨眼,转动,张开嘴等动作指令欺骗,属于实时攻击),立体声掩码攻击(使用预伪造掩码欺骗,属于非实时攻击)等方法。

研究人员非常重视可以应对体内攻击的检测方案,包括运动活检,视频活检,炫目活检,双角活检等。

一种无知的人脸识别方案

运动活检检测:用户需要根据UI提示点头并摇头。每个随机操作都是从计算机服务器发送的。计算机通过面部质量检测,关键点检测和跟踪以及面部3D姿势的技术细节提高了人脸识别的准确性。

视频活检检测:主要针对移动H5场景,用户需要根据UI提供的内容读取四位数字,计算机通过云识别,语音同步检测等方法判断检测到的人脸是否真实。

彩色活检检测:根据反射光三维成像原理,消除了由3D软件合成的视频和屏幕重拍的攻击。在强光环境下,炫丽生物体的检测效果不是很好,因此用户可能需要做一个简单的点头来提高实时攻击的门槛。

●双角度体内检测:用户需要拍摄自拍和侧面照片。该检测方法相当于用户拍摄1-2秒的视频,并且计算机使用3D模型重建方法来确定视频是否在视频中。对于真人来说。

●静音体内检测:无需用户做任何动作,自然面对相机3或4秒。由于真面并非绝对静止,但有微观表情,如眼球的节奏,眨眼,嘴唇和周围脸颊的扩张等,电脑可以通过这些功能欺骗。

各公司使用的生活检测方法不同。最常用的是莫尔条纹(数码相机或扫描仪等光敏元件上出现的高频干涉条纹,这是一种高频率,使图像看起来是彩色的。正常条纹)。然而,对于假面罩,不能识别出莫尔条纹。此时,只需向机器输入大量的面罩图片,让机器找到面罩特征,然后将莫尔条纹组合起来,即可有效拦截。

吸取技术的彭建红也提到,基于云中大量人脸数据训练的FMP深度神经网络可以根据在线数据实时返回和调整,从而不断提高识别准确率,实现有效识别。重拍和掩盖攻击。

通过上述几种检测方案,计算机可以区分检测到的面部是真实面部还是伪造面部攻击。

“除了脸,

还有哪些其他武器能够保持真正的防线?“

证明你是你,面子不是唯一的标记。除了人脸识别之外,还有各种生物识别技术可以应用于个人识别领域。

生物识别技术通常基于光学,声学,生物传感器和生物统计学的组合。它利用人体固有的生理和行为特征来识别个体。生物识别技术具有无损,易遗忘,防伪性能好等特点,引起了研究者的广泛关注,其中指纹识别,虹膜识别等识别方法得到了广泛的应用。

指纹识别:指纹分类和识别对象的比较用于区分它们。目前,中国已经形成了完整的指纹识别产业链,如惠定科技,一家从事指纹芯片设计的上市公司。此外,还有国内指纹识别芯片厂商如Sinover,Fernger,Myrewei等。

虹膜识别:由于虹膜从胎儿发育阶段到死亡期间保持不变,因此它具有很强的稳定性,这决定了识别的唯一性,因此可以根据眼睛中的虹膜进行识别。目前,虹膜识别已经被广泛应用于金融,医疗,安全,安全,特殊行业考勤和门禁,工业控制等领域,具有超高的准确性和便利性。国内代表厂家有红坝,红星科技,巨红光电,武汉宏讯,大华码解释等。

步态识别:目的是通过他们的步行姿势识别人。由于它不需要人类行为的配合,很难伪装,因此特别适合远程识别。步态识别采集装置简单,经济,甚至只需要监控摄像头。目前,在中国步态识别领域的企业中,最着名的是银河水滴。

●声纹识别:声纹识别是将声音信号转换为电信号,然后由计算机识别,包括说话人识别(如缩小刑事调查范围)和说话人确认(如银行交易)。声纹识别方便,成本低,适合远程操作,但同时也容易受到环境噪声的影响,在某些场景下难以提取声纹特征。因此,声纹识别目前主要用于身份安全要求不太高的一些场景,例如扬声器等智能硬件。目前,Keda Xunfei,Spirit,Yunzhisheng等国内公司已经推出了相应的声纹识别技术。

我们每天使用的微信也采用声纹识别技术

●手掌静脉识别:首先,通过静脉识别器获取手的手指,手掌和背静脉的图像,然后将捕获的手掌静脉分布图存储在计算机系统中用于随后的识别。手掌静脉识别易于使用,识别快速且高度准确。然而,由于手掌静脉识别的产品的缺点,例如小型化困难,制造成本高以及对收集设备的特殊要求,目前的应用并不广泛。目前,国内知名企业包括富士通,通源微智能科技和智迈科技。

上述识别方法中的每一种都以不同方式显示在胶片中。例如,在《谍中谍5》中,“步态识别”已成为Atango获取信息的最大障碍。

虽然上面提到的生物识别技术有自己的阈值,但它们并非牢不可破。在人工智能技术加速发展的时候,一些识别方法,如人脸识别,正面临着更大的挑战。

根据量子比特报告,斯坦福大学和普林斯顿大学的最新研究:给定任何文本,您可以自由更改视频中角色所说的单词。此外,在更改关键字后,角色的嘴形可以非常准确,并且没有篡改的痕迹。 AI也可以制作假声音。

技术的进步给了我们更多的盔甲,但也暴露了我们更多的弱点。