当前位置:IT信息 > 正文
人脸识别的新挑战 美两大学在研制AI“欺骗”人类

  美国华盛顿大学的计算机科学家团队研究人员开发了一种机器学习算法,可以将声音片段变成能口型一致的视频内容。研究人员使用人工智能(AI)制作了一段美国前总统巴拉克·奥巴马(Barack Obama)谈论恐怖主义等多个话题的场景,视频中呈现的是奥巴马先前从未发表过的言论,相当逼真,毫无破绽,但这实际上却是使用现有的视频演讲人工生成的片段。

  在网络飞速迅速发展的今天,网络上充斥着各种鱼目混珠的文字类假新闻,这已不足为奇。各种合成图片和剪辑视频遍布微博、微信、论坛,使人真假难辨,生成以假乱真的假新闻视频一天比一天容易。华盛顿大学的研究人员相信,该系统可以最终用于改进视频通话,甚至确定某段视频的真伪。

  该系统对神经网络进行训练,使其学会观看人类讲话的视频,他们能将任意奥巴马音频片段生成真实的口型,之后将口型进行处理使其看起来更加逼真,并覆盖到不同 “目标”视频中的奥巴马面部。最终,研究人员会调整目标视频的时间,使得奥巴马的表情看起来自然,且与语言表达节奏相符。为了实现这一目标,他们将该校图形实验室之前的研究成果,与最新的口型合成技术结合起来。并且该技术还可以实现小幅时移,从而让神经网络预测说话者接下来所要表达的内容。

  该团队之所以选择奥巴马,是因为这套系统需要14小时的视频进行学习,而奥巴马每周都有为时17个小时的演讲素材,他显然是最佳人选。

  斯坦福大学的尝试

  此前外媒曾报道,去年6月,斯坦福大学研发出一款人脸跟踪软件Face2Face,它可以通过摄像头捕捉用户的动作和面部表情,然后使用Face2Face软件驱动视频中的目标人物做出一模一样的动作和表情,效果极其逼真。

  有了这项黑科技,你可以控制普京、奥巴马、布什等大人物在视频中做出任何你想要的怪表情,像这样:

  到底谁真谁假?

  这款软件的根本原理是使用一种密集光度一致性方法(dense photometric consistency measure)来实时跟踪源和目标视频中的面部表情。研究人员们称,由于源素材与被拍摄者之间快速而有效的变形传递,从而使复制面部表情成为可能。由于嘴形与其所说的内容高度匹配,因此可以产生非常准确、可信的契合。

  此前有公司为防止网上身份冒用,采用人脸识别的方式进行网上身份识别,但是随着科技发展,仿真头套、全息投影、人脸跟踪等高科技攻击手段不断出现,未来随着高科技的普及,人脸识别的攻击成本将不断降低,在线上不可控的环境中,不法分子将很容易伪造人脸视频通过身份认证。并且由于生物特征的不可撤销性,一旦生物特征信息泄露,基于生物特征的身份识别系统将彻底崩溃,因此大规模的网上身份识别绝不能依靠人脸识别!

  视频真伪难判定

  目前视频合成技术的有效性受到指定人物的可用视频素材数量和质量限制。研究报告指出,AI算法至少需要几个小时的视频素材,无法处理某些边缘情况,例如面部轮廓。未来该算法或许只需要使用1个小时的视频就能识别某人的声音和说话模式。研究人员选择将奥巴马作为首个研究范例,不仅是因为奥巴马每周的演讲视频提供大量公开可用的高清晰素材(直面镜头),更因为其语调没有太大的起伏。而且这种神经网络目前只能一次学习一个人,该团队未来可能会开发各种算法来判断一段视频的真伪。

  其它公众人物视频更具挑战性,对技术要求更高。据《经济学人》(The Economist)本月初报道,有一种解决方案可能要求录音包含元数据,即显示捕获录音的时间、地点以及方式。了解这些数据也许能从根本上剔除假图片,例如当时的已知局部特征不匹配。

  由于各种新型假新闻充斥网络,消费者要擦亮眼睛、理性判断。而在社交网络上晒太多照片,在使用视频聊天工具保存的大量视频等网民的个人信息,这些是否在未来会带来安全隐患,也应值得关注。

相关链接:

作者: 来源:安知讯 发布时间:2017-08-02 07:12:16
 
 
  我要发表留言  查看所有评论
 

*
 限制字数显示剩余字数,最大长度: 500 还剩: 500
用户名:
       尊重网上道德,承担一切因您的行为而直接或间接导致的民事或刑事法律责任