利用深度学习、虚拟现实等生成合成类算法制作图像、音频、视频、虚拟场景等信息的深度合成技术,已在多个领域大量应用,但与此同时,恶意使用该技术生成的音视频,也显现出了巨大的破坏力,给个人、企业造成了声誉损害和财产损失,也对社会、国家安全造成威胁。
为了对人工智能和深度合成技术的健康发展提供参考和指引,清华大学人工智能研究院、北京瑞莱智慧科技有限公司、清华大学智媒研究中心、国家工业信息安全发展研究中心、北京市大数据中心近日联合发布《深度合成十大趋势报告(2022)》(下称《报告》),从技术研究、领域应用、发展趋势等多个方面,介绍和研判深度合成技术及应用带来的机遇与挑战。
首先一个趋势是多个领域落地应用,深度合成内容迎爆发式增长。以视频为例,《报告》显示,在国内外主流音视频网站、社交媒体平台上,2021年新发布的深度合成视频的数量较2017年已增长10倍以上。此外,深度合成内容关注度也呈指数级增长,通过对互动数据进行统计,2021年新发布的深度合成视频的点赞数已超过3亿。
目前,深度合成在影视制作、广告营销、社交娱乐等领域发展出多元化的商业应用,例如AI合成主播、虚拟偶像、修复历史老照片、影视剧本地化配音、“数字复活”已过世演员等。一些面向公众开发的合成类产品也陆续推出,《报告》显示,视频、语音和文本形式的服务最为普遍,例如支持风格定制的特效视频制作软件等风靡网络;语音方向衍生出了语音导航、有声读物、自动新闻播报等应用;文本合成则在新闻报道、诗文创作、聊天问答等方面发挥着重要作用。
“元宇宙”等新商业思维的提出,也为深度合成提供了更广阔的应用场景。阿里巴巴安全感知与认知智能部负责人薛辉表示,比如虚拟人、数字人即是深度合成的主要应用,也是“元宇宙”的重要组成部分。清华大学新闻与传播学院常务副院长陈昌凤认为,深度合成将重新定义虚拟数字化空间,从传播社会学意义上看,一个新的人类生存场景将以深度合成技术为基石展开。
其次是风险加剧,技术检测成重要应对举措。随着技术逐步“平民化”,不法分子可轻易伪造音频、视频,实施诬陷、诽谤、诈骗、勒索等违法行为。陈昌凤表示,虚假内容的高难度甄别影响了事实核查的有效性,在社会重大事件或政治事件节点上,深度合成技术可能被用于操作舆论意见,借助社交媒体,使虚假信息短时间内引发产生病毒式扩散,激化社会矛盾。
中国工程院院士邬贺铨认为,深度合成的治理有两项要点,第一,要持续发展技术,不能“一刀切”地禁止,避免阻碍正向应用与创新。第二,衍生出的安全问题要从源头上解决,利用技术创新、技术对抗等方式,持续提升和迭代检测技术的能力。瑞莱智慧CEO田天也表示,新型伪造方法层出不穷、网络传播环境的日趋复杂,加上基于检测算法存在漏洞缺陷等,反深伪检测技术面临“强对抗性”,需要持续更新与迭代。
此外,构建多维度治理机制,引导深度合成技术良性发展,也成为深度合成的新趋势。中国社科院哲学所科技哲学研究室主任段伟文建议,对深度合成技术引发的社会、法律和伦理问题,应展开有系统性、前瞻性的跨学科研究,对其可能出现的高风险应用场景,进行有针对性的治理与监管。
《报告》也建议,各方应当与时俱进落实好新的规范要求,并在此前提下不断追求技术突破,不断开拓深度合成技术应用场景,创立示范标杆,形成对人工智能行业整体的带动效应,从而促进新技术的持续健康发展。
【记者】郜小平
【作者】 郜小平
【来源】 南方报业传媒集团南方+客户端
关键词: