“元宇宙”里也有风险？报告披露深度合成应用十大趋势

利用深度学习、虚拟现实等生成合成类算法制作图像、音频、视频、虚拟场景等信息的深度合成技术，已在多个领域大量应用，但与此同时，恶意使用该技术生成的音视频，也显现出了巨大的破坏力，给个人、企业造成了声誉损害和财产损失，也对社会、国家安全造成威胁。

为了对人工智能和深度合成技术的健康发展提供参考和指引，清华大学人工智能研究院、北京瑞莱智慧科技有限公司、清华大学智媒研究中心、国家工业信息安全发展研究中心、北京市大数据中心近日联合发布《深度合成十大趋势报告（2022）》（下称《报告》），从技术研究、领域应用、发展趋势等多个方面，介绍和研判深度合成技术及应用带来的机遇与挑战。

首先一个趋势是多个领域落地应用，深度合成内容迎爆发式增长。以视频为例，《报告》显示，在国内外主流音视频网站、社交媒体平台上，2021年新发布的深度合成视频的数量较2017年已增长10倍以上。此外，深度合成内容关注度也呈指数级增长，通过对互动数据进行统计，2021年新发布的深度合成视频的点赞数已超过3亿。

目前，深度合成在影视制作、广告营销、社交娱乐等领域发展出多元化的商业应用，例如AI合成主播、虚拟偶像、修复历史老照片、影视剧本地化配音、“数字复活”已过世演员等。一些面向公众开发的合成类产品也陆续推出，《报告》显示，视频、语音和文本形式的服务最为普遍，例如支持风格定制的特效视频制作软件等风靡网络；语音方向衍生出了语音导航、有声读物、自动新闻播报等应用；文本合成则在新闻报道、诗文创作、聊天问答等方面发挥着重要作用。

“元宇宙”等新商业思维的提出，也为深度合成提供了更广阔的应用场景。阿里巴巴安全感知与认知智能部负责人薛辉表示，比如虚拟人、数字人即是深度合成的主要应用，也是“元宇宙”的重要组成部分。清华大学新闻与传播学院常务副院长陈昌凤认为，深度合成将重新定义虚拟数字化空间，从传播社会学意义上看，一个新的人类生存场景将以深度合成技术为基石展开。

其次是风险加剧，技术检测成重要应对举措。随着技术逐步“平民化”，不法分子可轻易伪造音频、视频，实施诬陷、诽谤、诈骗、勒索等违法行为。陈昌凤表示，虚假内容的高难度甄别影响了事实核查的有效性，在社会重大事件或政治事件节点上，深度合成技术可能被用于操作舆论意见，借助社交媒体，使虚假信息短时间内引发产生病毒式扩散，激化社会矛盾。

中国工程院院士邬贺铨认为，深度合成的治理有两项要点，第一，要持续发展技术，不能“一刀切”地禁止，避免阻碍正向应用与创新。第二，衍生出的安全问题要从源头上解决，利用技术创新、技术对抗等方式，持续提升和迭代检测技术的能力。瑞莱智慧CEO田天也表示，新型伪造方法层出不穷、网络传播环境的日趋复杂，加上基于检测算法存在漏洞缺陷等，反深伪检测技术面临“强对抗性”，需要持续更新与迭代。

此外，构建多维度治理机制，引导深度合成技术良性发展，也成为深度合成的新趋势。中国社科院哲学所科技哲学研究室主任段伟文建议，对深度合成技术引发的社会、法律和伦理问题，应展开有系统性、前瞻性的跨学科研究，对其可能出现的高风险应用场景，进行有针对性的治理与监管。

《报告》也建议，各方应当与时俱进落实好新的规范要求，并在此前提下不断追求技术突破，不断开拓深度合成技术应用场景，创立示范标杆，形成对人工智能行业整体的带动效应，从而促进新技术的持续健康发展。

【记者】郜小平

【作者】郜小平

【来源】南方报业传媒集团南方+客户端

关键词：