日前,百度智能云曦灵正式发布“AI手语平台”与“AI手语平台一体机”。据悉,近期曦灵AI手语相关能力已被运用于央视新闻播报、冬奥直播等场景,目前累计观看量也已突破1亿人次。

百度方面透露,AI手语平台平台可实现钟级生成手语合成视频、手语主播实时直播等服务,为手语服务普及提供新途径。此外,“AI手语平台一体机”则可通过规模化部署快速建立无障碍窗口,适用于在医院、银行、车站等多种公共场合缓解无障碍窗口短缺的问题。

据悉,AI手语平台主要是针对线上场景而设,具有视频手语合成、直播手语合成、文本转手语、语音转手语4种功能,只需前期几小时的设置就可以实现以上场景的手语服务。此外,该平台还可以在各类 App、网站、小程序中,以满足听障人士线上社交、娱乐休闲、课程学习等日常需求。

而AI手语平台一体机则主要是针对于线下场景,百度智能云曦灵此次推出的全离线一体机V3和端云结合一体机P3,就搭载的是AI手语平台,可进行ASR 音识别、语音翻译、人像渲染等多种服务,让手语服务渗透在各种生活场景中。此外,公共服务机构还可通过这一设备将普通窗口转换为无障碍窗口。

在语音识别效果方面,百度智能云曦灵AI手语平台通过SMLTA语音识别算法模型,实现了声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。对此,百度语音技术部总监高亮表示,百度自研的深度学习算法,可以针对诸如旅游、医院、司法等不同领域的词准率进行针对性训练,准率可达96%。

在手语翻译方面,百度方面表示其研发了首个基于神经网络的精炼度可控手语翻译模型,并联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范和语料库,让AI模型能在真实数据中学习手语翻译知识,例如语序的调整、词语的映射以及长度控制等。而在手语动作方面,AI手语平台参考了《国家通用手语词典》规范精修近11000个手语动作,同时采用4D扫描技术训练,AI手语数字人的口型生成准确度可以达到98.5%。

百度集团副总裁吴甜对此表示,“人工智能呈现融合创新和降低门槛的新特点,综合运用多技术的数字人带来新体验,AI加持使数字人制作和运营成本与门槛降低,AI手语平台将让更多听障人士享受科技带来的便利”。

【本文图片来自网络】

关键词: 百度智能云发布多款手语服务产品 准率可达96%