近日,人人顶级信号处理时代会议 ICASSP 2022 公布了论文入选名单。由王君乐博士指导的腾讯Turing Lab实验室论文——《针敌手机游戏的主不雅与客不雅视频质料评价》(Subjective and Objective Quality Assessment of Mobile Gaming Video)、《引入用户共鸣学习的好意思学质料展望》(Considering User Agreement in Learning to Predict the Aesthetic Quality)被大会接受。
ICASSP?(International Conference on Acoustics, Speech, and Signal Processing)是外洋声学、语音和信号处欢迎议。是由IEEE主理的全天下最大的、亦然最全面的信号处理过火欺诈方面的顶级学术会议,具有巨擘、平庸的学界及工业界影响力。往届ICASSP会议完满受AI限制酌量学者的热议和柔柔。
这次,腾讯Turing Lab实验室在外洋舞台全标的展示了腾讯在视频质料评价、图像质料评价方面的实力。
以下为腾讯Turing Lab实验室入选论文轮廓:
01.针敌手机游戏的主不雅与客不雅视频质料评价
Subjective and Objective Quality Assessment of Mobile Gaming Video 比年来,手机游戏在总计游戏阛阓中占据的份额已超50%,手游关联履行也成为酬酢媒体平台上短视频的环节构成部分。同期,基于视频流的云游戏也从容诱骗了越来越多的用户。跟着这些游戏关联的视频流媒体时代和奇迹的繁茂发展,用户对游戏的质料体验(QoE, Quality of Experience)提议了更高的条目。独一双这个视频链路及履行阐扬进行愈加严格的质料把控,才不错为用户带来更佳的游戏体验。
画质动作质料体验QoE的环节维度之一,怎样正确地展望东说念主眼感知的画质在很长一段时代内一直是学术界及工业界酌量的要点及热门。可是,当今广大的已有酌量主要聚焦在传统的视频履行上,包括PGC履行、UGC履行、以及面向线上会议和分享屏幕等场景的特定履行等。当这些画质评价轨范径直欺诈在游戏视频时,性能阐扬一般。
因此,在本篇论文中,咱们针敌手机游戏在云游戏场景下的画约束题,进行了主不雅实验及客不雅算法模子研发的关联责任。咱们先从腾讯前卫云游戏平台上接收17款手机游戏中,并针对不同场景采集了共150段源视频,之后使用多种编码器和编码参数构造出1293段视频。咱们基于ITU关联轨范进行严格的主不雅实验,从而赢得了全新的针敌手机游戏的视频质料评价数据集TGV dataset(Tencent Gaming Video dataset)。
在这篇论文中,咱们提议质料评价模子ERAQUE(Efficient hard-RAnk QUality Estimator)。揣度新提议的繁难样本排序亏蚀(Hard Pairwise Ranking Loss, Fig1),该模子在教师经由中不错愈加针对相通的样本对,从而学习到更细粒度的失真信息,进一步普及模子的性能。在提议的TGV数据集上,咱们进行了模子教师和对比考验,实验为止标明ERAQUE模子比较业界其他质料评价模子阐扬出了更好的性能。
终末,为了让模子以在端侧更高效地推理,咱们使用常识蒸馏的决议(Fig.2)对ERAQUE模子进行压缩和加快,最终已矣ERAQUE模子的轻量化部署,实验为止标明ERAQUE模子配合提议的蒸馏计谋不错使模子在复杂度和性能之间已矣高度量度。
02. 引入用户共鸣学习的好意思学质料展望
Considering User Agreement in Learning to Predict the Aesthetic Quality 比年来,针对图像的视觉好意思感评价时代在好多欺诈场景中施展闪耀要作用,包括图像的自动化裁剪、图像生成、以及在履行保举限制等。因此,图像好意思学评价成为了学术界及工业界热门的酌量课题。
365建站客服QQ:800083652365站群与传统的图像质料评价问题不同,由于东说念主在进行好意思学评价时会引入更多high-level的评价维度,如情感、画面布局、颜色搭配与合营性等,这也使得好意思学评价比较针对失真进行的传统图像质料评价,具有更高的主不雅性与不笃定性(见Figure 1)。
Figure 1:在这两幅图中,评测东说念主员关于A图的好意思感评分具有更高的不笃定性(轨范差σ=1.36),而关于B图,评测东说念主员关于好意思感的评分则趋于一致(轨范差σ=0.59)
在这篇论文中,咱们提议了改换了的多任务attention采集(见Figure 2及Figure 3),不错对输入图像的好意思学MOS分数,以及代表了该分数不一致性的轨范差进行端到端的展望。在亏蚀函数方面,咱们同期也提议了全新的针对的置信区间排序亏蚀(confidence interval ranking loss),用于促使模子在教师经由中更多地柔柔具有更高好意思学不笃定性的图像对,从而学习到更具有分辨性地特征,以及与不雅测者不笃定性更关联的特征。
Figure 2: 著述所提议模子的总体架构
6
Figure 3: 著述所提议的LMLSP模块
在这个责任中,咱们通过广大的实考说明了咱们所提议多任务学习好意思学模子不但在游戏图像的好意思学展望中具有广阔上风,同期关于传统的当然履行图像好意思学展望任务,也达到了很好的效果。
产学研揣度,落地业务,反哺时代
在业务层面,以上AI时代均已欺诈到腾讯前卫云游戏平台,腾讯前卫云游戏通过Turing Lab画质评价、多媒体视频质料评价、履行生成及虚实互动等智商,悉力于全标的的普及云游戏画质阐扬,打造云游戏极致的用户体验。
除了在C端业务的落地除外,在面向产业互联网层面,Turing Lab的视频质料评价时代也还是通过“腾讯WeTest质料云平台“对外通达,行业用户不错通过体验Demo快速体验了解到该时代。
除此除外,在AI欺诈上的探索,腾讯WeTest官网近期全新上线了AI奇迹专区,并同步推出视频画质评价/游戏履行安全经管决议等居品智商。异日,腾讯WeTest将握续在科研限制深耕,并悉力于将AI时代前沿酌量与测试场景进行交融,用时代运转测试乃至质料保险行业的发展,并以通达气派,对外输出优秀的时代智商,助力行业的发展。
王君乐博士简介
腾讯众人酌量员,Turning Lab精良东说念主
领有10余年算计机视觉、多媒体、机器学习限制酌量教养,在东说念主体姿态揣度与重建、图像质料评价、算计照相学、千里浸式多媒体等限制有较深的了解及实战教养,并在这些限制指导团队进行探索与落地的责任。曾主导腾讯CenseoQoE画质评价决议的配置与社区开源,主导腾讯前卫云游戏云霄虚实互动时代的研发。此外,在包括CVPR、NeurIPS、TIP、TMM等顶级会议及期刊上发表多篇论文,并为多个会议及期刊担任审稿东说念主及组织者。