欢迎大家前往 云加社区 ,获取更多腾讯海量技术实践干货哦~
作者: 腾讯游戏云
导语:在刚刚结束的首届腾讯用户开放日上,腾讯音视频实验室带着 3D 位置音效解决方案,向所有用户亮相,为用户提供 360 度立体空间的沉浸式听觉体验,那么这项技术如何结合具体的场景提升用户听感和体验呢?这篇文章将会详细阐述.
基于游戏开发引擎(例如 Unreal,Unity)实现的 3D 音效在游戏中的应用已经非常普遍了,通过游戏引擎模拟重现空间中声源方位,例如 CS 中射击的枪声,中弹时的音效,附近敌人轻微的脚步声,可以显著提高游戏的沉浸感,造就身临其境的游戏体验.
这里我们可以听一段音视频实验室通过 3D 音效算法处理前后的音频对比(请带上耳机收听):
处理前: m.v.qq.com/play/play.h...
处理后: m.v.qq.com/play/play.h...
可以听到,处理后的音频携带了更多的空间感和方位感信息,通过扩展音乐的延展度,让声场更大,声音位置感更准确,声音运动轨迹更加生动,提升音乐的临场感和沉浸感.
然而,3D 音效之前并没有大规模应用在实时语音沟通领域,这主要是由于之前重度游戏中玩法对于语音能力的定位更多是沟通方式而非创新玩法,使用场景对于实时语音携带方位感诉求也不强烈.
2017 年一款游戏《绝地求生:大逃杀》,通过创新的百人大逃杀,胜者吃鸡玩法,短时间获得了全球玩家的青睐和追捧.除了游戏玩法本身的创意之外,游戏对于实时语音玩法也进行了颠覆式创新.游戏过程中玩家可以设置【全体模式】向附近的玩家喊话,挑衅,搭讪,这种语音模式可以与陌生人进行很有趣的沟通和互动.社交媒体上已经有很多用户基于这种语音模式,创作了很多趣味视频.
而引入 3D 位置语音之后,玩家在喊话过程中会暴露自己的方位和位置信息,玩家的声音也会根据位置变化而实时改变.可以说,3D 音效让《大逃杀》这种玩家间的沟通和战斗体验更真实,感受更加沉浸式,更加身临其境的吃鸡玩法.3D 音效除了应用在吃鸡游戏中之外,结合线上棋牌房等多人语音场景也可以显著提升用户体验.
现在多人会话中几路声音混为单声道后,声源将集中于一点.应用 3D 位置音效,收听者可以将不同发送方虚拟到空间不同的位置上,用户更容易通过位置信息知道当前是谁在讲话.这种技术非常适合应用到固定方位的聊天室中.
例如,3D 音效应用到棋牌类游戏的语音房间时,通过将各个声音虚拟到桌面相应位置,玩家可以清楚地感知到其他玩家的声音是来自自己左,右还是正前方,打造线上棋牌房的沉浸式体验,也让玩家开语音沟通的意愿更加强烈.
以下是我们模拟玩家方位处理的一段棋牌游戏中实时语音效果: m.v.qq.com/play/play.h... 3D 音效的另一个重要应用场景是 VR 音频.
VR 的一切都是关于临场感,而逼真的 3D 音效效果可以成为临场感的点睛之笔.VR 设备能够通过头部运动追踪物体固然重要,能够听到携带物体位置信息的声音也同样重要,逼真的 3D 音效效果能够给玩家传递其他玩家的位置信息,环境信息,通过视觉和听觉的相互加强来达到最好的效果.
从方位上,VR 中各个声音可以虚拟到空间的某个位置上,使用户感受声音来自特定位置;用户转头时,VR 中刚才所虚拟方位的声音将随之变化相应的方位,制造出 360 度立体空间声音定位的效果,让玩家更加确信声源就在现实中.这对于 VR 类游戏体验非常关键.目前音视频实验室的 3D 音效相关技术提案已提交到 AVS(国家音视频编解码技术标准)的 VR 音频国家标准中,且在腾讯今年发布的一款 VR 游戏 "hello world" 中已上线.
3D 音效还可用于高清视频的音频处理,用户只需使用双声道耳机,即可在家体验影院的沉浸式立体声视听体验.
我们知道,在电影院观影过程中为了打造立体声效果常用 5.1 声道,7.1 声道,每个声道的声音通过不同位置的音箱播放出来,配合影片,观众体验更加震撼.而当戴耳机来观看电影时,由于常规的方法是简单的将靠左侧的所有声道混在左声道,靠右侧的声道混在右声道,中置声道左右都混,这导致无论 5.1 还是 7.1 所有声像最终都变成左中右,模糊掉许多细节导致一些声音的变化体现不真实,例如从左后方运动到左方再到左前.更严重的是,假如其他声道无声,只有左前声道有声音,就变成了只有左耳机响,这种感受很不好.
而 3D 音效可将各声道虚拟到各个相应音箱的位置,从而使听觉更像来自空间中的各个音箱.运用 3D 音效技术,用户在家用双声道耳机即可体验沉浸式的影院立体声效果.
以下是我们在腾讯视频上截取的音乐原声并通过 3D 音效处理后的效果: m.v.qq.com/play/play.h...
那么,三维虚拟听觉是如何实现的呢?要将普通单声道声音处理为沉浸感的音频需要先了解下面的问题:人耳如何分辨声音来自何方? 我们先看下面的图:
通过图中我们可以看到,左右耳听到的声音先后,左右耳听到的声音的大小,左右耳听到声音实际频谱都是有差异的.
我们的 3D 音效技术,就是利用 "头部关联传输函数"(HRTF 算法),对双耳之间的时间差异和频谱差异进行建模,形成有声源方位感的声音.同时我们还通过采样混响填补 HRIR 缺失的环境反射声,从而构建完整的声场模型.比如在一个小房间里,不仅可以听到两个人之间的对话,还可以听到声音从墙壁中反射的效果,增加沉浸感.在下一篇关于 3D 音效技术揭秘的文章中,我们会披露关于此项技术更多的原理介绍,敬请期待!
3D 位置语音解决方案应用到游戏实时语音沟通中,玩家可以根据队友语音 "听声辨位",拥有 "身临其境" 的沉浸式游戏体验.目前 3D 音效技术已经集成到腾讯音视频实验室推出的实时游戏音视频 TMG(Tencent Mobile Gaming)解决方案中.TMG 提供了包括多人实时语音,实时视频,语音消息,语音转文本等功能,覆盖了休闲社交类,MOBA 类,MMORPG 等多种游戏类型,是一个专门针对游戏场景定制的实时游戏音视频 SDK,且接入门槛极低,一个 SDK 即可满足多样化的游戏音视频诉求.
实时游戏音视频(Tencent Mobile Gaming)服务已正式登陆腾讯云,为广大游戏厂商开发者提供服务,详细信息可浏览: cloud.tencent.com/product/tmg...
想了解更多腾讯云游戏行业解决方案和案例,立即报名 1 月 19 日腾讯云 GAME-TECH 沙龙杭州站 ,我们一起探讨
直播预约: www.itdks.com/eventlist/d...
来源: https://juejin.im/post/5a44a56ef265da431120832f