九游会J9·(中国)真人游戏第一品牌

首页 > 技术与支持 > 应用与技术文章 > awinic inside

当谈论神仙算法awinicSKTune®时,到底在谈什么

2022-12-02

“声”临其境才能身临其境

让动听的声音被听见,让被听见的声音更动听,从“声”临其境到身临其境——这是j9九游会真人游戏第一品牌音频团队孜孜不倦的追求。

从早期的K类大音量功放,到Smart K,再到Digital Smart K系列产品,每一次小进步,都是听音体验的一个大飞跃。当然,除了功放产品本身的迭代更新所带来的音质、音量提升,搭配功放产品并真正赋予声音灵魂的神仙算法awinicSKTune®(下文简称:神仙算法SKTuneTM)也功不可没。广被科大讯飞、小米、vivo、爱奇艺等众多知名品牌采用的神仙算法SKTuneTM到底厉害在哪?本篇,小为将着重从算法模块的角度带大家更好地认识神仙算法SKTuneTM。

神仙SKTuneTM典型模块

01 虚拟低音

手机、平板等便携式电子产品,受其体积限制,所使用的扬声器通常为微型扬声器。微型扬声器的截止频率通常在400Hz-1000Hz左右,这意味着400Hz-1000Hz以下的频率微型扬声器无法正常复现。而人耳能够听到的范围通常为20-20KHz,与此同时,音乐中的人声信号以及一些常见的乐器(鼓、贝斯等)其基频都在400Hz以下,所以九游会J9·(中国)真人游戏第一品牌在传统微型扬声器所听到音乐中的人声和鼓声等都是比较单薄、没有冲击力的。

随着社会科技进步,手机在生活中扮演的角色越来越重要,九游会J9·(中国)真人游戏第一品牌对手机的音质要求也越来越高,低频的冲击力和质感也成为了必不可少的一部分。因此,为了复现低频的听感,神仙算法SKTuneTM采用了“虚拟低音”的方法。

在心理声学中,存在一种“基频丢失”现象,即当去除信号中的基频成分而保留其谐波成分时,人耳依旧能听到基频的听感,也就是说可以通过谐波成分来复现基频的听感。其中,基频表示复合频率中的最低频率,而谐波表示该基频的倍频信号,二倍频称为二次谐波,三倍频称为三次谐波,以此类推。基于此原理,衍生出了虚拟低音算法,算法流程主要包括基频提取、谐波生成以及谐波与基频信号的响度、相位匹配等过程。

02 智能钢琴杂音抑制

微型扬声器在播放纯钢琴音乐时,会产生一些杂音,主要是一些“沙沙”声和“滋滋”声,通常称之为“钢琴杂音”。钢琴杂音产生的原因是因为钢琴音信号是一种谐波成分比较纯净、频谱能量非常集中的信号,而微型扬声器播放这种能量单一、集中的信号时,振膜容易发生不正常的颤动,继而产生杂音。

钢琴杂音消除模块的设计目的是检测信号中会产生杂音的钢琴音信号,并提前进行压制处理,以此消除钢琴杂音。该算法主要基于机器学习实时识别信号中的钢琴杂音信号,针对性的处理钢琴杂音信号,保证去除杂音的同时不影响其他部分的听感。

算法如下图所示,分别识别信号的幅度和钢琴杂音特征,实现动态压制,有效去除钢琴杂音,且保证其他歌曲不受影响。


以上两点是神仙算法SKTuneTM最典型的模块,而新一代神仙算法SKTuneTMV6在此前的基础上,更是新增多种创新模块,进一步提升“听音”的幸福感。

SKTuneTMV6创新模块



01 AI声场环绕

目前市场上大部分千元以上的手机、平板都采用了立体声方案,甚至部分高端机器开始采用四喇叭或八喇叭的方案。采用多个喇叭的原因就是为了达到更高的响度、更好的声场效果。但是由于手机、平板的长宽是有限的,导致各个喇叭之间的距离也有限,所以九游会J9·(中国)真人游戏第一品牌使用手机播放视频或玩游戏时通常无法明显感受到较大的空间感,声场宽度和纵深感都比较差。因此,各种声场拓宽算法应运而生,但是现有的声场拓宽算法,会导致严重的“浴室”听感——人声空旷。因此,j9九游会真人游戏第一品牌音频团队创新提出了一种基于人声和伴奏识别的声场拓宽算法——通过人声和伴奏分策略处理,扩宽声场的同时,增强人声,实现“声临其境”。

该算法主要通过机器学习,识别左右声道中的人声信号和伴奏信号,对人声信号进行增强处理,对伴奏信号进行拓宽处理,达到提升人声与伴奏的纵深度和宽度的目的。


经过声场拓宽后,用户可以感受到声音中的各种成分,如乐器、人声、背景音等分离得更开,声音听起来更有层次感;在视频场景,在没有打开本算法的场景下,声场比较窄,用户会感觉所有声音都从一个点发出;当声场拓宽后,用户会感觉不同的声音从不同的位置发出来,会有一种身临其境的感觉,声音分布在四周,形成环绕包裹,以此达到沉浸式“听音”体验。


02 AI齿音自动抑制

·齿音的产生
当发音声母是j、q、x、zh、ch、sh、z、c、s时,舌尖顶住上门牙,气流和牙齿发生摩擦,就会产生齿音

·齿音的特点
齿音的频率主要集中在4KHz-8KHz左右,是人耳最敏感频率范围

当齿音较大时会有刺耳感,导致整体听感变差,因此神仙算法SKTuneTMV6开创了AI齿音自抑制算法,通过动态检测识别出人声齿音与乐器信号,进而独立地对齿音进行实时优化,在尽可能保留原音原始成分的同时,使得听感更加均衡明亮。


03 心理声学-功耗优化

对于便携式设备而言,功耗是核心体验的一部分,低功耗会带来更强大的续航能力。传统方法通过音效调试来节省功耗,这种方法对音质影响非常大,导致声学体验大打折扣。

针对如何解决在保证听感不受影响的情况下降低功耗的问题,j9九游会真人游戏第一品牌提出了一种基于心理声学中掩蔽效应的功耗优化算法。人耳掩蔽效应指的是一个较弱声音的听觉感受被另一个较强的声音影响的现象。掩蔽效应又分为频域掩蔽效应和时域掩蔽效应。

·时域掩蔽
表示的是在时间上相邻的声音之间的掩蔽现象,产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。

·频域掩蔽
表示的是一个强纯音会掩蔽在其附近同时发声的弱纯音,也称同时掩蔽。因此,九游会J9·(中国)真人游戏第一品牌基于掩蔽效应实时剔除信号中被掩蔽而不被人耳听到的声音,在保证听感影响不大的情况下,有效降低功耗。

04 自适应喇叭保护模型

通常喇叭振膜保护处理的目的是根据喇叭振幅的模型,预测喇叭振膜位移,并计算相应的实时增益,保护喇叭振幅工作在安全范围内。但对于因气压、温度、自然老化等其他因素导致的喇叭状态变化,静态的喇叭模型无法满足这些恶劣的情况。

因此,神仙算法SKTuneTMV6研发了自适应喇叭模型保护,通过自动识别外界变化并更新喇叭模型,针对喇叭模型发生变化的场景提供更好的保护,使整体音频效果抬升明显且适配不同的喇叭状态和应用环境。


结语

以上便是神仙算法SKTuneTM的典型模块和神仙算法神仙算法SKTuneTMV6的创新模块介绍。目前,最新一代神仙算法SKTuneTMV6已成功助力iQOO10(戳此文字链接回顾:)、vivo X90()实力发声,接下来还有更多的应用产品即将震撼来袭,敬请期待!


*本文参考文献:
张林科, 康凯, 肖明芳,等. 一种基于时域掩蔽效应的语音自适应隐藏算法[J]. 计算机应用与软件, 2020, 37(5):7.