对音符发作检测过滤器有疑问吗?
|
如果我可能很愚昧,请原谅我,但我想问一些有关使用过滤算法进行音符发作检测的问题。
“检测功能”与在音频信号上使用过滤器相同吗?或通常,检测功能,滤波(对信号进行预处理)和峰值拾取之间有什么区别?
我经常听到有关低通(或高通)滤波器的信息,但我感到困惑。我了解到,它可以抵消低于(或高于)某个阈值的某些频率。但是,我正在使用时域来计算音符起点(即,使用信号幅度/能量的变化)。因此,我不确定如何将低通滤波应用于时域。还有其他用于音符发作检测的好的过滤器吗?
频谱能量和相位能量有什么区别? (我认为频谱是指频谱图或频率,但我不知道相位是什么)
我在处理动态阈值时遇到困难。对好的算法有什么建议吗?例如,我有以下信号:
如上图所示,我错过了一些音符发作。对算法的简要说明,我计算并记下了音频信号中发生的能量/幅度变化。然后,我得到最大的“能量变化”,并基于灵敏度,取一个百分比并将其设置为阈值。因此,这就是处理振幅/能量变化程度的问题所在。如果我将灵敏度设置得太低,则会出现“重影”发作,而如果我将灵敏度设置得太高,则会错过一些发作。有什么建议可以改善我正在使用的算法(或建议一种新算法)吗?
我确信很难达到100%的准确度,但是与现在相比,我需要一种更好的音符开始检测算法。我将不胜感激。非常感谢你!
没有找到相关结果
已邀请:
1 个回复
剃摧庭峨僳