Android中的语音活动检测
我正在编写一个类似于现有语音识别的应用程序,但会将声音数据发送到专有Web服务以执行语音识别部分。我使用标准的MediaRecord(AMR-NB编码),这似乎是语音识别的完美之选。这提供的唯一数据是通过getMaxAmplitude()方法的Amplitude。
我试图检测该人何时开始说话,以便当该人停止讲话约2秒钟时,我可以继续将声音数据发送到Web服务。现在我正在使用振幅的阈值,如果它超过一个值(即1500),那么我假设这个人说话。我担心的是幅度水平可能因设备而异(即Nexus One v Droid),因此我正在寻找一种更为标准的方法,可以从幅度值中得出。
附:
我查看了图形幅度,但它没有提供一种方法来只用振幅。
没有找到相关结果
已邀请:
3 个回复
柑恫祟
呈辖玫割善
碉罕城爸