Verizon SongID - 如何编程?

对于不熟悉Verizon的SongID程序的人来说,它是一个可通过Verizon的VCast网络下载的免费应用程序。它会在歌曲中的任何一点听一首歌10秒,然后将这些数据发送给一些全知的算法兽,将其咀嚼起来并送回所有ID3标签(艺术家,专辑,歌曲等......) 前两部分和最后一部分是直截了当的,但在录制声音发送后的处理过程中会发生什么? 我认为它必须采取声音文件(什么格式?),解析它(如何?用什么?)一些关键标识符(这些是什么?波函数的常规属性?相位/移位/幅度/等),并检查它针对数据库。 我在网上找到的关于它是如何工作的一切都像我上面输入的一样通用。 来自audiotag.info   此服务基于a   复杂的音频识别   结合高级音频的算法   指纹技术和大型   歌曲的数据库。当你上传一个   音频文件,它正在被分析   音频引擎。在分析期间   音频“指纹”被提取出来   通过比较它来确定   音乐数据库。完成后   这个认可过程,信息   关于他们匹配的歌曲   概率显示在屏幕上。     
已邀请:
所有这些服务都是通过从客户端采样的音频数据中获取“指纹”,将其发送到服务器并将其与指纹数据库进行比较来实现的。 Shazam的开发人员之一撰写了一篇关于该技术如何运作的非常丰富的白皮书。这应该为您提供所需的所有信息。     

要回复问题请先登录注册