定向梯度直方图
我一直在阅读关于对象(人类)检测的HOG描述符的理论。但我对实现有一些疑问,这可能听起来像一个微不足道的细节。
关于包含块的窗口;如果窗口在每个步骤中窗口重叠的像素逐个移动,如下图所示:
或者应该移动窗口而不会导致任何重叠,如下所示:
到目前为止,我看到的插图使用了第二种方法。但是,考虑到检测窗口的大小为64x128,很可能通过在图像上滑动窗口,不能覆盖整个图像。如果图像大小为64x255,则最后127个像素将不检查对象。所以,第一种方法似乎更合理,但是,更多的时间和CPU消耗。
有任何想法吗?
先感谢您。
编辑:我试着坚持Dalal和Triggs的原始论文。可以在此处找到一篇实现该算法并使用第二种方法的论文:http://www.cs.bilkent.edu.tr/~cansin/projects/cs554-vision/pedestrian-detection/pedestrian-detection-paper.pdf
没有找到相关结果
已邀请:
1 个回复
扑北爱