论文:Deep supervised discrete hashing
论文地址:https://arxiv.org/abs/1705.10999
近日,自动化所李琦、孙哲南、赫然、谭铁牛论文「Deep supervised discrete hashing」被誉为神经计算和机器学习领域两大顶级会议之一的 NIPS(另一个为 ICML)收录。文章新提出了一种深度离散哈希算法(discrete hashing algorithm )。实验结果表明,该方法在基准数据集上的表现要好过目前最好的哈希方法。
深度离散哈希编码示意图
随着网络上图像和视频数据的快速发展,近几年图像及视频检索也被广泛的研究。得益于深度学习的发展,深度哈希方法在图像检索方面也取得了一定的成果。然而,之前的深度哈希方法还是存在一些限制「例如,没有充分利用语义信息」。
在该论文中,作者对其具体做法进行总结如下:1、我们方法的最后一层输出直接限制为二进制编码。 学习到的二进制编码既能保持图像之间的相似关系,同时又能和标签信息保持一致。据我们所知,该方法是第一个在统一框架下同时使用成对标签信息和分类信息学习哈希编码的方法。2、为了减少量化误差,我们在优化过程中保留了哈希编码的离散化这一特性。此外,我们还提出了一种交替优化方法,即使用坐标下降法优化目标函数。3、大量的实验结果表明,我们的方法在图像检索问题上,取得了比现最好方法更好的结果,从而验证了我们方法的有效性。
DSDH-A、DSDH-B、DSDH-C 和 DSDH 在 CIFAR-10上得到的结果:「a」Hamming 半径为 2 的精度曲线; 「b」不同数目最佳返回图像的精度曲线(不确定); 「c」具有 48 位哈希编码的精度-召回曲线。
表1:第一组实验设置下不同方法的 MAP。 NUS-WIDE 数据集的 MAP 是根据返回的前 5,000 位邻近值计算的。DPSH * 表示重新运行 DPSH 作者提供的代码。
表2:第二组实验设置下不同方法的 MAP 。 NUS-WIDE 数据集的 MAP 是根据返回的前 50,000 位邻近值计算的。 DPSH * 表示重新运行 DPSH 作者提供的代码。
表3:第一组实验设置下不同方法的 MAP 。NUS-WIDE 数据集的 MAP 是根据返回的前 5,000 位邻近值计算的。