小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

时间:2022-10-10 12:59:29

计算机视觉研究院

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

计算机视觉研究院专栏

作者:Edison_G

近期三星堆正在发掘,大家都在翘首以盼揭开它的真相,这次出土非常多的物品,其中最期待的就是希望能找出三星堆文明和其他文明之间的联系,然后理清楚它的前世今生,当然了,这点很难,不,应该是前所未有的难!今天我们小数据训练来试试三星堆铜面具检测。


小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

长按扫描二维码关注我们

回复“sxd”获取论文下载


小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

由于真实世界数据的固有long-tail分布,Few-shot目标检测是一个迫切而持久的问题。它的性能在很大程度上受到新类数据稀缺的影响。但是,不管数据的可用性如何,新类和基类之间的语义关系是恒定的。

今天分享中,研究者研究了利用这种语义关系和视觉信息,并将显式关系推理引入到新的目标检测的学习中。具体来说,通过从大量文本语料库中学习的语义嵌入来表示每个类概念。检测器被训练成将目标的图像表示投影到这个嵌入空间中。研究者还发现了使用启发式知识图的原始嵌入的问题,并提出用动态关系图来增强嵌入。因此,将Few-shot检测器,称为SRR-FSD,针对新物体的shots是鲁棒和稳定。实验表明,SRR-FSD可以在较高的shots下获得竞争较好结果,更重要的是,在较低的外显和内隐shots下,SRR-FSD的性能显著提高。提出的基准协议与隐式shots从预先训练的分类数据集可以作为一个更现实的设置,为未来的研究打基础。


小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

如果我们事先了解到新类别的“自行车”看起来像“摩托车”,可以与“人”互动,并且可以携带一个“瓶子”,那么学习“自行车”这个概念将比仅仅使用一些图片更容易。当视觉信息难以访问[Xiaolong Wang, Yufei Ye, and Abhinav Gupta. Zero-shot recognition via semantic embeddings and knowledge graphs. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 6857–6866, 2018]时,这种显式的关系推理甚至更为重要。如下图:

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

Relation Reasoning

语义空间投影学习将视觉空间的概念与语义空间对齐。但它仍然独立地处理每个类,并且在类之间没有知识传播。因此,研究者进一步引入了一个知识图来建模它们的关系。知识图G是一个N×N邻接矩阵,代表每个相邻类对的连接强度。G通过图卷积操作[T.N. Kipf and M. Welling. Semi-supervised classification with graph convolutional network. In International Conference on Learning Representations (ICLR)]参与分类。从数学上看,更新的概率预测如下公式:

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

heuristic definition of the knowledge graph

在zero-shot或few-shot识别算法中,知识图G是基于启发式的预定义。它通常是从常识知识规则数据库中通过规则路径对子图进行采样,从而使语义相关的类具有很强的连接。例如,来自ImageNet数据集的类具有从WordNet中采样的知识图。然而,FSOD数据集中的类在语义上并不高度相关,也不像ImageNet类那样形成层次结构。研究者发现的唯一适用的启发式方法是基于来自[Zhao-Min Chen, Xiu-Shen Wei, Peng Wang, and Yanwen Guo. Multi-label image recognition with graph convolutional networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 5177– 5186]的目标共现。虽然共现的统计量很容易计算,但共现并不一定等同于语义关系。

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

Network architecture of the relation reasoning module for learning the relation graph

研究者部分实验

FOSD在VOC数据集上的评估结果

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

FOSD在COCO数据集上的评估结果

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

基于该框架,利用少量数据对三星堆铜器雕塑家检测,具体如下:

下例是基于Face++的Api测试:(未检出出)

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)

© THE END


计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)