达摩院开源低成本大规模分类框架FFC CVPR论文深入解读
一、论文&代码 论文链接:An Efficient Training Approach for Very Large Scale Face Recognition 应用&代码: https://modelscope.cn/models/damo/cv_ir50_face-recog...
目标检测算法——YOLOv5/YOLOv7改进结合新神经网络算子Involution(CVPR 2021)
>>>深度学习Tricks,第一时间送达<<< ????????????NEW!!!魔改YOLOv5/YOLOv7目标检测算法来啦 ~ ????????魔法搭配计算机视觉领域各类创新新颖且行之有效的网络结构,平均精度均值mAP涨点明显,实验效果也俱佳。有需要的小...
论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)
论文源址:https://arxiv.org/abs/1506.01497tensorflow代码:https://github.com/endernewton/tf-faster-rcnn室友对Faster R-CNN的解读:https://www.cnblogs.com/pursuiting/摘...
论文阅读笔记三十七:Grid R-CNN(CVPR2018)
论文源址:https://arxiv.org/abs/1811.12030开源代码:未公开摘要本文提出了目标检测网络Grid R-CNN,其基于网格定位机制实现准确的目标检测。传统方法主要基于回归操作,Grid R-CNN则捕捉详细的空间信息,同时具有全卷积结构中对位置信息的敏感性。【 Instea...
论文阅读笔记四十二:Going deeper with convolutions (Inception V1 CVPR2014 )
论文原址:https://arxiv.org/pdf/1409.4842.pdf代码连接:https://github.com/titu1994/Inception-v4(包含v1,v2,v4) 摘要本文提出了一个深层的卷积网络结构-Inception,该结构的主要特点是提高了网络内部计算资源的利用...
论文阅读笔记四十八:Bounding Box Regression with Uncertainty for Accurate Object Detection(CVPR2019)
论文原址:https://arxiv.org/pdf/1809.08545.pdfgithub:https://github.com/yihui-he/KL-Loss摘要大规模的目标检测数据集在进行ground truth 框标记时仍存在这歧义,本文提出新的边界框的回归损失针对边界框的移动及位置方差...
论文阅读笔记四十九:ScratchDet: Training Single-Shot Object Detectors from Scratch(CVPR2019)
论文原址:https://arxiv.org/abs/1810.08425github:https://github.com/KimSoybean/ScratchDet摘要当前较为流行的检测算法是在经典的大规模分类的数据集上进行微调,但这样做会存在两个问题:(1)分类任务与检测任务二者之间对位置的敏...
论文阅读笔记三十六:Mask R-CNN(CVPR2017)
论文源址:https://arxiv.org/pdf/1703.06870.pdf开源代码:https://github.com/matterport/Mask_RCNN摘要Mask R-CNN可以在进行检测的同时,进行高质量的分割操作。基于Faster R-CNN并进行扩展,增加了一个分支在进行框...
论文阅读笔记四十五:Region Proposal by Guided Anchoring(CVPR2019)
论文原址:https://arxiv.org/abs/1901.03278github:code will be available摘要区域anchor是现阶段目标检测方法的重要基石。大多数好的目标检测算法都依赖于anchors机制,通过预定义好的尺寸及大小在空间位置上进行均匀的采样。本文提出了一个...
论文阅读笔记五十六:(ExtremeNet)Bottom-up Object Detection by Grouping Extreme and Center Points(CVPR2019)
论文原址:https://arxiv.org/abs/1901.08043github: https://github.com/xingyizhou/ExtremeNet摘要本文利用一个关键点检测网络来检测目标物的最左边,最右边,顶部,底部及目标物中心五个点。如果这几个点在几何空间上对齐,则生成一个...
论文阅读笔记二十八:You Only Look Once: Unified,Real-Time Object Detection(YOLO v1 CVPR2015)
论文源址:https://arxiv.org/abs/1506.02640tensorflow代码:https://github.com/nilboy/tensorflow-yolo摘要该文提出一种新的目标检测网络,yolo,以前的目标检测问题偏向于分类,而本文将目标检测看作是带有类别分数的回归问题...
CVPR2022 | ZeroCap:零样本图像到文本生成的视觉语义算法
CVPR2022 | ZeroCap:零样本图像到文本生成的视觉语义算法【写在前面】最近的文本到图像匹配模型将对比学习应用于大量未经管理的图像和句子对。虽然此类模型可以为匹配和后续的zero-shot任务提供强大的分数,但它们无法在给定图像的情况下生成标题。在这项工作中,作者重新利用这些模型来在推理...
CVPR2022 Oral OGM-GE阅读笔记
标题:Balanced Multimodal Learning via On-the-fly Gradient Modulation(CVPR 2022 Oral)论文:https://arxiv.org/abs/2203.15332领域:多模态学习解决本质问题在某些多模态模型的训练过程中,性能更好...
CVPR 2022 | 一种有效提升点云语义分割边界性能的学习框架
Contrastive Boundary Learning for Point Cloud Segmentation (CVPR 2022)代码地址:https://github.com/LiyaoTang/contrastBoundary1、背景对点云进行语义分割是对3D世界理解的前提,鲁...
MonoJSG:联合语义和几何代价函数的单目3D目标检测(CVPR2022)
论文标题:MonoJSG:Joint Semantic and Geometric Cost Volume for Monocular 3D Object Detection作者:Qing Lian(HKUST) ,Peiliang Li(DJI,VINS-Mono二作), Xiaozhi Chen...
CVPR2022论文速递(2022.4.11)!共12篇!跟踪/transformer/对比学习等
整理:AI算法与图像处理CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo欢迎关注:大家好, 最近正在优化每周分享的CVPR论文, 目前考虑按照不同类别去分类,方便不同方向的小伙伴挑选自己感兴趣的论文哈...
代码实践 | CVPR2020——AdderNet(加法网络)迁移到检测网络(代码分享)
公众号 : 计算机视觉战队扫码回复:加法网络,获取源码论文链接记得前段时间“计算机视觉研究院”推送了一篇关于CVPR2020最佳分类的文献(链接:CVPR2020最佳目标检测 | AdderNet(加法网络)含论文及源码链接),其中有同学问可以把这个新的分类框架嫁接到检测网络,会有提升吗?今...
CVPR2020 | 抑制不确定性用于大规模人脸表情识别(附源代码)
扫码关注我们公众号 : 计算机视觉战队扫码回复:人脸表情,获取链接今天我们推送一篇关于人脸识别的文献,目前被CVPR2020录为最佳人脸识别框架之一。这次“计算机视觉研究院”简洁给大家分析,后续我们会分享具体代码实现功能,有兴趣的同学请持续关注!概述从事人脸领域的你,都知道:由于面部表情的模糊性、图...
遥感航拍影像25篇CVPR39个数据集
摘要 本文讲解了39个数据集,关于高空卫星图和低空无人机航拍图像。 本文汇总了25篇CVPR2020年和2021年的论文。 本文详细介绍了这25篇论文的任务是什么,难点是什么,场景是什么。 同时,本文在需要的地方解释了一些卫星图和航拍图的入门常识和前置知识,比如digital surface mod...
(cvpr2019 ) Technology details of Deep Learning for Multiple-Image Super-Resolution
Mutiple-Image SSR 关键的技术imformation fusion1. 将单一场景的多图像经过Resnet, 其中每张图片的维度变为了输入的两倍。同时,这些输入的单一场景的多图像进行图像配准(image registration)来确定图像之间的子像素的位移(位移值乘以2以适配于Re...