• mask transformer相关论文阅读-DETR

    时间:2024-01-25 06:58:05

    很多这些论文都是受到DETR的启发得到的。DETR为数不多的目标检测里端到端的模型,它把目标检测看作集合预测问题,不需要人为一些先验和调参,没有了NMS,让模型训练和部署变得容易。 简单描述一下它训练过程就是图片经过CNN得到的特征和位置编码(给定的)相加放入到Transformer进行编码。学习...

  • 【论文阅读】Can Large Language Models Empower Molecular Property Prediction?-创新性

    时间:2024-01-24 10:29:46

     由于分子可以表示为SMILES序列,因此使用具有强大文本理解能力的LLM来处理分子数据是一个不错的想法。简而言之,大模型在分子预测任务上的迁移。  例如,对于给定分子的SMILES,ChatGPT可以准确地描述分子的功能组、化学性质和潜在的药物应用。如下图所示。 基本思想:  对于所给的SMI...

  • 『论文阅读|2024 WACV 多目标跟踪Deep-EloU|纯中文版』-4 实验和结果(Experiments and Results)

    时间:2024-01-23 20:30:11

    4.1 数据集(Dataset) 在两个大型多体育项目球员跟踪数据集(即 SportsMOT [7] 和 SoccerNet-Tracking [6])上对跟踪算法进行了评估。 SportsMOT 包含 240 个视频序列,超过 150K 个帧和 160 多万个边界框,收集自篮球、足球和排球...

  • 【论文阅读】GPT4Graph: Can Large Language Models Understand Graph Structured Data?-图理解基准

    时间:2024-01-23 07:44:46

    4.1、结构理解任务 (1)图大小检测  闻如其名,这个任务是来评估LLM是否能够辨别所给图大小的能力,其中大小是指图中存在的结点和边的数量。LLM应该准确地确定这些指标。  尽管这是对LLM提出的一个挑战,但是结点和边的数量至关重要,它能使LLM能够将相应的信息置于上下文中。 (2)度检测  这...

  • 论文阅读 | Clustrophile 2: Guided Visual Clustering Analysis

    时间:2024-01-21 15:11:12

    论文地址 论文视频左侧边栏可以导入数据,或者打开以及前保存的结果。右侧显示了所有的日志,可以轻松回到之前的状态,视图的主区域上半部分是数据,下半部分是聚类视图。INTRODUCTION数据聚类对于处理无标签数据,高维数据是非常有效的工具。聚类算法中如何确定最好的聚类方法和参数比较困难,需要可视化系统...

  • FastSpeech2——TTS论文阅读-2.FastSpeech2 and 2s

    时间:2024-01-21 06:57:30

    2.1Motivation 解决自回归模型中one-to-many problem,fastspeech中teacher-student复杂,损失,不准确问题 2.2Model Overview 结构: 编码器(Encoder):编码器的作用是将输入的音素嵌入序列转换为隐藏的音素序列。音素嵌入...

  • 阅读学术论文的心得体会from小木虫

    时间:2024-01-03 13:16:01

    我们搞科研的很重要的一个环节就是文献的阅读!关于如何阅读文献?读什么,怎么读?结合我自己的体会,我想这里的关键在于要让我们通过这种方式的学习,学会看懂作者的思想、思路和科学方法,从中学习论文作者发现问题、提出问题、解决问题的过程。一篇学术论文,大致可以分成如下八个部分:论文题目,作者姓名与单位,论文...

  • 论文阅读笔记(二)U-Net

    时间:2023-12-26 09:04:14

    U-Net: Convolutional Networks for Biomedical Image SegmentationU-Net:用于生物医学图像分割的卷积网络摘要要想成功地训练一个深度网络需要大量的数以千计的有标记的样本,这已经成为了业内共识。在本文中,我们提出了一种网络和相应的训练策略,...

  • 论文阅读笔记三十七:Grid R-CNN(CVPR2018)

    时间:2023-12-16 21:40:30

    论文源址:https://arxiv.org/abs/1811.12030开源代码:未公开摘要本文提出了目标检测网络Grid R-CNN,其基于网格定位机制实现准确的目标检测。传统方法主要基于回归操作,Grid R-CNN则捕捉详细的空间信息,同时具有全卷积结构中对位置信息的敏感性。【 Instea...

  • 论文阅读笔记四十二:Going deeper with convolutions (Inception V1 CVPR2014 )

    时间:2023-12-16 21:40:14

    论文原址:https://arxiv.org/pdf/1409.4842.pdf代码连接:https://github.com/titu1994/Inception-v4(包含v1,v2,v4) 摘要本文提出了一个深层的卷积网络结构-Inception,该结构的主要特点是提高了网络内部计算资源的利用...

  • 论文阅读笔记二十六:Fast R-CNN (ICCV2015)

    时间:2023-12-16 21:22:28

    论文源址:https://arxiv.org/abs/1504.08083参考博客:https://blog.csdn.net/shenxiaolu1984/article/details/51036677摘要该文提出了一个快速的基于区域框的卷积网络用于目标检测任务。Fast RCNN使用深度卷积网...

  • 论文阅读笔记(十八)【ITIP2019】:Dynamic Graph Co-Matching for Unsupervised Video-Based Person Re-Identification

    时间:2023-12-16 21:19:23

    论文阅读笔记(十七)ICCV2017的扩刊(会议论文【传送门】)改进部分:(1)惩罚函数:原本由两部分组成的惩罚函数,改为只包含 Sequence Cost 函数;(2)对重新权重改进:① Positive Re-Weighting:其中 若太大,则选择的样本标签的可信度小;若太小,则样本数量不足以...

  • 论文阅读笔记四十九:ScratchDet: Training Single-Shot Object Detectors from Scratch(CVPR2019)

    时间:2023-12-16 21:17:23

    论文原址:https://arxiv.org/abs/1810.08425github:https://github.com/KimSoybean/ScratchDet摘要当前较为流行的检测算法是在经典的大规模分类的数据集上进行微调,但这样做会存在两个问题:(1)分类任务与检测任务二者之间对位置的敏...

  • 论文阅读笔记四十八:Bounding Box Regression with Uncertainty for Accurate Object Detection(CVPR2019)

    时间:2023-12-16 21:16:51

    论文原址:https://arxiv.org/pdf/1809.08545.pdfgithub:https://github.com/yihui-he/KL-Loss摘要大规模的目标检测数据集在进行ground truth 框标记时仍存在这歧义,本文提出新的边界框的回归损失针对边界框的移动及位置方差...

  • 论文阅读笔记四十五:Region Proposal by Guided Anchoring(CVPR2019)

    时间:2023-12-16 21:08:40

    论文原址:https://arxiv.org/abs/1901.03278github:code will be available摘要区域anchor是现阶段目标检测方法的重要基石。大多数好的目标检测算法都依赖于anchors机制,通过预定义好的尺寸及大小在空间位置上进行均匀的采样。本文提出了一个...

  • 论文阅读:Siam-RPN

    时间:2023-12-16 14:28:03

    摘要Siam-RPN提出了一种基于RPN的孪生网络结构。由孪生子网络和RPN网络组成,它抛弃了传统的多尺度测试和在线跟踪,从而使得跟踪速度非常快。在VOT实时跟踪挑战上达到了最好的效果,速度最高160fps。一、研究动机作者将流行的跟踪算法分为两类,一类是基于相关滤波类并进行在线更新的跟踪算法,另一...

  • 论文阅读: Direct Monocular Odometry Using Points and Lines

    时间:2023-12-05 10:34:47

    Direct Monocular Odometry Using Points and LinesAbstract大多数VO都用点: 特征匹配 / 基于像素intensity的直接法关联.我们做了一种直接法算法结合了点和edge.它在纹理少的场景下工作的更好,而且对于光线的变化和快速的运动的情况下通过...

  • [论文阅读] A Discriminative Feature Learning Approach for Deep Face Recognition (Center Loss)

    时间:2023-11-23 18:56:33

    原文: A Discriminative Feature Learning Approach for Deep Face Recognition用于人脸识别的center loss。1)同时学习每个类的深度特征的中心点2)对深度特征和其对应的类中心的距离有一定的惩罚提出的center loss函数在...

  • 论文阅读笔记(七)YOLO

    时间:2023-11-19 19:39:12

    You Only Look Once: Unified, Real-Time Object DetectionJoseph Redmon, CVPR, 20161. 之前的目标检测工作将分类器用作检测,而YOLO将检测问题看做回归问题,用一个网络端对端地执行检测任务(包括边界框位置和相应的类别概率预...

  • 论文阅读笔记四十四:RetinaNet:Focal Loss for Dense Object Detection(ICCV2017)

    时间:2023-11-18 10:15:16

    论文原址:https://arxiv.org/abs/1708.02002github代码:https://github.com/fizyr/keras-retinanet摘要目前,具有较高准确率的检测器基于双阶段的目标检测算法实现,单阶段通过对可能存在的位置进行密集的采样操作,一定程度上要比双阶段...