• 【论文阅读】VIBE 基于视频的人体3D形状和姿态估计

    时间:2024-03-31 07:26:52

    论文原文:https://arxiv.org/pdf/1912.05656.pdf自己也翻译了一下,方便之后看呀:https://blog.csdn.net/qq_42366123/article/details/108122664目录一、介绍1、之前的方法与局限性2、现有方法的问题3、解决方法4、...

  • GPT系列 论文阅读笔记

    时间:2024-03-28 10:40:15

    GPT-1的核心:基于Transformer的解码器构建一个模型,在大量无标号的文本数据上训练一个模型,然后再在下游的子任务上进行微调。当前面临的问题:在NLP领域,有各种各样的下游任务。目前,自然语言处理中有标号的数据是非常少的,大部分的数据都是无标注的数据。因此,这就使得基于有标号的数据训练一个...

  • Transformer 论文阅读笔记-前言

    时间:2024-03-22 14:04:53

    Transformer可以说是深度学习领域最重要的,里程碑式的工作之一,发表于2017年的NIPS。该模型开创了自MLP(多层感知机)、CNN(卷积神经网络)和RNN(循环神经网络)之后的第四种基础模型。这项工作也成为当前AIGC盛行的最重要的基础,是Google公司对人工智能领域的卓越贡献。 T...

  • 医学图像目标跟踪论文阅读笔记 2024.03.08~2024.03.14

    时间:2024-03-21 15:59:52

    “Inter-fractional portability of deep learning models for lung target tracking on cine imaging acquired in MRI-guided radiotherapy” 2024年 期刊 Physical ...

  • 论文阅读_参数微调_P-tuning_v2

    时间:2024-03-21 15:06:17

    1 P-Tuning PLAINTEXT 1234567 英文名称: GPT Understands, Too中文名称: GPT也懂链接: https://arxiv.org/abs/2103.10385作者: Xiao Liu, Yanan Zheng, Zhengxiao Du, Ming ...

  • 【论文阅读】IRNet:具有像素间关系的实例分割的弱监督学习

    时间:2024-03-19 22:44:08

    【论文阅读】IRNet:具有像素间关系的实例分割的弱监督学习 文章目录 【论文阅读】IRNet:具有像素间关系的实例分割的弱监督学习一、介绍二、联系工作三、方法四、实验结果 Weakly Supervised Learning of Instance Segmentation with I...

  • 【论文阅读笔记】BapFL:You can backdoor personalized federated learning

    时间:2024-03-19 11:53:52

    个人阅读笔记,如有错误欢迎指出! 期刊:2024 TKDD BapFL : You can Backdoor Personalized Federated Learning | ACM Transactions on Knowledge Discovery from Data 问题:        ...

  • 论文阅读-PEPSI : Fast Image Inpainting with Parallel Decoding Network

    时间:2024-03-18 14:40:58

    1、摘要最近,采用具有上下文关注模块(CAM)的由粗到细网络的基于生成对抗网络(GAN)的方法在图像修复中显示出突出的结果。然而,由于该方法的特征编码分为两阶段,需要大量的计算资源。为了解决这一问题,本文提出了一种新的网络结构PEPSI:具有并行解码结构的快速图像修复。PEPSI采用由一个共享编码网...

  • 论文阅读笔记之RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignment

    时间:2024-03-18 14:00:24

    RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignment发表在ICCV2019上,是一篇利用GAN来解决基于RGB-IR的ReID问题的文章。摘要夜间行人重识别在视频监控、安防...

  • 【论文阅读】Generative Pretraining from Pixels

    时间:2024-03-17 14:23:05

    Generative Pretraining From Pixels 引用: Chen M, Radford A, Child R, et al. Generative pretraining from pixels[C]//International conference on machine l...

  • Ghost Module/GhostNet:一种模型压缩的轻量级模块/网络(论文阅读)(2)

    时间:2024-03-16 20:54:41

    温馨提示:(1)讲Ghost模块 (2)讲GhostNet,快速理解内容只需看图 GhostNet:1)是在MobileNetV3网络架构基础上改造的轻量级网络模型          2)用Ghost bottleneck取代了MobileNetV3中的bottleneck结构          3...

  • An Empirical Analysis of Anonymity in Zcash论文阅读笔记

    时间:2024-03-16 20:33:22

    1. Zcash的相关知识介绍1.1 Zcash的工作原理Zcash是一种从Bitcoin中分叉出来的代币, 其目的在于解决bitcoin中交易在执行过程中可以利用区块追踪交易记录的问题,进而使得交易难以追踪以提高匿名性.Zcash中的地址有两种,一种叫做transparent address,简称...

  • 论文阅读——ViTAE

    时间:2024-03-16 09:20:26

    ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias ViTAE旨在将细胞神经网络中固有的IB引入视觉转换器。如图2所示,ViTAE由两种类型的细胞组成,即RC和NC。RC负责将多尺度上下文和局部信息嵌入...

  • 【论文阅读】残差注意力网络Residual Attention Network

    时间:2024-03-15 14:03:02

    论文原文 - Residual Attention Network for Image Classification注意力注意力一般分为两种:一种是自上而下(top-down)的有意识的注意力,称为聚焦式(focus)注意力。聚焦式注意力是指有预定目的、依赖任务的、主动有意识地聚焦于某一对象的注意力...

  • Mask Scoring R-CNN论文阅读

    时间:2024-03-15 13:17:02

    为了以后的学习方便,把几篇计算机视觉的论文放上来,仅为自己的学习方便,本文仅将自己感兴趣部分简单翻译。排版对手机端不友好。为提高实例分割的性能,该论文寻找了一个新的方向——对生成的掩模进行评分。该论文基于Mask R-CNN,增加了一个Mask IoU head,它将mask head的输出和分类分...

  • 深度补全(一)-论文阅读-翻译(Depth Map Prediction from a Single Image using a Multi-Scale Deep Network)

    时间:2024-03-15 13:09:34

    摘要深度预测是理解场景三维几何结构的重要组成部分。对于立体图像来说,局部匹配就足够进行估计了,但是从单个图像中找到深度关系就不那么简单了,需要从各种线索中整合全局和局部信息。此外,这项任务本身是含糊不清的,很大一部分不确定性来自于总体规模。在本文中,我们提出了一种新的方法,通过使用两个深层网络栈来解...

  • 论文阅读:SuMa++: Efficient LiDAR-based Semantic SLAM

    时间:2024-03-10 21:27:48

    来源:IROS 2019 链接:https://ieeexplore.ieee.org/document/8967704 0、摘要 可靠、准确的定位和映射是大多数自动驾驶系统的关键组成部分。除了映射环境的几何信息外,语义在实现智能导航行为方面也起着重要作用。在大多数现实环境中,由于移动对象引起的动态...

  • 分布式多任务学习论文阅读(五):论文阅读总结

    时间:2024-03-09 17:59:41

    做为最后一篇分布式多任务学习的论文阅读记录,我决定对我目前为止粗读和精读的论文进行一次总结,然后陈述一些个人对该研究领域的见...

  • 【论文阅读】Segment Anything论文梳理

    时间:2024-03-09 13:55:04

    A. Segment Anything Model and Task Details 【图像编码器】 一般来说,图像编码器可以是任何输出C×H×W图像嵌入的网络。基于不同规模的和强大的预训练,我们使用MAE 预训练视觉transformer(ViT),以最小的适应来处理高分辨率输入,特别是ViT...

  • 论文阅读笔记1

    时间:2024-03-08 11:54:29

    DeepDiff: Deep-learning for predicting Differential gene expression from histone modif...