【论文笔记】《基于深度学习的中文命名实体识别研究》阅读笔记
作者及其单位:北京邮电大学,张俊遥,2019年6月,硕士论文摘要实验数据:来源于网络公开的新闻文本数据;用随机欠采样和过采样的方法解决分类不均衡问题;使用BIO格式...
论文笔记--PCN:Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
关键词:rotation-invariant face detection, rotation-in-plane, coarse-to-fine核心概括:该篇文章为中科院计算所智能信息处理重点实验室VIPL课题组,邬书哲博士在CVPR2018上的论文。论文主要针对的是在不同平面角度下的人脸检测,主题...
论文笔记:语音情感识别(四)语音特征之声谱图,log梅尔谱,MFCC,deltas
介绍最近看语音情感识别论文中用到的各种语音特征,主要是声谱图(spectrogram),log梅尔声谱图(log-mels)...
论文笔记:IRGAN:A Minimax Game for Unifying Generative and Discriminative Information
2017 SIGIR简单介绍IRGAN将GAN用在信息检索(Information Retrieval)领域,通过GAN的思想将生成检索模型和判别检索模型统一起来,对于生成器采用了基于策略梯度的强化学习来训练,在三种典型的IR任务上(四个数据集)得到了更显著的效果。生成式和判别式的检索模型生成式检索...
论文笔记:Deeper and Wider Siamese Networks for Real-Time Visual Tracking
Deeper and Wider Siamese Networks for Real-Time Visual TrackingUpdated on 2019-04-01 16:10:37Paper (arXiv V3):https://arxiv.org/pdf/1901.01660.pdfCode...
论文笔记之: Recurrent Models of Visual Attention
Recurrent Models of Visual AttentionGoogle DeepMind模拟人类看东西的方式,我们并非将目光放在整张图像上,尽管有时候会从总体上对目标进行把握,但是也是将目光按照某种次序(例如,从上倒下,从左到右等等)在图像上进行扫描,然后从一个区域转移到另一个区域。这...
深度学习论文笔记-Deep Learning Face Representation from Predicting 10,000 Classes
来自:CVPR 2014 作者:Yi Sun ,Xiaogang Wang,Xiaoao Tang题目:Deep Learning Face Representation from Predicting 10,000 Classes主要内容:通过深度学习来进行图像高级特征表示(DeepID),进...
论文笔记:Deformable ConvNets v2: More Deformable, Better Results
概要MSRA在目标检测方向Beyond Regular Grid的方向上越走越远,又一篇大作推出,相比前作DCN v1在COCO上直接涨了超过5个点,简直不要太疯狂。文章的主要内容可大致归纳如下:More dconv and Modulated donv:认为前作中卷积变形时容易采样到不好的位置,例...
论文笔记:Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking
Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking2019-03-20 16:45:23Paper:https://arxiv.org/pdf/1812.06148.pdfCode:(尚无)背景与动机:本文提...
[论文笔记] Methodologies for Data Quality Assessment and Improvement (ACM Comput.Surv, 2009) (1)
Carlo Batini, Cinzia Cappiello, Chiara Francalanci, and Andrea Maurino. 2009. Methodologies for data quality assessment and improvement. ACM Comput. S...
论文笔记《ImageNet Classification with Deep Convolutional Neural Network》
一、摘要了解CNN必读的一篇论文,有些东西还是可以了解的。二、结构1、 Relu的好处: 1、在训练时间上,比tanh和sigmod快,而且BP的时候求导也很容易2、因为是非饱和函数,所以基本不会出现梯度消失的情况Relu只要控制好learing rate,可以说是完胜之前的激活函数,也因此可以帮助...
OCR之论文笔记TrOCR
文章目录 TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models一. 简介二. TrOCR2.1. Encoder2.2 Decoder2.3 Model Initialiaztion2.4 Ta...
【论文笔记】UNet
语义分割的U-Net网络结构Unet是2015年诞生的模型,它几乎是当前segmentation项目中应用最广的模型。Unet能从更少的训练图像中进行学习,当它在少于40张图的生物医学数据集上训练时,IOU值仍能达到92%。Unet网络非常简单,前半部分作用是特征提取,后半部分是上采样。在一些文献中...
【论文笔记】FCN全卷积网络
全卷积网络(FCN)是用于图片语义分割的一种卷积神经网络(CNN),由Jonathan Long,Evan Shelhamer 和Trevor Darrell提出,由此开启了深度学习在语义分割中的应用。语义分割是计算机视觉领域很重要的一个分支,在自动驾驶、地面检测等方面都起到很重要作用。与简单区分前...
论文笔记:Visualizing and Understanding Convolutional Networks
2014 ECCV纽约大学 Matthew D. Zeiler, Rob Fergus简单介绍(What)提出了一种可视化的技巧,能够看到CNN中间层的特征功能和分类操作。通过对这些可视化信息进行分析,我们可以直观了解和分析CNN学到的特征(中间层特征对应什么样的图像)可以找到提升模型的办法(观察中...
论文笔记:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks
SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks2019-04-02 12:44:36Paper:https://arxiv.org/pdf/1812.11703.pdfProject:https://lb...
学习《Hardware-Efficient Bilateral Filtering for Stereo Matching》一文笔记。
个人收藏了很多香港大学、香港科技大学以及香港中文大学里专门搞图像研究一些博士的个人网站,一般会不定期的浏览他们的作品,最近在看杨庆雄的网点时,发现他又写了一篇双边滤波的文章,并且配有源代码,于是下载下来研读了一番,这里仅仅对一些过程做简单的记录,以防时间久了忘记。 关于杨庆雄的相关文章可见:Hard...
机器学习技术系列:一篇图文笔记了解【机器学习基础知识】
导言最近有小半年由近半数工作和生活时间在机器学习技术(ML)的学习与工程实践中,感觉自己阅读了几本ML方面好书,找到了一些更好的学习网站,所以重新梳理了一下自己理解的的ML基础知识。相关参考摘录书籍及网站如下《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》(第2版)《...
论文笔记之: Bilinear CNN Models for Fine-grained Visual Recognition
Bilinear CNN Models for Fine-grained Visual RecognitionCVPR 2015本文提出了一种双线性模型( bilinear models),一种识别结构,该结构由两个特征提取器产生,两个输出是图像每一个位置的外积(outer product),然后进...
深度学习论文笔记之(一)HED边缘检测
Abstract 创新点: 用cnn做edge detection (HED),端到端 解决两个问题: 1)holistic(整体的) image training and prediction; 2)multi-scale and multi-level feature learning...