阅读《RobHess的SIFT源码分析:综述》笔记

时间:2021-04-05 22:24:18

今天总算是机缘巧合的找到了照样一篇纲要性质的文章。

如是能早一些找到就好了。不过“在你认为为时已晚的时候,其实还为时未晚”倒是也能聊以自慰,不过不能经常这样迷惑自己,毕竟我需要开始跑了!

就照着这个大纲往下走走,说不定会有意想不到的收获,然后把多视点的问题加进去,或许应该能有所成效。

嗯,其他的太多的东西想来也无用。

我觉得现在比较重要的事情是,顺着这样一篇文章继续我要做的东西。

原文《RobHess的SIFT源码分析:综述》地址:

http://blog.csdn.net/masibuaa/article/details/9191309

文章首先给出建议看一下stitcher,发现之前就已经阅读过了:

本博之前简单解析过:http://www.cnblogs.com/letben/p/5338443.html,的确未有很大意义。

拼接样例前面也已经介绍过了。

然后发现一个回环【我终于想起来,为什么要写日志了。因为碰到断点不知道怎么处理了】

图像拼接及源码下载参见此篇博文:基于sift特征的全景图像拼接

在SIFT特征提取的时候要调用RobHess源码,参见《RobHess的SIFT源码分析:综述》

嗯,还没有看

http://blog.csdn.net/masibuaa/article/details/9246493

这个里面的详细内容,不过应该十分有益处。照着读一遍,跑一遍,应该是下限。

所以在它的基于sift特征的全景图拼接,应该就是一个最小集合吧。或许他翻源码比较细致。应该还有很多其他的内容的。也就是说,这篇只是一个代码,需要通过读代码,把里面的思想抽取出来,记录一下。

//TODO

然后断点回来先不看代码。

回到综述:

http://blog.csdn.net/masibuaa/article/details/9191309大概明白了这个robhess应该是个人名。

然后直到http://robwhess.github.io/opensift/ 再到:https://github.com/robwhess/opensift/zipball/master

发现应该是在给他上面共享了自己代码的同学,所以猜测masikkk应该是错写了robwhess的名字。博主也是能力巨大,硬生生给 罗伯维斯 起了个新的英文名字。。。

简单写一下

http://robwhess.github.io/opensift/

这个里面说的东西,不知怎么的,现在无论是看中文还是英文总是什么都记不住了,老了吧,还是懒了吧。。。或许是长期迷茫导致的不能学习综合征。

所以还是翻译一下吧:大概也算是自己真的读了这样一篇文章:

尺度不变特征转化(SIFT)是一个用来检测独特稳定图像特征的方法,它可以很轻松的进行图片之间的检测从而进行诸如物体检测识别或者计算图像之间的物理转换的任务。这个开源sift库是可到达的。它由使用C语言的opencv开源计算机视觉库和包括图片之间的sift特征的计算,以及使用kd树进行sift特征的匹配和从特征中使用随机抽样一致方法来计算集合图片的转换构成。这个库也包括功能导入并且他在图片上的特征的工作来源于David Lowe的sift的可行【executable】和牛津【VGG】仿射协变特征检测。http://www.cs.ubc.ca/~lowe/keypoints/下面的图片描述了这样一个功能。

第一幅图:单单只从两幅图片之间检测sift特征

第二幅图:再sift之后在经过随机抽样一直,得到的结果。【虽然还是有些不太符合的点,不过已经很好了】

依赖:

opencv的版本高于2.1

gtk+2 的版本高于2.9【然而并不知道什么是gtk,g什么工具包】

参考:

开源sift库 RHess ACM MM2010 【人名,大会名,年份?】

来自尺度不变关键点的独特图像特征

背景:

然后是专利通告。

所以我才要是想跑起来这个程序除了我们已经要配置好opencv以外,还有配置的有gtk。好在他们都是免费的。不过感觉配置gtk,,,好像要费点儿事儿,我滴妈呀。。。【不行已经读不下去了,果然,英语不是母语,看起来真的好费劲。。。】

下午跟老师 讨论了一下,说了一些内容

1、对于加权拼接,怎么做,我们会有很多sift点,但是其实我们只需要重合的一小部分,在速度上的问题。也就是我之前提到过的,对于我截取的桌面图的拼接。怎么做。

2、对于一段视频中的内容,比如视频内是关于车牌的信息,但是并不清楚,如果能从这些不清楚的汽车中提取出一个比较清楚的车牌信息,这个是否有办法做到,也就是说能否通过一系列单张模糊照片得到一个较为清晰的照片的这个事儿,老师给出的意见是:视频可以得到图像,图像根据第一章或者中间的某一张作为基准,无限贴合,看是否能得到一个比较好的结果。

现在的当务之急是:图像融合的部分,做这个加权,以及模糊得到清晰。

刚刚得到了一些比较重要的文献的连接:其实之前就看到过只是忘记了。。。

然后刚刚原来博客上就剩一个

一些SIFT算法和全景拼接测试用图下载,包含牛津大学网站上提供的测试图

然后是下面的正文部分。

看一下,再看一下基本融合。其实主要是一个基本算法,要是能自己实现一个拼接说实话,后面的很多研究都还是比较好做的。先到这儿吧