Deep Learning学习随记（二）Vectorized、PCA和Whitening

接着上次的记，前面看了稀疏自编码。按照讲义，接下来是Vectorized，翻译成向量化？暂且这么认为吧。

Vectorized：

这节是老师教我们编程技巧了，这个向量化的意思说白了就是利用已经被优化了的数值运算来编程，矩阵的操作

尽量少用for循环，用已有的矩阵运算符来操作。这里只是粗略的看了下，有些小技巧还是不错的。

PCA:

PCA这个以前都接触过了，简单说就是两步：

1.协方差矩阵 Deep Learning学习随记（二）Vectorized、PCA和Whitening 其中x^（i）是输入样本（假设已经均值化）。

2.SVD分解，得出U向量。其中U向量的每列就是样本的新的方向向量。前面的是主方向。然后用U'*x得到

PCA后的样本值x_rot： Deep Learning学习随记（二）Vectorized、PCA和Whitening

Whitening：

我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤，这个预处理过程称为whitening（一些文献中也叫shpering）。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，如果用原始图像数据作为输入的话，输入是冗余的。whitening的目的就是降低输入的冗余性；更正式的说，我们希望通过whitening过程使得学习算法的输入具有如下性质：(i)特征之间相关性较低；(ii)所有特征具有相同的方差。

由于PCA以后已经满足了第一个条件（特征之间不相关的），因此需要满足第二个条件。讲义提到了两种whitening方法：

1)PCA whitening:

为了使每个输入特征具有单位方差，我们可以直接使用1/ √λ_i 来缩放每个特征，

Deep Learning学习随记（二）Vectorized、PCA和Whitening

2）ZCA whitening：

由于使数据的协方差矩阵变为单位矩阵的方式不唯一，如假设R是正交矩阵（R^TR=RR^T=I），那么Rx_PCAwhite仍然具有单位协方差。取R = U，

则是ZCA whitening，

Deep Learning学习随记（二）Vectorized、PCA和Whitening .

注：考虑到λ_i某些时候会很小，接近于0，在除的时候要进行正则化，加上一个很小的ε（一般取值为10^-5）.

另外讲义中提到关于ZCAwhitening一点有意思的就是：事实证明这也是一种对生物眼睛(视网膜)处理图像的粗糙的模型。眼睛感知图像时，由于一幅图像中相邻的部分在亮度上十分相关，大多数临近的“像素”在眼中被感知为相近的值。人眼如果分别传输每个像素（通过视觉神经）到大脑中，会非常不划算。取而代之的是，视网膜进行一个与ZCA中相似的去相关操作 (这是由视网膜上的ON-型和OFF-型光感受器细胞将光信号转变为神经信号完成的)。由此得到对输入图像的更低冗余的表示，并将它传输到大脑。

实现：

这里也是看了tornadomeet的代码：http://www.cnblogs.com/tornadomeet/archive/2013/03/21/2973631.html，代码挺简单的，看了这些，matlab有所了解了，以后也尝试着自己先写一下了。

close all

%%================================================================

%% Step : Load data

%  We have provided the code to load data from pcaData.txt into x.

%  x is a  *  matrix, where the kth column x(:,k) corresponds to

%  the kth data point.Here we provide the code to load natural image data into x.

%  You do not need to change the code below.

x = load('pcaData.txt','-ascii');

figure();

scatter(x(, :), x(, :));

title('Raw data');

%%================================================================

%% Step 1a: Implement PCA to obtain U

%  Implement PCA to obtain the rotation matrix U, which is the eigenbasis

%  sigma. 

% -------------------- YOUR CODE HERE --------------------

u = zeros(size(x, )); % You need to compute this

[n m] = size(x);

%x = x-repmat(mean(x,),,m);%预处理，均值为0

sigma = (1.0/m)*x*x';

[u s v] = svd(sigma);

% --------------------------------------------------------

hold on

plot([ u(,)], [ u(,)]);%画第一条线

plot([ u(,)], [ u(,)]);%第二条线

scatter(x(, :), x(, :));

hold off

%%================================================================

%% Step 1b: Compute xRot, the projection on to the eigenbasis

%  Now, compute xRot by projecting the data on to the basis defined

%  by U. Visualize the points by performing a scatter plot.

% -------------------- YOUR CODE HERE --------------------

xRot = zeros(size(x)); % You need to compute this

xRot = u'*x;

% -------------------------------------------------------- 

% Visualise the covariance matrix. You should see a line across the

% diagonal against a blue background.

figure();

scatter(xRot(, :), xRot(, :));

title('xRot');

%%================================================================

%% Step : Reduce the number of dimensions from  to .

%  Compute xRot again (this time projecting to  dimension).

%  Then, compute xHat by projecting the xRot back onto the original axes

%  to see the effect of dimension reduction

% -------------------- YOUR CODE HERE --------------------

k = ; % Use k =  and project the data onto the first eigenbasis

xHat = zeros(size(x)); % You need to compute this

m_u = u(:,);

xx = [u(:,),zeros(n,)];

xxx = [u(:,),zeros(n,)]'*x;

xHat = u*([u(:,),zeros(n,)]'*x);

% --------------------------------------------------------

figure();

scatter(xHat(, :), xHat(, :));

title('xHat');

%%================================================================

%% Step : PCA Whitening

%  Complute xPCAWhite and plot the results.

epsilon = 1e-;

% -------------------- YOUR CODE HERE --------------------

xPCAWhite = zeros(size(x)); % You need to compute this

xPCAWhite = diag(./sqrt(diag(s)+epsilon))*u'*x;

% --------------------------------------------------------

figure();

scatter(xPCAWhite(, :), xPCAWhite(, :));

title('xPCAWhite');

%%================================================================

%% Step : ZCA Whitening

%  Complute xZCAWhite and plot the results.

% -------------------- YOUR CODE HERE --------------------

xZCAWhite = zeros(size(x)); % You need to compute this

xZCAWhite = u*diag(./sqrt(diag(s)+epsilon))*u'*x;

% --------------------------------------------------------

figure();

scatter(xZCAWhite(, :), xZCAWhite(, :));

title('xZCAWhite');

%% Congratulations! When you have reached this point, you are done!

%  You can now move onto the next PCA exercise. :)

Deep Learning学习随记（二）Vectorized、PCA和Whitening的更多相关文章

Deep Learning学习随记（一）稀疏自编码器
最近开始看Deep Learning,随手记点,方便以后查看. 主要参考资料是Stanford 教授 Andrew Ng 的 Deep Learning 教程讲义:http://deeplearnin ...
Deep Learning 学习随记（六）Linear Decoder 线性解码
线性解码器(Linear Decoder) 前面第一章提到稀疏自编码器(http://www.cnblogs.com/bzjia-blog/p/SparseAutoencoder.html)的三层网络 ...
Deep Learning 学习随记（五）深度网络--续
前面记到了深度网络这一章.当时觉得练习应该挺简单的,用不了多少时间,结果训练时间真够长的...途中debug的时候还手贱的clear了一下,又得从头开始运行.不过最终还是调试成功了,sigh~ 前一篇 ...
Deep Learning 学习随记（五）Deep network 深度网络
这一个多周忙别的事去了,忙完了,接着看讲义~ 这章讲的是深度网络(Deep Network).前面讲了自学习网络,通过稀疏自编码和一个logistic回归或者softmax回归连接,显然是3层的.而这 ...
Deep Learning 学习随记（四）自学习和非监督特征学习
接着看讲义,接下来这章应该是Self-Taught Learning and Unsupervised Feature Learning. 含义: 从字面上不难理解其意思.这里的self-taught ...
Deep Learning 学习随记（三）Softmax regression
讲义中的第四章,讲的是Softmax 回归.softmax回归是logistic回归的泛化版,先来回顾下logistic回归. logistic回归: 训练集为{(x(1),y(1)),...,(x( ...
Deep Learning 学习随记（八）CNN（Convolutional neural network）理解
前面Andrew Ng的讲义基本看完了.Andrew讲的真是通俗易懂,只是不过瘾啊,讲的太少了.趁着看完那章convolution and pooling, 自己又去翻了翻CNN的相关东西. 当时看讲 ...
Deep Learning 学习随记（七）Convolution and Pooling --卷积和池化
图像大小与参数个数: 前面几章都是针对小图像块处理的,这一章则是针对大图像进行处理的.两者在这的区别还是很明显的,小图像(如8*8,MINIST的28*28)可以采用全连接的方式(即输入层和隐含层直接 ...
Deep Learning 学习随记（三）续 Softmax regression练习
上一篇讲的Softmax regression,当时时间不够,没把练习做完.这几天学车有点累,又特别想动动手自己写写matlab代码所以等到了现在,这篇文章就当做上一篇的续吧. 回顾: 上一篇最后给 ...

随机推荐

Ajax工作原理
在写这篇文章之前,曾经写过一篇关于AJAX技术的随笔,不过涉及到的方面很窄,对AJAX技术的背景.原理.优缺点等各个方面都很少涉及null.这次写这篇文章的背景是因为公司需要对内部程序员做一个培训.项 ...
An interesting experiment on China&rsquo&semi;s censorship
This paper presented a very interesting topic. Censorship in China has always drawn people's attenti ...
【转】JSONP简介
原文链接:说说JSON和JSONP,也许你会豁然开朗,含jQuery用例先说说JSONP是怎么产生的: 1.一个众所周知的问题,Ajax直接请求普通文件存在跨域无权限访问的问题,甭管你是静态页面. ...
从零开始学习MySQL3---数据库的基本操作
创建数据库 MySQL安装完成后,将会在其Data目录下自动创建几个必需的数据库可以用 SHOW DATABASES: 来查看当前存在的数据库创建数据库是在系统磁盘上划分一块区域用于数据的存储和 ...
android 中文件加密解密算法实战
现在项目里面有一个需求,本项目里面下载的视频和文档都不允许通过其他的播放器播放,在培训机构里面这样的需求很多.防止有人交一份钱,把所有的课件就拷给了别人.这样的事情培训机构肯定是不愿意的.现在我项目里 ...
poj2975--Nim
题意:对于一个给定的取石子游戏,有多少种先手策略获胜? Ans:若无法获胜,则输出0. 若能获胜我们只要找到一堆石子,使得我们能取它的一部分让总和的异或和变为0.我们先将整个游戏的值异或起来为s 则a ...
尝试使用Memcached
尝试使用Memcached遇到的狗血问题乘着有时间,尝试下利用Memcached进行分布式缓存,其中遇到了不少问题及狗血的事情,开篇记录下,希望对您有帮助. 我之前的项目为:Asp.Net MV ...
使用fabric解决百度BMR的spark集群各节点的部署问题
前言和小伙伴的一起参加的人工智能比赛进入了决赛之后的一段时间里面,一直在构思将数据预处理过程和深度学习这个阶段合并起来.然而在合并这两部分代码的时候,遇到了一些问题,为此还特意写了脚本文件进行处理. ...
smallcorgi/Faster-RCNN&lowbar;TF训练自己的数据
熟悉了github项目提供的训练测试后,可以来训练自己的数据了.本文只介绍改动最少的方法,只训练2个类, 即自己添加的类(如person)和 background,使用的数据格式为pascal_voc ...
Nginx详解二十九：基于Nginx的中间件架构设计
基于Nginx的中间件架构一:了解需求 1.定义Nginx在服务体系中的角色 1.静态资源服务 2.代理服务 3.动静分离 2.静态资源服务的功能设计 3.代理服务二:设计评估三:配置注意事项