HOG目标检测

用HOG进行行人检测时，需要用训练好的支持向量机来对图片进行分类，在opencv中，支持向量机已经训练好，但自己来训练支持向量机才能更好的体会这一过程。

参考：http://blog.****.net/masikkk/article/category/2267523 （感谢这些无私奉献的博主）

下面是博主的代码。

#include <iostream>

#include <fstream>

#include <opencv2/core/core.hpp>

#include <opencv2/highgui/highgui.hpp>

#include <opencv2/imgproc/imgproc.hpp>

#include <opencv2/objdetect/objdetect.hpp>

#include <opencv2/ml/ml.hpp>

using namespace std;

using namespace cv;

#define PosSamNO 2400    //正样本个数

#define NegSamNO 12000    //负样本个数

#define TRAIN false    //是否进行训练,true表示重新训练，false表示读取xml文件中的SVM模型

#define CENTRAL_CROP true   //true:训练时，对96*160的INRIA正样本图片剪裁出中间的64*128大小人体

//HardExample：负样本个数。如果HardExampleNO大于0，表示处理完初始负样本集后，继续处理HardExample负样本集。

//不使用HardExample时必须设置为0，因为特征向量矩阵和特征类别矩阵的维数初始化时用到这个值

#define HardExampleNO 4435  

//继承自CvSVM的类，因为生成setSVMDetector()中用到的检测子参数时，需要用到训练好的SVM的decision_func参数，

//但通过查看CvSVM源码可知decision_func参数是protected类型变量，无法直接访问到，只能继承之后通过函数访问

class MySVM : public CvSVM

{

public:

    //获得SVM的决策函数中的alpha数组

    double * get_alpha_vector()

    {

        return this->decision_func->alpha;

    }

    //获得SVM的决策函数中的rho参数,即偏移量

    float get_rho()

    {

        return this->decision_func->rho;

    }

};

int main()

{

    //检测窗口(64,128),块尺寸(16,16),块步长(8,8),cell尺寸(8,8),直方图bin个数9

    HOGDescriptor hog(Size(,),Size(,),Size(,),Size(,),);//HOG检测器，用来计算HOG描述子的

    int DescriptorDim;//HOG描述子的维数，由图片大小、检测窗口大小、块大小、细胞单元中直方图bin个数决定

    MySVM svm;//SVM分类器

    //若TRAIN为true，重新训练分类器

    if(TRAIN)

    {

        string ImgName;//图片名(绝对路径)

        ifstream finPos("INRIAPerson96X160PosList.txt");//正样本图片的文件名列表

        //ifstream finPos("PersonFromVOC2012List.txt");//正样本图片的文件名列表

        ifstream finNeg("NoPersonFromINRIAList.txt");//负样本图片的文件名列表

        Mat sampleFeatureMat;//所有训练样本的特征向量组成的矩阵，行数等于所有样本的个数，列数等于HOG描述子维数

        Mat sampleLabelMat;//训练样本的类别向量，行数等于所有样本的个数，列数等于1；1表示有人，-1表示无人

        //依次读取正样本图片，生成HOG描述子

        for(int num=; num<PosSamNO && getline(finPos,ImgName); num++)

        {

            cout<<"处理："<<ImgName<<endl;

            //ImgName = "D:\\DataSet\\PersonFromVOC2012\\" + ImgName;//加上正样本的路径名

            ImgName = "D:\\DataSet\\INRIAPerson\\INRIAPerson\\96X160H96\\Train\\pos\\" + ImgName;//加上正样本的路径名

            Mat src = imread(ImgName);//读取图片

            if(CENTRAL_CROP)

                src = src(Rect(,,,));//将96*160的INRIA正样本图片剪裁为64*128，即剪去上下左右各16个像素

            //resize(src,src,Size(64,128));

            vector<float> descriptors;//HOG描述子向量

            hog.compute(src,descriptors,Size(,));//计算HOG描述子，检测窗口移动步长(8,8)

            //cout<<"描述子维数："<<descriptors.size()<<endl;

            //处理第一个样本时初始化特征向量矩阵和类别矩阵，因为只有知道了特征向量的维数才能初始化特征向量矩阵

            if(  == num )

            {

                DescriptorDim = descriptors.size();//HOG描述子的维数

                //初始化所有训练样本的特征向量组成的矩阵，行数等于所有样本的个数，列数等于HOG描述子维数sampleFeatureMat

                sampleFeatureMat = Mat::zeros(PosSamNO+NegSamNO+HardExampleNO, DescriptorDim, CV_32FC1);

                //初始化训练样本的类别向量，行数等于所有样本的个数，列数等于1；1表示有人，0表示无人

                sampleLabelMat = Mat::zeros(PosSamNO+NegSamNO+HardExampleNO, , CV_32FC1);

            }

            //将计算好的HOG描述子复制到样本特征矩阵sampleFeatureMat

            for(int i=; i<DescriptorDim; i++)

                sampleFeatureMat.at<float>(num,i) = descriptors[i];//第num个样本的特征向量中的第i个元素

            sampleLabelMat.at<float>(num,) = ;//正样本类别为1，有人

        }

        //依次读取负样本图片，生成HOG描述子

        for(int num=; num<NegSamNO && getline(finNeg,ImgName); num++)

        {

            cout<<"处理："<<ImgName<<endl;

            ImgName = "D:\\DataSet\\NoPersonFromINRIA\\" + ImgName;//加上负样本的路径名

            Mat src = imread(ImgName);//读取图片

            //resize(src,img,Size(64,128));

            vector<float> descriptors;//HOG描述子向量

            hog.compute(src,descriptors,Size(,));//计算HOG描述子，检测窗口移动步长(8,8)

            //cout<<"描述子维数："<<descriptors.size()<<endl;

            //将计算好的HOG描述子复制到样本特征矩阵sampleFeatureMat

            for(int i=; i<DescriptorDim; i++)

                sampleFeatureMat.at<float>(num+PosSamNO,i) = descriptors[i];//第PosSamNO+num个样本的特征向量中的第i个元素

            sampleLabelMat.at<float>(num+PosSamNO,) = -;//负样本类别为-1，无人

        }

        //处理HardExample负样本

        if(HardExampleNO > )

        {

            ifstream finHardExample("HardExample_2400PosINRIA_12000NegList.txt");//HardExample负样本的文件名列表

            //依次读取HardExample负样本图片，生成HOG描述子

            for(int num=; num<HardExampleNO && getline(finHardExample,ImgName); num++)

            {

                cout<<"处理："<<ImgName<<endl;

                ImgName = "D:\\DataSet\\HardExample_2400PosINRIA_12000Neg\\" + ImgName;//加上HardExample负样本的路径名

                Mat src = imread(ImgName);//读取图片

                //resize(src,img,Size(64,128));

                vector<float> descriptors;//HOG描述子向量

                hog.compute(src,descriptors,Size(,));//计算HOG描述子，检测窗口移动步长(8,8)

                //cout<<"描述子维数："<<descriptors.size()<<endl;

                //将计算好的HOG描述子复制到样本特征矩阵sampleFeatureMat

                for(int i=; i<DescriptorDim; i++)

                    sampleFeatureMat.at<float>(num+PosSamNO+NegSamNO,i) = descriptors[i];//第PosSamNO+num个样本的特征向量中的第i个元素

                sampleLabelMat.at<float>(num+PosSamNO+NegSamNO,) = -;//负样本类别为-1，无人

            }

        }

        ////输出样本的HOG特征向量矩阵到文件

        //ofstream fout("SampleFeatureMat.txt");

        //for(int i=0; i<PosSamNO+NegSamNO; i++)

        //{

        //    fout<<i<<endl;

        //    for(int j=0; j<DescriptorDim; j++)

        //        fout<<sampleFeatureMat.at<float>(i,j)<<"  ";

        //    fout<<endl;

        //}

        //训练SVM分类器

        //迭代终止条件，当迭代满1000次或误差小于FLT_EPSILON时停止迭代

        CvTermCriteria criteria = cvTermCriteria(CV_TERMCRIT_ITER+CV_TERMCRIT_EPS, , FLT_EPSILON);

        //SVM参数：SVM类型为C_SVC；线性核函数；松弛因子C=0.01

        CvSVMParams param(CvSVM::C_SVC, CvSVM::LINEAR, , , , 0.01, , , , criteria);

        cout<<"开始训练SVM分类器"<<endl;

        svm.train(sampleFeatureMat, sampleLabelMat, Mat(), Mat(), param);//训练分类器

        cout<<"训练完成"<<endl;

        svm.save("SVM_HOG.xml");//将训练好的SVM模型保存为xml文件

    }

    else //若TRAIN为false，从XML文件读取训练好的分类器

    {

        svm.load("SVM_HOG_2400PosINRIA_12000Neg_HardExample(误报少了漏检多了).xml");//从XML文件读取训练好的SVM模型

    }

    /*************************************************************************************************

    线性SVM训练完成后得到的XML文件里面，有一个数组，叫做support vector，还有一个数组，叫做alpha,有一个浮点数，叫做rho;

    将alpha矩阵同support vector相乘，注意，alpha*supportVector,将得到一个列向量。之后，再该列向量的最后添加一个元素rho。

    如此，变得到了一个分类器，利用该分类器，直接替换opencv中行人检测默认的那个分类器（cv::HOGDescriptor::setSVMDetector()），

    就可以利用你的训练样本训练出来的分类器进行行人检测了。

    ***************************************************************************************************/

    DescriptorDim = svm.get_var_count();//特征向量的维数，即HOG描述子的维数

    int supportVectorNum = svm.get_support_vector_count();//支持向量的个数

    cout<<"支持向量个数："<<supportVectorNum<<endl;

    Mat alphaMat = Mat::zeros(, supportVectorNum, CV_32FC1);//alpha向量，长度等于支持向量个数

    Mat supportVectorMat = Mat::zeros(supportVectorNum, DescriptorDim, CV_32FC1);//支持向量矩阵

    Mat resultMat = Mat::zeros(, DescriptorDim, CV_32FC1);//alpha向量乘以支持向量矩阵的结果

    //将支持向量的数据复制到supportVectorMat矩阵中

    for(int i=; i<supportVectorNum; i++)

    {

        const float * pSVData = svm.get_support_vector(i);//返回第i个支持向量的数据指针

        for(int j=; j<DescriptorDim; j++)

        {

            //cout<<pData[j]<<" ";

            supportVectorMat.at<float>(i,j) = pSVData[j];

        }

    }

    //将alpha向量的数据复制到alphaMat中

    double * pAlphaData = svm.get_alpha_vector();//返回SVM的决策函数中的alpha向量

    for(int i=; i<supportVectorNum; i++)

    {

        alphaMat.at<float>(,i) = pAlphaData[i];

    }

    //计算-(alphaMat * supportVectorMat),结果放到resultMat中

    //gemm(alphaMat, supportVectorMat, -1, 0, 1, resultMat);//不知道为什么加负号？

    resultMat = - * alphaMat * supportVectorMat;

    //得到最终的setSVMDetector(const vector<float>& detector)参数中可用的检测子

    vector<float> myDetector;

    //将resultMat中的数据复制到数组myDetector中

    for(int i=; i<DescriptorDim; i++)

    {

        myDetector.push_back(resultMat.at<float>(,i));

    }

    //最后添加偏移量rho，得到检测子

    myDetector.push_back(svm.get_rho());

    cout<<"检测子维数："<<myDetector.size()<<endl;

    //设置HOGDescriptor的检测子

    HOGDescriptor myHOG;

    myHOG.setSVMDetector(myDetector);

    //myHOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());

    //保存检测子参数到文件

    ofstream fout("HOGDetectorForOpenCV.txt");

    for(int i=; i<myDetector.size(); i++)

    {

        fout<<myDetector[i]<<endl;

    }

    /**************读入图片进行HOG行人检测******************/

    //Mat src = imread("00000.jpg");

    //Mat src = imread("2007_000423.jpg");

    Mat src = imread("1.png");

    vector<Rect> found, found_filtered;//矩形框数组

    cout<<"进行多尺度HOG人体检测"<<endl;

    myHOG.detectMultiScale(src, found, , Size(,), Size(,), 1.05, );//对图片进行多尺度行人检测

    cout<<"找到的矩形框个数："<<found.size()<<endl;

    //找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的话,则取外面最大的那个矩形框放入found_filtered中

    for(int i=; i < found.size(); i++)

    {

        Rect r = found[i];

        int j=;

        for(; j < found.size(); j++)

            if(j != i && (r & found[j]) == r)

                break;

        if( j == found.size())

            found_filtered.push_back(r);

    }

    //画矩形框，因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要做一些调整

    for(int i=; i<found_filtered.size(); i++)

    {

        Rect r = found_filtered[i];

        r.x += cvRound(r.width*0.1);

        r.width = cvRound(r.width*0.8);

        r.y += cvRound(r.height*0.07);

        r.height = cvRound(r.height*0.8);

        rectangle(src, r.tl(), r.br(), Scalar(,,), );

    }

    imwrite("ImgProcessed.jpg",src);

    namedWindow("src",);

    imshow("src",src);

    waitKey();//注意：imshow之后必须加waitKey，否则无法显示图像

    /******************读入单个64*128的测试图并对其HOG描述子进行分类*********************/

    ////读取测试图片(64*128大小)，并计算其HOG描述子

    ////Mat testImg = imread("person014142.jpg");

    //Mat testImg = imread("noperson000026.jpg");

    //vector<float> descriptor;

    //hog.compute(testImg,descriptor,Size(8,8));//计算HOG描述子，检测窗口移动步长(8,8)

    //Mat testFeatureMat = Mat::zeros(1,3780,CV_32FC1);//测试样本的特征向量矩阵

    ////将计算好的HOG描述子复制到testFeatureMat矩阵中

    //for(int i=0; i<descriptor.size(); i++)

    //    testFeatureMat.at<float>(0,i) = descriptor[i];

    ////用训练好的SVM分类器对测试图片的特征向量进行分类

    //int result = svm.predict(testFeatureMat);//返回类标

    //cout<<"分类结果："<<result<<endl;

    system("pause");

}

从代码中可以看出来，训练SVM分成了三部分：正样本训练、负样本训练、hardexample进行二次训练。里面有很多细节，比如如何裁剪合适大小的训练

图片，如何给这些图片命名，博主也给出了方法：http://blog.****.net/masibuaa/article/details/16104981（这是裁切负样本的方法，同样博主也给出了代码：

#include <iostream>

#include <fstream>

#include <stdlib.h> //srand()和rand()函数

#include <time.h> //time()函数

#include <opencv2/core/core.hpp>

#include <opencv2/highgui/highgui.hpp>

#include <opencv2/imgproc/imgproc.hpp>

#include <opencv2/objdetect/objdetect.hpp>

#include <opencv2/ml/ml.hpp>

using namespace std;

using namespace cv;

int CropImageCount = ; //裁剪出来的负样本图片个数

int main()

{

    Mat src;

    string ImgName;

    char saveName[];//裁剪出来的负样本图片文件名

    ifstream fin("INRIANegativeImageList.txt");//打开原始负样本图片文件列表

    //ifstream fin("subset.txt");

    //一行一行读取文件列表

    while(getline(fin,ImgName))

    {

        cout<<"处理："<<ImgName<<endl;

        ImgName = "D:\\DataSet\\INRIAPerson\\INRIAPerson\\Train\\neg\\" + ImgName;

        src = imread(ImgName);//读取图片

        //cout<<"宽："<<src.cols<<"，高："<<src.rows<<endl;

        //图片大小应该能能至少包含一个64*128的窗口

        if(src.cols >=  && src.rows >= )

        {

            srand(time(NULL));//设置随机数种子

            //从每张图片中随机裁剪10个64*128大小的不包含人的负样本

            for(int i=; i<; i++)

            {

                int x = ( rand() % (src.cols-) ); //左上角x坐标

                int y = ( rand() % (src.rows-) ); //左上角y坐标

                //cout<<x<<","<<y<<endl;

                Mat imgROI = src(Rect(x,y,,));

                sprintf(saveName,"noperson%06d.jpg",++CropImageCount);//生成裁剪出的负样本图片的文件名

                imwrite(saveName, imgROI);//保存文件

            }

        }

    }

    system("pause");

}

）

找出hardexample并进行二次训练：http://blog.****.net/masibuaa/article/details/16113373

#include <iostream>

#include <fstream>

#include <string>

#include <opencv2/core/core.hpp>

#include <opencv2/highgui/highgui.hpp>

#include <opencv2/imgproc/imgproc.hpp>

#include <opencv2/objdetect/objdetect.hpp>

#include <opencv2/ml/ml.hpp>

using namespace std;

using namespace cv;

int hardExampleCount = ; //hard example计数

int main()

{

    Mat src;

    char saveName[];//剪裁出来的hard example图片的文件名

    string ImgName;

    ifstream fin_detector("HOGDetectorForOpenCV_2400PosINRIA_12000Neg.txt");//打开自己训练的SVM检测器文件

    ifstream fin_imgList("INRIANegativeImageList.txt");//打开原始负样本图片文件列表

    //ifstream fin_imgList("subset.txt");

    //从文件中读入自己训练的SVM参数

    float temp;

    vector<float> myDetector;//3781维的检测器参数

    while(!fin_detector.eof())

    {

        fin_detector >> temp;

        myDetector.push_back(temp);//放入检测器数组

    }

    cout<<"检测子维数："<<myDetector.size()<<endl;

    //namedWindow("src",0);

    HOGDescriptor hog;//HOG特征检测器

    hog.setSVMDetector(myDetector);//设置检测器参数为自己训练的SVM参数

    //一行一行读取文件列表

    while(getline(fin_imgList,ImgName))

    {

        cout<<"处理："<<ImgName<<endl;

        string fullName = "D:\\DataSet\\INRIAPerson\\INRIAPerson\\Train\\neg\\" + ImgName;//加上路径名

        src = imread(fullName);//读取图片

        Mat img = src.clone();//复制原图

        vector<Rect> found;//矩形框数组

        //对负样本原图进行多尺度检测，检测出的都是误报

        hog.detectMultiScale(src, found, , Size(,), Size(,), 1.05, );

        //遍历从图像中检测出来的矩形框，得到hard example

        for(int i=; i < found.size(); i++)

        {

            //检测出来的很多矩形框都超出了图像边界，将这些矩形框都强制规范在图像边界内部

            Rect r = found[i];

            if(r.x < )

                r.x = ;

            if(r.y < )

                r.y = ;

            if(r.x + r.width > src.cols)

                r.width = src.cols - r.x;

            if(r.y + r.height > src.rows)

                r.height = src.rows - r.y;

            //将矩形框保存为图片，就是Hard Example

            Mat hardExampleImg = src(r);//从原图上截取矩形框大小的图片

            resize(hardExampleImg,hardExampleImg,Size(,));//将剪裁出来的图片缩放为64*128大小

            sprintf(saveName,"hardexample%09d.jpg",hardExampleCount++);//生成hard example图片的文件名

            imwrite(saveName, hardExampleImg);//保存文件

            //画矩形框，因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要做一些调整

            //r.x += cvRound(r.width*0.1);

            //r.width = cvRound(r.width*0.8);

            //r.y += cvRound(r.height*0.07);

            //r.height = cvRound(r.height*0.8);

            rectangle(img, r.tl(), r.br(), Scalar(,,), );

        }

        //imwrite(ImgName,img);

        //imshow("src",src);

        //waitKey(100);//注意：imshow之后一定要加waitKey，否则无法显示图像

    }

    system("pause");

}

以上就是训练部分。

在第一个代码中，我们还能看到，如何从训练好的SVM中的支持向量来生成OpenCV中的HOG描述子可用的检测子参数，再调用OpenCV中的多尺度检测进行检测。

问题：我训练出的支持向量只有一个，不知为何故？SVM中这些参数如何设置，有什么含义？如果我想用libsvm，该怎么做呢？

相关文章