opencv 手写选择题阅卷 (三)训练分类器
1,分类器选择:SVM
本来一开始用的KNN分类器,但这个分类器目前没有实现保存训练数据的功能,所以选择了SVN分类器;
2,样本图像的预处理和特征提取代码与识别代码中使用一样的代码.
3,训练时的输入数据主要为两个矩阵,一个矩阵保存所有样本的特征数据,每一行一个图像,另一个矩阵保存每个样本所属的类别,比如 1.0代表A,2.0代表B,0代表空白.
4,所有样本分别保存在5个文件夹中(一个是空白,四个字母ABCD),用批处理生成一个文本文件包括所有样本文件文件名和分类:
目前只使用了四个人书写的60个字母和几个空白样本,后期再增加更多人的更多样本,文本文件内容如下样式:
1 A\2016072316013018.png
1 A\2016072316013022.png
1 A\2016072316013026.png
2 B\2016072316010401.png
2 B\2016072316010405.png
2 B\2016072316010409.png
;//每个字符多个个图片 FILE * pf = fopen(listname,"r"); if (pf == NULL){ printf("没有发现样本列表文件;\n"); return; } ]; ){ , pf)) break; ) continue; n_img++; } HOGDescriptor *hog = , ), cvSize(, ), cvSize(, ), cvSize(, ), ); int nw = hog->getDescriptorSize(); CvMat * trainData = cvCreateMat(n_img, nw, CV_32FC1); CvMat * trainClasses = cvCreateMat(n_img, , CV_32FC1); //每个样本都要提取特征,写入到训练矩阵 ] = ""; strcpy(path, listname); int path_len = strlen(listname); ; i--){ if (path[i] == '\\'){ path[i+] = '\0'; break; } } fseek(pf, , SEEK_SET); ;//训练数据中的第N个 ){ , pf)) break; ) continue; char * str_lable = line; char * str_imgname = NULL; int line_len = strlen(line); ; i < line_len; i++) { if (line[i] == ' '){ line[i] == '\0'; str_imgname = line + i + ; break; } } if (str_imgname == NULL) continue; ] = ""; strcpy(img_name, path); strcat(img_name, str_imgname); img_name[strlen(img_name) - ] = '\0'; IplImage* src = cvLoadImage(img_name, ); if (src == NULL) { printf("打开样本图片出错:%s;\n", img_name); continue; } IplImage* train_img = cvCreateImage(cvSize(, ), , ); preproc_img(src, train_img); vector<float> descriptors;//存放结果 hog->compute(train_img, descriptors, Size(, ), Size(, )); //Hog特征计算 ; for (vector<float>::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++) { cvmSet(trainData, nItem, n, *iter);//存储HOG特征 n++; } double val = strtod(str_lable, NULL); cvmSet(trainClasses, nItem, , val); cvReleaseImage(&src); cvReleaseImage(&train_img); nItem++; } if (nItem != n_img){ printf("实际样本数据与列表中样本数据不同;\n"); } fclose(pf); CvSVM svm;//新建一个SVM CvSVMParams param;//这里是SVM训练相关参数 CvTermCriteria criteria; criteria = cvTermCriteria(CV_TERMCRIT_EPS, , FLT_EPSILON); param = CvSVMParams(CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria); svm.train(trainData, trainClasses, NULL, NULL, param);//训练数据 //保存训练好的分类器 svm.save("HOG_SVM_DATA.xml"); cvReleaseMat(&trainData); cvReleaseMat(&trainClasses); }