Caffe-windows上训练自己的数据

1.数据获取

在网上选择特定类别，下载相应的若干张图片。可以网页另存或者图片下载器。本例中保存了小狗、菊花、梅花三类各两百多张。

2.重命名

 import os

 import os.path

 rootdir = "jh"

 i=1

 for parent,dirnames,filenames in os.walk(rootdir):

    for filename in filenames:

       newName=a+str(i)+".jpg"

       print  filename+" -> "+newName

       os.rename(os.path.join(parent,filename), os.path.join(parent, newName))

       i+=1

3.更改分辨率

 from PIL import Image

 import glob, os

 w,h = 256,256

 def timage():

     for files in glob.glob('jh\*.jpg'):

         filepath,filename = os.path.split(files)

         filterame,exts = os.path.splitext(filename)

         opfile = r'jh\jhout\\'

         if (os.path.isdir(opfile)==False):

             os.mkdir(opfile)

         im=Image.open(files)

         im_ss=im.resize((int(w), int(h)))

         try:

            im_ss.save(opfile+filterame+'.jpg')

         except:

            print filterame

            os.remove(opfile+filterame+'.jpg')

 if __name__=='__main__':

     timage()

4.获取标签

 import glob, os, shutil

 def timage():

     names=["gg","jh"]

     t=open("train.txt",'a')

     v=open("val.txt",'a')

     for files in glob.glob('jh\jhout\*.jpg'):

         filepath,filename = os.path.split(files)

         filterame,exts = os.path.splitext(filename)

         oldfile = r'jh\jhout\\'

         opfile = r'val\\'

         if (os.path.isdir(opfile)==False):

             os.mkdir(opfile)

         if 200< int(filterame[2:]):  # test data

             shutil.move(oldfile+filterame+'.jpg',opfile+filterame+'.jpg')

             v.write(filterame+'.jpg '+str(names.index("jh"))+'\n')

         else:  # train data

             t.write('jhout/'+filterame+'.jpg '+str(names.index("jh"))+'\n')

     t.close()

     v.close()

 if __name__=='__main__':

     timage()

5.生成对应的leveldb格式数据

SET GLOG_logtostderr=

Build\x64\Release\convert_imageset.exe examples/t/train/ examples/t/train/train.txt examples/t/trainldb

pause

SET GLOG_logtostderr=

Build\x64\Release\convert_imageset.exe examples/t/val/ examples/t/val/val.txt examples/t/valldb

pause

6.计算均值

SET GLOG_logtostderr=

Build\x64\Release\compute_image_mean.exe examples/t/trainldb examples/t/tmean.binaryproto

pause

7.修改网络

models/bvlc_alexnet/train_val.prototxt

修改其中的num_output, batch_size和相应的路径

solver.prototxt如下，其中gamma指的是在学习率为step模式化下，每400次迭代变为原来的0.9倍。

net: "examples/t/train_val.prototxt"

test_iter:

test_interval:

base_lr: 0.0001

lr_policy: "step"

gamma: 0.9

stepsize:

display:

max_iter:

momentum: 0.9

weight_decay: 0.001

snapshot:

snapshot_prefix: "caffe_train"

solver_mode: GPU

8.训练网络

cd ../../

"Build/x64/Release/caffe.exe" train --solver=examples/t/solver.prototxt

pause

9.运行结果

在仅使用小狗和菊花两类，训练200张测试50张，可以达到98%的正确率。

使用小狗、菊花、梅花三类，可以达到89%的正确率。

Caffe-windows上训练自己的数据

10.优化

之前将train_val.prototxt中的crop_size: 227改成了128，速度相对快很多。

在三类分类中改回227，正确率在92%左右波动，进一步修改base_lr: 0.00015，gamma: 0.93，正确率可以达到94.6%。

Caffe-windows上训练自己的数据

秒客网

Caffe-windows上训练自己的数据

1.数据获取

2.重命名

3.更改分辨率

4.获取标签

5.生成对应的leveldb格式数据

6.计算均值

7.修改网络

8.训练网络

9.运行结果

10.优化

相关文章