Android studio ocr初级app开发问题汇总（含工程代码）

　　博客第一篇文章，稍作修改，增加文字介绍

　　开发目的

　　　　最近由于某些需求，需要在Android手机端实现OCR功能，大致为通过手机照相，识别出相片中的中文信息字段。但是由于新手光环+流程不熟悉，遇到了各种各样的问题，准备在本文中叙述一下，最好能派上用场。

　　开发环境

　　　　Android studio 2.3.3 Windows下，测试手机Android4.4版本

　　环境搭建

　　　　搭建安卓OCR开发环境.　

　　　　使用的google提供的OCR识别引擎，可以选择多种语言。

　　　　参考上述链接可以实现，最开始的搭建。这里需要注意的是：由于GitHub上的工程与当前新建的Gradle版本不匹配，导致android-maven错误，注意添加依赖。

　　大文件拷贝

　　　　由于OCR训练好的文件比较大，以中文识别为例，50MB左右大小，需要将文件放置于手机的SD卡中，便于TessBaseApi对象初始化。（init（）函数需要文件路径，目前没想到更好的方式）。

　　本文提出的解决方式：首先将chi_sim.traineddata文件放入asset文件夹中。在程序首次运行的时候，将文件拷贝到SD卡中，注意获取SD卡读写权限。拷贝函数如下：

Android studio ocr初级app开发问题汇总（含工程代码）

　　加入相机

　　以上步骤顺利的话，可以实现对图片的文字进行识别功能。为了实现对照相机得到的相片进行识别，需要打开摄像机。

Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);

startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

　　REQUST_ORIGINAL是自己定义的常量值，用于接收时，与requestcode值比对，判断是否为需要的数据。

 @Override

     protected void onActivityResult(int requestCode, int resultCode, Intent data) {

         super.onActivityResult(requestCode, resultCode, data);

          if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){

        　　 Bundle bdl = data.getExtras();

             Bitmap bmp = (Bitmap) bdl.get("data");

             ImageView im_camera = (ImageView)findViewById(R.id.img_camera);

             im_camera.setImageBitmap(bmp);

             mTess.clear();

             mTess.setImage(bmp);

             String result = mTess.getUTF8Text();

             TextView txtget = (TextView)findViewById(R.id.txt_get);

             txtget.setText(result);

         }

 }

　　在回调函数里，处理返回的图片数据，就可以实现初步的图片文字识别。但是这样返回的图片数据为缩略图，清晰的很低。如果想要对原始图片进行处理的话，需要换一种图片获取的方式。

首先，调用相机的时候，添加图片为文件存储的路径。

  Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);

         Uri uri;

         if(Build.VERSION.SDK_INT>=24)

         {

             File g= new File(picPath);//测试错误

             try {

                 g.createNewFile();

             } catch (IOException e) {

                 e.printStackTrace();

             }

             uri = FileProvider.getUriForFile(this,"xueyu404",g);

         }else{

             uri = Uri.fromFile(new File(picPath));

         }

         getImageByCamera.putExtra(MediaStore.EXTRA_OUTPUT,uri);

         startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

　　PicPath为String变量，意义为相机图片在sd卡上的存储路径。然后在回调函数里对图片进行处理。

由于Android 7.0在跨应用数据调用增加了限制，需要使用FileProvider获取uri，具体FileProvider配置参考一下链接

http://blog.****.net/hehe26/article/details/52921056

 if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){

             FileInputStream fis = null;

             try{

                 Log.e("sdpath2",picPath);

                 fis = new FileInputStream(picPath);

                 Bitmap bm = BitmapFactory.decodeStream(fis);

                 ImageView im_camera = (ImageView)findViewById(R.id.img_camera);

                 im_camera.setImageBitmap(bm);

                 mTess.setImage(bm );

                 String result = mTess.getUTF8Text();

                 TextView txtget = (TextView)findViewById(R.id.txt_get);

                 txtget.setText(result);

             }catch (FileNotFoundException e){

                 e.printStackTrace();

             }finally {

                 try {

                     fis.close();

                 } catch (IOException e) {

                     e.printStackTrace();

                 }

             }

         }

         else {

             Toast.makeText(this,"没有拍到照片",Toast.LENGTH_SHORT).show();

         }

　　　　运行效率

　　　　通过上述的过程，可以完成，基本的文字识别的功能。但仍然存在着不能忽略的问题。

　　　　一，使用缩略图进行识别的时候，运行速率可以接受，对于特别大的文字识别还可以。但是由于图片被压缩过，如果图片中存在比较小的文字基本不能识别。

　　　　二，使用后面提到的原始图片进行识别的话，由于手机的计算能力有限，识别的计算过程相当耗时。识别过程要放到另外的线程中单独运行，否则会卡死UI线程，假死。但是即使新建线程，需要的时间也远超用户的忍耐限度。

　　　　改进优化

　　　　由于图片原图比较大的原因，对整个图片进行识别的效果也不理想。所以本文建议在拍摄照片之后，用户用手指圈定识别区域文字。圈定区域的控件，见我的另外一篇博客

　　　　Android 通过触摸动态地在屏幕上画矩形

　　　　此外，识别过程，控件初始化过程比较耗时，放置在UI线程中卡顿不可忍耐。本文采用线程池的方式，处理上述两个过程。

　　　　最终效果图

　　　　 Android studio ocr初级app开发问题汇总（含工程代码）

　　　　　先点击相机拍照按钮，拍要识别的照片，再点击选取区域按钮，用手指画一个矩形框，圈好识别区域（如果矩形没画好可以再点击选取区域重新画），

最后点击文字识别等待结果显示。

工程代码链接：https://github.com/dutxueyu/Android_ocr_app