简单验证码的识别:Bitmap类的使用

时间:2023-01-07 14:30:17

  验证码的智能识别是一项比较复杂的工作,甚至需要掌握点图像学的知识。

  当然对于写程序的来说不用那么深入,只需要掌握几个常规步骤就行了。

  验证码图像识别步骤:1、获取图像  2、清除边框  3、灰度处理  4、二值化处理  5、噪点处理  6、图像分割  7、识别单个数字  8、拼接验证码

一、获取图像

  图像一般是远程的,所以需要用到WebRequest:

     public Bitmap GetImg(string imgUrl)
{
WebRequest wreq = WebRequest.Create(imgUrl);
wreq.Timeout = ;
HttpWebResponse wresp = (HttpWebResponse)wreq.GetResponse();
Stream s = wresp.GetResponseStream();
return new Bitmap(s);
}

二、清除边框

  很多验证码周围都有一圈黑色的边框,因此需要用到以下操作:

        public Bitmap ClearBorder(Bitmap bm)
{
//去边框 width
for (int i = ; i < bm.Width; i++)
{
bm.SetPixel(i, , Color.White);
bm.SetPixel(i, bm.Height - , Color.White);
}
//去边框 height
for (int j = ; j < bm.Height; j++)
{
bm.SetPixel(, j, Color.White);
bm.SetPixel(bm.Width - , j, Color.White);
}
return bm;
}

三、灰度处理

  所谓的灰度处理即让五彩缤纷的图像变成深浅度不同的灰色图像。之所以如此是为了接下去的二值化处理。先看灰度处理:

        public Bitmap MakeGray(Bitmap bm)
{
for (int i = ; i < bm.Width; i++)
{
for (int j = ; j < bm.Height; j++)
{
Color c = bm.GetPixel(i, j);//原始背景颜色
int gray = (int)(c.R * 0.11 + c.G * 0.59 + c.B * 0.3);//计算灰度
bm.SetPixel(i, j, Color.FromArgb(gray, gray, gray));
}
}
return bm;
}

  它的原理是遍历图像上的像素点,根据当前像素点的RGB颜色得到灰度,然后将灰度重新赋给当前像素点。

  灰度处理通常有以下三个方法(本例采用的公式2.2):

    简单验证码的识别:Bitmap类的使用 (2.1)

    简单验证码的识别:Bitmap类的使用 (2.2)

    简单验证码的识别:Bitmap类的使用 (2.3)

  公式(2.1)取RGB通道的平均值,得到的图像相对比较柔和,同时也缩小了目标和背景的平均亮度差,不利于后续的阀值处理。

  公式(2.2)考虑了人眼对绿色的适应度最强,蓝色次之,红色最差。在处理绿色调和蓝色调的验证码图像时,公式(2.2)的效果令人满意,但在处理红色调的图像时,因为公式中红色的权值很小,灰度化后目标像素和背景像素的亮度差值被严重缩小,效果还不如公式(2.1)。

  公式(2.3)基于一个前提,那就是有限保留目标像素的亮度信息,利于后续的阀值分割。

  有关理论方面的可以参考此链接:http://www.cnblogs.com/chaosimple/archive/2013/07/18/3197720.html (感谢作者提供宝贵的资料)

四、二值化处理

  二值化处理即让所有深浅度不同的灰色像素点变为黑白两种像素点,即二值化。

  在此需要找到一个临界值。大于该值的为白(背景),小于的为白(验证码)。

        public Bitmap MakeBlackWhite(Bitmap bm)
{
for (int i = ; i < bm.Width; i++)
{
for (int j = ; j < bm.Height; j++)
{
Color c = bm.GetPixel(i, j);//背景颜色
if (c.B > ) //当前像素点与临界值判断
{
bm.SetPixel(i, j, Color.White);
}
else
{
bm.SetPixel(i, j, Color.Black);
}
}
}
return bm;
}

五、噪点处理

  所谓的噪点处理,就是把一些零零碎碎的点去掉,使其得到干净整洁的图像。

  

        public Bitmap ClearPieces(Bitmap bm)
{
for (int i = ; i < bm.Width - ; i++)
{
for (int j = ; j < bm.Height - ; j++)
{
Color c = bm.GetPixel(i, j);//原始背景颜色
Color cUp = bm.GetPixel(i, j - );
Color cDown = bm.GetPixel(i, j + );
Color cLeft = bm.GetPixel(i - , j);
Color cRight = bm.GetPixel(i + , j);
//Response.Write(c.R + " " + c.G + " " + c.B + " <br />");
if (c.R == && cUp.R != && cDown.R != && cLeft.R != && cRight.R != )
{
bm.SetPixel(i, j, Color.White);
}
}
}
return bm;
}

六、图像切割

    public Bitmap SplitImg(Bitmap bm,int pointX,int pointY)
{
Bitmap first = new Bitmap(cutWidth, cutHeight, PixelFormat.Format32bppRgb);for (int i = ; i < first.Width; i++)
{
for (int j = ; j < first.Height; j++)
{
Color c = bm.GetPixel(pointX + i, pointY + j);
first.SetPixel(i, j, c);
}
}
       return first;
}

  这样就得到了验证码中的只包含一个数字的图片。

七、识别单个数字

public string GetOneNumber(Bitmap first)
{
StringBuilder strFir = new StringBuilder("");
for (int i = ; i < first.Width; i++)
{
for (int j = ; j < first.Height; j++)
{
Color c = bm.GetPixel( i, j);
if (c.R == )
{
strFir.Append("");
}
else
{
strFir.Append("");
}
}
}
int result = ;
string num = "";
List<string> numbers = verifyHelper.GetList();
for (int j = ; j < numbers.Count(); j++)
{
result = ;
for (int i = ; i < strFir.Length; i++)
{
if (strFir[i] == numbers[j][i])
{
result++;
}
if (result > )
{
num = j.ToString();
return num;
} }
}
return "-1";

八、最后拼接

            result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );

综合起来需要做的操作是

        public string GetNumbers(string imgUrl)
{
Bitmap bm = new Bitmap(GetImgStream(imgUrl)); bm = ClearBorder(bm);
bm = MakeGray(bm);
bm = MakeBlackWhite(bm);
bm = ClearPieces(bm); string result = "";
result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );
result += GetOneNumber(bm, , );
if(result.Contains("-1"))
{
return "-1";
}
else
{
return result;
}
}

简单验证码的识别:Bitmap类的使用的更多相关文章

  1. Java简单验证码的识别

    1. 需求 因为项目需要,需要多次登录某网站抓取信息.所以学习了验证码的一些小知识.文章参考http://blog.csdn.net/problc/article/details/5794460的部分 ...

  2. python简单验证码识别

    在学习python通过接口自动登录网站时,用户名密码.cookies.headers都好解决但是在碰到验证码这个时就有点棘手了:于是通过网上看贴,看官网完成了对简单验证码的识别,如果是复杂的请看大神的 ...

  3. 开发工具类API调用的代码示例合集:六位图片验证码生成、四位图片验证码生成、简单验证码识别等

    以下示例代码适用于 www.apishop.net 网站下的API,使用本文提及的接口调用代码示例前,您需要先申请相应的API服务. 六位图片验证码生成:包括纯数字.小写字母.大写字母.大小写混合.数 ...

  4. 简单验证码识别&lpar;matlab&rpar;

    简单验证码识别(matlab) 验证码识别, matlab 昨天晚上一个朋友给我发了一些验证码的图片,希望能有一个自动识别的程序. 1474529971027.jpg 我看了看这些样本,发现都是很规则 ...

  5. 基于TensorFlow的简单验证码识别

    TensorFlow 可以用来实现验证码识别的过程,这里识别的验证码是图形验证码,首先用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别. 生成验证码 首先生成验证码,这里使用 Pyth ...

  6. Python3 简单验证码识别思路及实例

    1.介绍 在爬虫中经常会遇到验证码识别的问题,现在的验证码大多分计算验证码.滑块验证码.识图验证码.语音验证码等四种.本文就是识图验证码,识别的是简单的验证码,要想让识别率更高, 识别的更加准确就需要 ...

  7. python 验证码识别示例(五) 简单验证码识别

    今天介绍一个简单验证的识别. 主要是标准的格式,没有扭曲和变现.就用 pytesseract 去识别一下. 验证码地址:http://wscx.gjxfj.gov.cn/zfp/webroot/xfs ...

  8. python 验证码识别示例(四) 简单验证码识别

    今天介绍一个简单验证的识别. 主要是标准的格式,没有扭曲和变现.就用 pytesseract 去识别一下. 验证码地址:http://wsxf.mca.gov.cn/zfp/Random.cmd?d= ...

  9. python 验证码识别示例(三) 简单验证码识别

    今天介绍一个简单验证的识别. 主要是标准的格式,没有扭曲和变现.就用 pytesseract 去识别一下. 验证码地址:https://user.www.gov.cn/sso/verifyimg_ed ...

随机推荐

  1. java File delete&lpar;&rpar;执行失败原因

    java.io.File里的delete操作很实用也很常用,可以用来删除单独的文件和某一目录.但有时候会出现delete失败的情况,出现这种情况的原因一般有以下几种: 1.删除时还有其他程序在使用该文 ...

  2. 关于清除丢失贴图与IES文件

    fn YY_clrmessingmaps = ( YY_messingmap = #() allBitmaps = getClassInstances BitmapTexture -- 所有材质 to ...

  3. &lbrack;Android Pro&rsqb; sqlite数据库的char&comma;varchar&comma;text&comma;nchar&comma;nvarchar&comma;ntext的区别

    reference : http://blog.csdn.net/xingfeng0501/article/details/7817121 1.CHAR.CHAR存储定长数据很方便,CHAR字段上的索 ...

  4. Wampserver3&period;0&period;0设置语言为中文无效

    打开配置文件"wampmanager.conf",将language改成chinese,再从右键的语言选择中选中文. 这个配置文件有两个,改第一个双引号里的,第二个没有引号的不要改 ...

  5. hdu3473 线段树 划分树

    //Accepted 28904 KB 781 ms //划分树 //所求x即为l,r区间排序后的中位数t //然后求出小于t的数的和sum1,这个可以用划分树做 //求出整个区间的和sum,可以用O ...

  6. Altium Designer中使用差分对布线

    Contents Language 在原理图中定义差分对 在PCB中查看和管理差分对 在PCB中定义差分对 适用的设计规则 设置设计规则的辖域 使用差分对向导定义规则 差分对布线 包括管脚交换的FPG ...

  7. python 标准库 -- os

    os os.getcwd() os.getcwd() # 获取当前工作目录 os.listdir(path) os.listdir('/tmp') # 列出指定目录下的文件和目录 os.mkdir(p ...

  8. P1457 城堡 The Castle

    轻度中毒 原题 :The Castle 以下为题解部分:明明辣么简单的一道题,硬是搞了1.5h,WTF?以下列出本题的一些要点. 搜索(DFS)嘛,染色嘛,统计大小嘛,很容易想,也很更易处理. 接下来 ...

  9. 并查集-HDU1232-畅通工程

    转的其他人的.不知道谁的. 来看一个实例,杭电1232畅通工程 首先在地图上给你若干个城镇,这些城镇都可以看作点,然后告诉你哪些对城镇之间是有道路直接相连的.最后要解决的是整幅图的连通性问题.比如随意 ...

  10. 软件测试人员在工作中如何运用Linux

    从事过软件测试的小伙们就会明白会使用Linux是多么重要的一件事,工作时需要用到,面试时会被问到,简历中需要写到. 对于软件测试人员来说,不需要你多么熟练使用Linux所有命令,也不需要你对Linux ...