python实现黑白图、灰度图识别(也可以识别微博、微信截图、表情包、图表、文字图片等)

时间:2024-03-07 11:15:51

【版权所有,转载请注明出处。出处:https://www.cnblogs.com/zwq-zju/p/9721613.html

基本原理

灰度图分两种情况:

  • 单通道的图片
  • RGB 三通道的图片,但是每个通道的值相等

对于单通道的图片只需要判断图片的通道值是否为1

对于RGB模式的图片,情况稍稍复杂些。理论上只需判断RGB三个通道的值是否相等,但是现实中灰度图常常各通道间存在轻微差异,但是人眼难以察觉,依旧可以认为是灰度图。所以现实中,应该判断三个通道间的差异大小比较合理。
这里采取的策略是计算三个通道间像素值的差的方差的均值,小于一定阈值的就判断为灰度图。

实现

下面用python做个示例:
只需要用到 PIL 和 numpy

代码:

# 黑白照片(灰度图)识别
def isGrayMap(img, threshold = 15):
    """
    入参:
    img:PIL读入的图像
    threshold:判断阈值,图片3个通道间差的方差均值小于阈值则判断为灰度图。
    阈值设置的越小,容忍出现彩色面积越小;设置的越大,那么就可以容忍出现一定面积的彩色,例如微博截图。
    如果阈值设置的过小,某些灰度图片会被漏检,这是因为某些黑白照片存在偏色,例如发黄的黑白老照片、
    噪声干扰导致灰度图不同通道间值出现偏差(理论上真正的灰度图是RGB三个通道的值完全相等或者只有一个通道,
    然而实际上各通道间像素值略微有偏差看起来仍是灰度图)
    出参:
    bool值
    """
    if len(img.getbands()) == 1:
        return True
    img1 = np.asarray(img.getchannel(channel=0), dtype=np.int16)
    img2 = np.asarray(img.getchannel(channel=1), dtype=np.int16)
    img3 = np.asarray(img.getchannel(channel=2), dtype=np.int16)
    diff1 = (img1 - img2).var()
    diff2 = (img2 - img3).var()
    diff3 = (img3 - img1).var()
    diff_sum = (diff1 + diff2 + diff3) / 3.0
    if diff_sum <= threshold:
        return True
    else:
        return False

测试

更多被判断为灰度图的例子: