计算图像相似度的几种方法

文章分类

技术相关

随笔

随笔

专题文章

微信公众平台

文章存档

热门标签

分类： python 2020-11-18 20:37:44 颜色：橙色　默认　　字号：大中小阅读(2291) | 评论(0)

图片的本质就是大量像素在二维平面上的组合，每个像素点用数字化方式记录颜色。可以直观的想象，一张图片就是一个巨大的电子栅格，每个格子内有一盏灯泡，这个灯泡可以变换256的三次方种颜色，就像下面这张卡通像素图一样，越清晰的图片像素越密集。

1. SSIM（结构相似性度量）

这是一种全参考的图像质量评价指标，分别从亮度、对比度、结构三个方面度量图像相似性。

SSIM取值范围[0, 1]，值越大，表示图像失真越小。

在实际应用中，可以利用滑动窗将图像分块，令分块总数为N，考虑到窗口形状对分块的影响，采用高斯加权计算每一窗口的均值、方差以及协方差，然后计算对应块的结构相似度SSIM，最后将平均值作为两图像的结构相似性度量，即平均结构相似性SSIM。

from skimage.measure import compare_ssim
from scipy.misc import imread
import numpy as np

img1 = imread('1.jpg')
img2 = imread('2.jpg')

img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))

print(img2.shape)
print(img1.shape)
ssim = compare_ssim(img1, img2, multichannel=True)

print(ssim)

计算出来SSIM为0.343769017234

该方法通常用来衡量一张图片压缩后的失真度，比较少的用来计算两图的相似度。

2. cosin相似度（余弦相似度）

把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。

from PIL import Image
from numpy import average, linalg, dot


def get_thumbnail(image, size=(1200, 750), greyscale=False):
    image = image.resize(size, Image.ANTIALIAS)
    if greyscale:
        image = image.convert('L')
    return image


def image_similarity_vectors_via_numpy(image1, image2):

    image1 = get_thumbnail(image1)
    image2 = get_thumbnail(image2)
    images = [image1, image2]
    vectors = []
    norms = []
    for image in images:
        vector = []
        for pixel_tuple in image.getdata():
            vector.append(average(pixel_tuple))
        vectors.append(vector)
        norms.append(linalg.norm(vector, 2))
    a, b = vectors
    a_norm, b_norm = norms
    res = dot(a / a_norm, b / b_norm)
    return res


image1 = Image.open('1.jpg')
image2 = Image.open('2.jpg')
cosin = image_similarity_vectors_via_numpy(image1, image2)

print(cosin)

计算出来cosin相似度为0.911241243612

该方法运算量较大，速度明显比ssim方法慢，但是只管感受结果比ssim靠谱。

3. 基于直方图

直方图能够描述一幅图像中颜色的全局分布，是一种入门级的图像相似度计算方法。

from PIL import Image

def make_regalur_image(img, size = (256, 256)):
    return img.resize(size).convert('RGB')


def hist_similar(lh, rh):
    assert len(lh) == len(rh)
    return sum(1 - (0 if l == r else float(abs(l - r))/max(l, r)) for l, r in zip(lh, rh))/len(lh)


def calc_similar(li, ri):
    return hist_similar(li.histogram(), ri.histogram())


if __name__ == '__main__':
    img1 = Image.open('1.jpg')
    img1 = make_regalur_image(img1)
    img2 = Image.open('2.jpg')
    img2 = make_regalur_image(img2)
    print(calc_similar(img1, img2))

计算出来的直方图相似度为0.490183408809

直方图过于简单，只能捕捉颜色信息的相似性，捕捉不到更多的信息。只要颜色分布相似，就会判定二者相似度较高，显然不合理。

4. 基于互信息（Mutual Information）

通过计算两个图片的互信息来表征他们之间的相似度。

from sklearn import metrics as mr
from scipy.misc import imread
import numpy as np

img1 = imread('1.jpg')
img2 = imread('2.jpg')

img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))

img1 = np.reshape(img1, -1)
img2 = np.reshape(img2, -1)
print(img2.shape)
print(img1.shape)
mutual_infor = mr.mutual_info_score(img1, img2)

print(mutual_infor)

如果两张图片尺寸相同，还是能在一定程度上表征两张图片的相似性的。但是，大部分情况下图片的尺寸不相同，如果把两张图片尺寸调成相同的话，又会让原来很多的信息丢失，所以很难把握。经过实际验证，此种方法的确很难把握。

5. 计算图像的“指纹信息”

将图像归一化成一定大小，计算一个序列作为他的指纹信息，然后比较两张图片指纹信息序列相同的位数。如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。算法详见此文 https://www.php3.cn/a/361.html

上一篇：10分钟看懂Docker和K8S 　　下一篇：Python 计算图像相似度方法（指纹及直方图）

最新评论查看所有评论>>