1 引言

如果你想对图像进行校准,那么透视变换是非常有效的变换手段。透视变换的定义为将图像投影到一个新的视平面,通常也被称之为投影映射。
在这里插入图片描述

2 公式

一般来说,通用的图像变换公式如下所示:
在这里插入图片描述
上述公式中,u,v代表原始图像坐标,x,y为经过透视变换的图片坐标,其中变换矩阵为3X3形式。进而可以得到:
在这里插入图片描述

3 举例

在介绍opencv的透视变换函数之前,我们举例来讲解该算法的原理:
在这里插入图片描述
直观的来看,透视变换的作用就是将左侧图像的坐标点
[[50,0],[150,0],[0,200],[200,200]]
转化为新的坐标
[[0,0],[200,0],[0,200],[200,200]]
通过计算我们知道,转换矩阵如下:
在这里插入图片描述
我们来验证一下,采用左上角的点(50,0)带入公式,如下:
在这里插入图片描述

接着我们将列向量的前两维度除以第三维执行归一化:
在这里插入图片描述
所以我们知道原图左上角点执行透视变换后的映射关系:

在这里插入图片描述

4 应用

本文以扑克牌的例子来进行讲解,样例结果如下:
请添加图片描述

4.1 读入图像

首先我们来读入一副彩色图像,如下:

import cv2
import numpy as np
img = cv2.imread("image/sample.jpg")
h, w, c = img.shape  # h=240  w=320

4.2 挑选源图四个点

接着我们需要挑选四个点,我们这里采用左上,左下,右下和右上,下面的代码把我们挑选的四个点画到图像上

src_list = [(61, 70), (151, 217), (269, 143), (160, 29)]
for i, pt in enumerate(src_list):
	cv2.circle(img, pt, 5, (0, 0, 255), -1)
	cv2.putText(img,str(i+1),(pt[0]+5,pt[1]+10),cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)
pts1 = np.float32(src_list)

结果如下:
请添加图片描述

4.3 进行透视变换

首先选择四个目的图像上的点,然后调用openv函数进行透视变换,代码如下:

pts2 = np.float32([[0, 0], [0, w - 2], [h - 2, w - 2], [h - 2, 0]])
matrix = cv2.getPerspectiveTransform(pts1, pts2)
result = cv2.warpPerspective(img, matrix, (h, w))
cv2.imshow("Image", img)
cv2.imshow("Perspective transformation", result)
cv2.waitKey(0)

得到结果如下:
请添加图片描述

5 应用

我们在实际应用中,可以使用透视变换来替换广告牌中对应的背景图,结果如下:

广告牌:
请添加图片描述
Logo图:
请添加图片描述
结果图:
请添加图片描述

6 总结

本文介绍了图像处理透视变换的原理和具体代码实现,并给出了具体应用示例。

您学废了吗?


7 参考

参考 链接一 链接二



关注公众号《AI算法之道》,获取更多AI算法资讯。

在这里插入图片描述



注: 完整代码,关注公众号,后台回复 透视变换 , 即可获取。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐