需求描述

最近遇到一个需求,通过minAreaRect得到最小外接矩阵后,还需要判断该矩形中的文字是横向排列还是纵向排列。网上查找很多教程,他们对minAreaRect函数以及其返回值的解释与我在实际操作时的结果都不一样,不知道是由于版本差异还是我操作的问题。我使用的版本是opencv-python 4.5.3.

要想判断矩形中的文字方向,首先要知道矩形四个点的坐标以及旋转角度。新版的opencv的改动就在于四个点坐标以及旋转角度的定义。例如,原来minAreaRect函数返回的旋转角度在[-90, 0)之间,然而在我使用的**opencv-python 4.5.3.**中返回的旋转角度在(0, 90]之间。

矩阵的旋转情况主要有以下几种情况:
文本横向排列:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
文本纵向排列:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

矩形坐标

rotatedRect = cv2.minAreaRect(contours[0])  # 计算最小外接矩形
box = cv2.boxPoints(rotatedRect)  # 计算矩形的坐标

在opencv中,最小外接矩形四个点的坐标定义如下:
( x 1 , y 1 ) (x_1, y_1) x1,y1):左上角的点,四个坐标中横坐标最小的点;
( x 2 , y 2 ) (x_2, y_2) x2,y2):右上角的点,四个坐标中纵坐标最小的点;
( x 3 , y 3 ) (x_3, y_3) x3,y3):右下角的点,四个坐标中横坐标最大的点;
( x 4 , y 4 ) (x_4, y_4) x4,y4):左下角的点,四个坐标中纵坐标最大的点;

矩形宽和高

在得到四个点的坐标后, ( x 1 , y 1 ) (x_1, y_1) x1,y1) ( x 2 , y 2 ) (x_2, y_2) x2,y2)的距离被认定为宽(width), ( x 2 , y 2 ) (x_2, y_2) x2,y2) ( x 3 , y 3 ) (x_3, y_3) x3,y3)的距离被认定为高(height)。我们发现矩形在旋转过程中宽和高对应的边是在不断变化的,这就是因为矩形四个点的坐标在不断变化。

矩形旋转角度

这里旋转角度的计算感觉和以前的版本刚好相反,表示水平线顺时针旋转遇到矩阵第一条宽的角度,在(0, 90]之间。

判断文字排列方向

横向排列:

(1)当旋转角度大于45度时,height需要大于width;
(2) 当旋转角度小于45度时,height需要小于width;

纵向排列:

(1)当旋转角度大于45度时,height需要小于width;
(2) 当旋转角度小于45度时,height需要大于width;

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐