Python 结合opencv实现图片截取和拼接

这篇具有很好参考价值的文章主要介绍了Python 结合opencv实现图片截取和拼接。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

实践环境

python 3.6.2

scikit-build-0.16.7

win10

opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl

下载地址:

https://pypi.org/project/opencv-python/4.5.4.60/#files

https://files.pythonhosted.org/packages/57/6c/7f4f56b2555d5c25dd4f41fc72a16dc6402cb2b4f967da11d8d26c669b55/opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl

注意:下载时不用下abi版的,比如 opencv_python-4.6.0.66-cp36-abi3-win_amd64.whl 不能用,

因为数据类型为 np.uint8,也就是0~255,

依赖包安装

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-build # 解决     ModuleNotFoundError: No module named 'skbuild'问题
pip install opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl

代码实践

示例图片

Python 结合opencv实现图片截取和拼接

代码

import os
import numpy as np
import cv2
from datetime import datetime
from PIL import Image

def capture_image(image_file_path, left, upper, width, height, target_file_name=None):
    '''截取图片'''

    right = left + width
    lower = upper + height
    if os.path.exists(image_file_path):
        image = Image.open(image_file_path)
        # width, height = image.size
        # print('图片宽度', width, '图片高度', height)

        head, ext = os.path.splitext(image_file_path)
        if not target_file_name:
            target_file_name = 'pic_captured%s%s' % (datetime.now().strftime('%Y%m%d%H%M%S%f'), ext)

        target_file_path = '%s%s' % (head, target_file_name)
        image.crop((left, upper, right, lower)).save(target_file_path)
        return target_file_path
    else:
        error_msg = '图片文件路径不存在:%s' % image_file_path
        print(error_msg)
        raise Exception(error_msg)


def append_picture(image1_path, image2_path):
    '''拼接图片'''

    image1 = cv2.imread(image1_path, -1)
    shape = image1.shape
    height1, width1, channel1 = shape
    # print(shape)     # 输出:(315, 510, 4)
    # print(image1)    # 输出一3维数组
    # print(len(image1), len(image1[0]))  # 输出:315 510

    image2 = cv2.imread(image2_path, -1)
    height2, width2, channel2 =  image2.shape

    total_height = max(height1, height2)
    total_width = width1 + width2

    dst = np.zeros((total_height, total_width, channel1), np.uint8)
    dst[0:height1, 0:width1] = image1

    dst[0:height2, width1:total_width] = image2
    cv2.imwrite("merge.png", dst)

if __name__ == '__main__':
    # 截取图片
    image_path1 = capture_image('example.png', 10, 30, 510, 315)
    image_path2 = capture_image('example.png', 520, 30, 518, 315)

    append_picture(image_path1, image_path2)

运行结果

截取的图片

Python 结合opencv实现图片截取和拼接

Python 结合opencv实现图片截取和拼接

合并的图片

Python 结合opencv实现图片截取和拼接

代码补充说明

  1. imread(filename, flags=None)

    • filename 图片路径

    函数返回一个3三元组:(height, width, channel) ,元素中元素从左到右分别表示图片的高度,宽度,通道数(彩色图片是三通道的,每个通道表示图片的一种颜色(RGB),对于OpenCV读取到的图片的通道顺序是BGR) ,假设图片3元组为 (315, 510, 4) ,表示有315行,即315个二维数组,510列,即每个二维数组有510个一维数组。

    • flags 标志位

      • cv2.IMREAD_COLOR:默认参数,表示读入一副彩色图片,忽略alpha通道,可用1作为实参替代

      • cv2.IMREAD_GRAYSCALE:读入灰度图片,可用0作为实参替代

      • cv2.IMREAD_UNCHANGED:读入完整图片,包括alpha通道,可用-1作为实参替代

        PS:alpha通道,又称A通道,是一个8位的灰度通道,该通道用256级灰度来记录图像中的透明度复信息,定义透明、不透明和半透明区域,其中黑表示全透明,白表示不透明,灰表示半透明

  2. imwrite(filename, img, params=None)

    将图片矩阵以文件的形式储存起来

    • filename 待保存的图片路径

    • img Mat或Mat的矢量)要保存的一个或多个图像。

    • params 特定格式的参数对(paramId_1、paramValue_1、paramId_2、paramValue_2……),参阅cv::ImwriteFlags

  3. zeros(shape, dtype=None, order='C')

    返回一个用零填充的给定形状和类型的新数组(ndarray)

    • shape 整数或者整数元组。新数组的形状,例如(2, 3) or 2
    • dtype 数据类型,可选。数组所需的数据类型,比如,numpy.int8。 默认 numpy.float64
    • order {'C', 'F'},可选,默认: 'C'。是否在内存中按行优先(row-major)顺序(C语言风格)或者列优先(column-major)(Fortran风格)顺序存储多维数据。

    示例文章来源地址https://www.toymoban.com/news/detail-710324.html

    >>> import numpy as np
    
    # 创建2维数组
    >>> array = np.zeros([2, 3]) 
    >>> print(array) # 输出一个二维数组 一个包含2个一维数组,每个一维数组包含3个元素
    [[0. 0. 0.]
     [0. 0. 0.]]
    >>> array = np.zeros([2, 3], np.int64) # 指定数组元素数据类型为int64
    >>> print(array)
    [[0 0 0]
     [0 0 0]]
    >>> array = np.zeros([2, 3], np.float64) #  指定数组元素数据类型为float64
    >>> print(array)
    [[0. 0. 0.]
     [0. 0. 0.]]
    >>> array = np.zeros([3, 2])  # 输出一个二维数组 一个包含3个一维数组,每个一维数组包含2个元素
    >>> print(array)
    [[0. 0.]
     [0. 0.]
     [0. 0.]]
    
    # 创建3维数组
    >>> array = np.zeros((2, 3, 4), np.int8)
    >>> print(array) # 输出一个3维数组 一个包含2个二维数组,每个二维数组包含3个一维数组,每个一维数组包含4个元素
    [[[0 0 0 0]
      [0 0 0 0]
      [0 0 0 0]]
    
     [[0 0 0 0]
      [0 0 0 0]
      [0 0 0 0]]]
    
  4. 冒号在Numpy数组索引中的作用说明

    3维数组为例

    ndarray[index1:index2, index3:index4, index5:index6]

    indexN:indexM 表示获取索引在范围[indexN, indexM)内的数组元素(注意,不包含索引为indexM的元素),这里的indexN代表起始元素索引,可选,默认为0,indexM代表结束元素索引,可选,默认为所在层级数组元素个数+1

    index1:index2 表示获取三维数组中,索引在范围[index1, index2)内的数组元素,即二维数组

    index3:index4 表示获取上述二维数组中,索引在范围[index3, index4)内的数组元素,即一维数组

    index5:index6 表示获取上述一维数组中,索引在范围[index5, index6)内的数组元素

    示例

    >>> array = np.array([[[1, 2, 3], [4, 5, 6], [7, 8, 9]], [[11, 12, 13], [14, 15, 16], [17, 18, 19]], [[20, 21, 22], [23, 24, 25], [26, 27, 28]]]) # 创建一个3维 ndarray
    >>> array
    array([[[ 1,  2,  3],
            [ 4,  5,  6],
            [ 7,  8,  9]],
    
           [[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]],
    
           [[20, 21, 22],
            [23, 24, 25],
            [26, 27, 28]]])
    >>> array[:] # 获取全部元素,等价于array[:, :, :]  
    array([[[ 1,  2,  3],
            [ 4,  5,  6],
            [ 7,  8,  9]],
    
           [[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]],
    
           [[20, 21, 22],
            [23, 24, 25],
            [26, 27, 28]]])
    >>> array[:, :, :]
    array([[[ 1,  2,  3],
            [ 4,  5,  6],
            [ 7,  8,  9]],
    
           [[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]],
    
           [[20, 21, 22],
            [23, 24, 25],
            [26, 27, 28]]])
    
    >>> array[1:2]  # 获取索引在[1,2)范围内的二维数组
    array([[[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]]])
    >>> array[1:]    # 获取索引在[1,3)范围内的二维数组
    array([[[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]],
    
           [[20, 21, 22],
            [23, 24, 25],
            [26, 27, 28]]])
    >>> array[:2]    # 获取索引在[0,2)范围内的二维数组
    array([[[ 1,  2,  3],
            [ 4,  5,  6],
            [ 7,  8,  9]],
    
           [[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]]])
            
    >>> array[1:2, 1:2] # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组
    array([[[14, 15, 16]]])
    >>> array[1:2, :2]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[0,2)范围内的一维数组
    array([[[11, 12, 13],
            [14, 15, 16]]])
    >>> array[1:2, 1:]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,3)范围内的一维数组
    array([[[14, 15, 16],
            [17, 18, 19]]])
    >>> array[1:2, :]   # 获取索引在[1,2)范围内的二维数组的全部元素
    array([[[11, 12, 13],
            [14, 15, 16],
            [17, 18, 19]]])
    >>> array[1:2, 1:2, 1:2]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[1,2)范围内的元素
    array([[[15]]])
    >>> array[1:2, 1:2, 1:]   # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[1,3)范围内的元素
    array([[[15, 16]]])
    >>> array[1:2, 1:2, :2]   # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[0,2)范围内的元素
    array([[[14, 15]]])
    >>> array[1:2, 1:2, :]    # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,获取一维数组的所有元素
    array([[[14, 15, 16]]])
    

到了这里,关于Python 结合opencv实现图片截取和拼接的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • opencv多张图片实现全景拼接

       最近camera项目需要用到全景拼接,故此查阅大量资料,终于将此功能应用在实际项目上,下面总结一下此过程中遇到的一些问题及解决方式,同时也会将源码附在结尾处,供大家参考,本文采用的opencv版本为3.4.12。   首先说一下此源码的大概执行流程,此项目进行全

    2024年01月17日
    浏览(45)
  • python opencv:批量识别拼接图片分界线并进行自动裁剪

    在网上找图片素材时,有很多的图片是长图片,在一张图片上拼接了许多张图片,而很多时候我们需要单张图片,此时就需要将长图进行裁剪,一般可以用图片工具进行简单裁剪,高级点可以采用ps进行切片处理,如果图片数量少还好说一旦有大量的图片需要裁剪就很繁琐并

    2024年02月11日
    浏览(53)
  • OpenCV完美实现两张图片的全景拼接(详细教程)

    目录 1,主要步骤 1.1  导入需要的包和模块,并读取两张待拼接的图片,这里我们假设它们为 left.jpg 和 right.jpg。 1.2  创建SIFT检测器 1.3 创建一个基于 FLANN 的匹配器 1.4  筛选过程删除掉一些不合适的匹配点,只保留最好的匹配点 1.5透视变换 1.6  消除重叠的效果,对两张

    2024年02月06日
    浏览(42)
  • python实现两张图片左右(横向)和纵向(上下)拼接组合

    主要用于对两幅图像进行左右组合或者上下组合,详细代码如下: 左右组合 上下组合

    2024年02月15日
    浏览(56)
  • opencv实践项目-图像拼接

    图像拼接是计算机视觉中最成功的应用之一。如今,很难找到不包含此功能的手机或图像处理API。在本 文中,我们将讨论如何使用OpenCV进行图像拼接。也就是,给定两张共享某些公共区域的图 像,目标是“缝合”它们并创建一个全景图像场景。当然也可以是给定多张图像,

    2024年02月02日
    浏览(42)
  • OpenCV处理图片拼接

    读入图片 预处理图片 图片特征提取 特征处理 特征匹配 透视变换 图片再处理 (可选)图片特征点连线配对 Sticher.py 引入头文件 创建类 自定义函数 def stich:外部接口函数 def detectAndDescribe:用于图片的特征点提取,内部逻辑函数 def matchKeypoints:特征点匹配 def drawMatches:显示2图片的特

    2024年02月21日
    浏览(35)
  • (OpenCV)图片拼接

            图片拼接在许多领域都有广泛的应用,包括但不限于以下几个方面: 全景摄影 :在摄影中,通过将多张照片拼接在一起可以实现全景照片的效果。这在旅游景点、房地产展示等领域有着广泛的应用,能够提供更加生动、真实的视觉体验。 医学影像处理 :在医学

    2024年02月22日
    浏览(40)
  • Python + OpenCV一步一步地实现图像拼接(原理与代码)

    图像拼接可以理解为三大步: 按顺序读取多幅图像,并保证图像按照从左到右的顺序。 发现这些图像像素之间的相关性(涉及到 单应性 )。 将这些图像拼接成为一张全景图像。 首先,需要了解如下几个概念。 Python OpenCV SIFT特征提取的原理与代码实现_乔卿的博客-CSDN博客

    2024年02月04日
    浏览(76)
  • 使用Python基于opencv实现多视频画面拼接融合算法demo

    单个相机视频画面尺寸有限,在需要全景展示的场景下,就需要将多个相机视频进行拼接融合,得到一张全景图。本文基于opencv实现一个视频拼接的demo,熟悉视频拼接流程和opencv接口。 直接上代码吧,注释还是比较清楚的: 该demo使用ORB算法检测关键点,使用BFMatcher进行特征

    2024年02月04日
    浏览(53)
  • OpenCV将两张图片拼接成一张图片

    可以用opencv或者numpy的拼接函数,直接将两张图拼接到一起,很简单方便,参考代码2, 推荐此方式 。 新建图片,将两张图片的像素值填充到新图片对应位置上即可,参考代码1。 以下是将两张图片拼接成一张图片的示例代码: 以下是将两张图片在同一个窗口显示的示例代码

    2024年02月04日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包