教程与实战:OpenCV使用CUDA处理图像

磐创AI

    import cv2 as cv
    gpu_frame = cv.cuda_GpuMat()
    screenshot = cv.imread('media/drip.png')
    gpu_frame.upload(screenshot)
    gpu_frame.download()
    
    概述在单张图像上使用在多张图像上使用对多张图像使用Dask进行并行延时处理在单张图像上使用我们需要创建GPU空间(GPU_frame)来保存图像(就像相框保存图片一样),然后才能将图像上传到GPU。第1步:上传import cv2 as cv
    gpu_frame = cv.cuda_GpuMat()
    接下来用CPU将图像加载到内存中(截图),并将其上传到gpu上(帧图像);screenshot = cv.imread('media/drop.png')
    gpu_frame.upload(screenshot)
    第2步:处理图像OpenCV CUDA函数返回cv2.cuda_GpuMat(GPU矩阵),因此每个结果都可以在用户不必重新上传的情况下进行操作。让我们把图像从RGB转换成BGR(OpenCV格式),然后调整大小;screenshot = cv.cuda.cvtColor(gpu_frame, cv.COLOR_RGB2BGR)
    screenshot = cv.cuda.resize(screenshot, (400, 400))
    注意:你调用的函数的第一个参数应该是GPU矩阵(GPU帧),而不是你刚刚上传的图像,这会返回一个新的GPU矩阵。原始的GPU矩阵(gpu_frame)将继续保存原始图像,直到新图像被上传。第3步:下载处理之后的图像在GPU上,我们需要把它下载回CPU;screenshot.download()
    
    注意:.download()将从cv转换为图像,即从cuda_GpuMat到 numpy.ndarray。在多张图像上使用如果需要处理新图片,只需调用.upload()将新图片加载到现有的GPU矩阵中。图像在传递给GPU之前仍然必须加载到CPU上。import cv2 as cv
    img_files = ['bear.png', 'drip.png', 'tldr.png', 'frog.png']
    # 创建帧来保存图片(cv2.cuda_GpuMat)
    gpu_frame = cv.cuda_GpuMat()
    for i in range(len(img_files)):
        # 加载图像(CPU)
        screenshot = cv.imread(f"media/{img_files[i]}")
        # 上传到GPU
        gpu_frame.upload(screenshot)
        # 转换颜色到opencv (numpy) ndarray→cv2.cuda_GpuMat
        screenshot = cv.cuda.cvtColor(gpu_frame, cv.COLOR_RGB2BGR)
        # 反向阈值@ 100
        screenshot = cv.cuda.threshold(screenshot, 105, 255, cv.THRESH_BINARY_INV)
        # 调整图像
        screenshot = cv.cuda.resize(screenshot[1], (200, 200))
        # 从GPU下载图像(cv2) cuda_GpuMat→numpy.ndarray
        screenshot = screenshot.download()
    这一次我们在预处理中添加了一个反向的binary.threshold()函数;
    
    对多张图像使用Dask进行并行延时处理使用Dask延时,我们可以将上面的循环推入到Dask延时函数,并行预处理多张图。import cv2 as cv
    import dask.delayed
    @dask.delayed
    def preprocess(files):
        # 复制图像文件
        i_files = files.copy()
        # 创建GPU帧来保存图像
        gpu_frame = cv.cuda_GpuMat()
        for i in range(len(i_files)):
            # 加载图像(CPU)
            screenshot = cv.imread(f'media/{i_files[i]}')
            # 上传到GPU
            gpu_frame.upload(screenshot)
            # 转换颜色到opencv (numpy) ndarray→cv2.cuda_GpuMat
            screenshot = cv.cuda.cvtColor(gpu_frame, cv.COLOR_RGB2BGR)
            screenshot = cv.cuda.cvtColor(screenshot, cv.COLOR_BGR2GRAY)
            # 反向阈值@ 100
            screenshot = cv.cuda.threshold(screenshot, 125, 255, cv.THRESH_BINARY)
            # 调整图像
            screenshot = cv.cuda.resize(screenshot[1], (200, 200))
            
            # 从GPU下载图像 (cv2.cuda_GpuMat -> numpy.ndarray)
            screenshot = screenshot.download()
            # 用新图像
            i_files[i] = screenshot
        
        # 输出预处理图像
        return i_files
    添加了另一个.cvtColor()来灰度化图像,并将反转的二进制阈值切换为二进制阈值。我们现在可以使用compute()来进行计算了;from dask import compute
    img_files = ['bear.png', 'drip.png', 'tldr.png', 'frog.png']
    img_files_2 = ['apple.png', 'eye.png', 'window.png', 'blinds.png']
    # 设置延迟
    set_a = dask.delayed(preprocess)(img_files)
    set_b = dask.delayed(preprocess)(img_files_2)
    # 开始计算
    out_a, out_b = compute(*[set_a, set_b])
    结果