图像处理初学者导引---OpenCV 方法演示项目

news/2024/7/10 21:39:12 标签: 图像处理, opencv, 开源, github, 开源软件

OpenCV 方法演示项目

项目地址:https://github.com/WangQvQ/opencv-tutorial

请添加图片描述


项目简介

这个开源项目是一个用于演示 OpenCV 方法的工具,旨在帮助初学者快速理解和掌握 OpenCV 图像处理技术。通过这个项目,你可以轻松地对图像进行各种处理,从灰度化到边缘检测,以及更多其他方法。项目使用 Gradio 创建用户友好的界面,让用户能够轻松选择不同的图像处理方法和参数。


为什么选择这个项目

  • 教育性:这个项目的主要目的是教育。它提供了对 OpenCV 方法的实际演示,以帮助初学者更好地理解和掌握这些技术。

  • 互动性:通过 Gradio 创建的用户界面,用户可以立即看到不同处理方法的效果,并可以自己调整参数,以更深入地理解每种方法的工作原理。

  • 适用广泛:这个项目可以帮助广大初学者,无论是学习计算机视觉、图像处理,还是对 OpenCV 有兴趣的人都会受益。


特性

  • 提供了多种 OpenCV 图像处理方法的演示,包括灰度化、反转颜色、平移、直方图均衡化、腐蚀、膨胀、均值滤波、中值滤波、高斯滤波等。

  • 支持自定义卷积核,允许用户尝试不同的卷积核来处理图像。

  • 提供图像旋转、仿射变换和透射变换的演示,以及选择角度和参数的选项。

  • 使用 Gradio 创建用户友好的界面,让用户能够轻松选择不同的图像处理方法和参数。


使用方法

  1. 获取项目:首先,你需要将这个项目克隆到你的本地计算机上。你可以使用以下命令来获取项目:

    git clone https://github.com/WangQvQ/opencv-tutorial.git
    
  2. 安装依赖项:确保你已经安装了以下依赖项:

    • OpenCV
    • Gradio
    • NumPy

    如果你没有安装它们,你可以使用以下命令安装:

    pip install opencv-python-headless=4.7.0.72 gradio=3.1.5 numpy=1.22.4
    
  3. 运行项目:使用以下命令来运行项目:

    python opencv_demo.py
    

    运行后,你将看到一个网址,通常是 http://localhost:7860,你可以在浏览器中访问它。

  4. 使用界面:在浏览器中,你可以上传图像并选择不同的处理方法和参数,然后查看处理后的图像效果。


示例代码

请添加图片描述

以下是部分方法的代码示例:

# 灰度化处理函数
def grayscale(input_image):
    gray_image = cv2.cvtColor(input_image, cv2.COLOR_BGR2GRAY)
    return gray_image


# 平移图像处理函数
def translate_image(input_image, translation_x, translation_y):
    rows, cols, _ = input_image.shape
    translation_matrix = np.float32([[1, 0, translation_x], [0, 1, translation_y]])
    translated_image = cv2.warpAffine(input_image, translation_matrix, (cols, rows))
    return translated_image


# Canny 边缘检测处理函数
def edge_detection(input_image):
    edges = cv2.Canny(input_image, 100, 200)
    return edges

贡献

如果你对项目有任何改进或建议,欢迎贡献代码或提出问题。我们欢迎开发者共同改进这个项目,以使其更加有用和友好。


源代码

如果你不想克隆项目,也可以直接运行我的源代码:

import cv2  
import gradio as gr  
import numpy as np  


# 原始图像处理函数
def original_image(input_image):
    return input_image


# 灰度化处理函数
def grayscale(input_image):
    gray_image = cv2.cvtColor(input_image, cv2.COLOR_BGR2GRAY)
    return gray_image


# 平移图像处理函数
def translate_image(input_image, translation_x, translation_y):
    rows, cols, _ = input_image.shape
    translation_matrix = np.float32([[1, 0, translation_x], [0, 1, translation_y]])
    translated_image = cv2.warpAffine(input_image, translation_matrix, (cols, rows))
    return translated_image


# Canny 边缘检测处理函数
def edge_detection(input_image):
    edges = cv2.Canny(input_image, 100, 200)
    return edges


# Sobel 边缘检测处理函数
def sobel_edge_detection(input_image):
    gray_image = cv2.cvtColor(input_image, cv2.COLOR_BGR2GRAY)
    sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=5)
    sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=5)
    sobel_magnitude = cv2.magnitude(sobel_x, sobel_y)
    sobel_magnitude = np.uint8(255 * sobel_magnitude / np.max(sobel_magnitude))
    return sobel_magnitude


# 反转颜色处理函数
def invert_colors(input_image):
    inverted_image = cv2.bitwise_not(input_image)
    return inverted_image


# 腐蚀处理函数
def erosion(input_image, iterations):
    kernel = np.ones((5, 5), np.uint8)
    eroded_image = cv2.erode(input_image, kernel, iterations=iterations)
    return eroded_image


# 膨胀处理函数
def dilation(input_image, dilation_iterations):
    kernel = np.ones((5, 5), np.uint8)
    dilated_image = cv2.dilate(input_image, kernel, iterations=dilation_iterations)
    return dilated_image


# 均值滤波处理函数
def mean_blur(input_image):
    mean_blurred_image = cv2.blur(input_image, (5, 5))
    return mean_blurred_image


# 中值滤波处理函数
def median_blur(input_image):
    median_blurred_image = cv2.medianBlur(input_image, 5)
    return median_blurred_image


# 高斯滤波处理函数
def gaussian_blur(input_image):
    gaussian_blurred_image = cv2.GaussianBlur(input_image, (5, 5), 0)
    return gaussian_blurred_image


# 双边滤波处理函数
def bilateral_filter(input_image):
    bilateral_filtered_image = cv2.bilateralFilter(input_image, 9, 75, 75)
    return bilateral_filtered_image


# 方块滤波处理函数
def box_filter(input_image):
    box_filtered_image = cv2.boxFilter(input_image, -1, (5, 5))
    return box_filtered_image


# 直方图均衡化处理函数
def histogram_equalization(input_image):
    gray_image = cv2.cvtColor(input_image, cv2.COLOR_BGR2GRAY)
    equalized_image = cv2.equalizeHist(gray_image)
    return cv2.cvtColor(equalized_image, cv2.COLOR_GRAY2BGR)


# 仿射变换处理函数
def affine_transform(input_image):
    # 创建仿射变换矩阵
    rows, cols, _ = input_image.shape
    matrix = cv2.getRotationMatrix2D((cols / 4, rows / 2), 70, 0.5)  # 90度旋转和1.5倍缩放
    result_image = cv2.warpAffine(input_image, matrix, (cols, rows))
    return result_image


# 透射变换处理函数
def perspective_transform(input_image):
    # 定义四个输入图像的角点坐标
    rows, cols, _ = input_image.shape
    # 修改pts1和pts2的值以减小透射变换的弯曲程度
    pts1 = np.float32([[0, 0], [cols, 0], [0, rows], [cols, rows]])
    pts2 = np.float32([[30, 30], [cols - 50, 50], [50, rows - 50], [cols - 50, rows - 50]])
    # 计算投射矩阵
    matrix = cv2.getPerspectiveTransform(pts1, pts2)
    # 进行投射变换
    result_image = cv2.warpPerspective(input_image, matrix, (cols, rows))
    return result_image


# 自定义卷积核
def custom_filter(input_image):
    kernel = np.array([[-1, -1, -1], [-1, 9, -1], [-1, -1, -1]])
    return cv2.filter2D(input_image, -1, kernel)


# 图像旋转处理函数
def rotate_image(input_image, rotation_angle):
    rows, cols, _ = input_image.shape
    matrix = cv2.getRotationMatrix2D((cols / 2, rows / 2), rotation_angle, 1)
    result_image = cv2.warpAffine(input_image, matrix, (cols, rows))
    return result_image


# 创建 Gradio 接口
input_image = gr.inputs.Image()
method = gr.inputs.Radio(
    choices=["原图", "灰度化", "反转颜色", "平移", "直方图均衡化", "腐蚀", "膨胀", "均值滤波", "中值滤波", "高斯滤波",
             "双边滤波", "方块滤波", "仿射变换", "透射变换", "图像旋转", "Sobel边缘检测", "Canny边缘检测", "自定义卷积核"], default="原图")

rotation_angle = gr.inputs.Slider(minimum=-180, maximum=180, default=45, label="图像旋转: 旋转角度")
iterations = gr.inputs.Slider(minimum=0, maximum=10, step=1, default=1, label="腐蚀: 腐蚀参数")
dilation_iterations = gr.inputs.Slider(minimum=0, maximum=10, step=1, default=1, label="膨胀: 膨胀参数")
translation_x = gr.inputs.Slider(minimum=-200, maximum=200, default=200, label="平移: X轴平移")
translation_y = gr.inputs.Slider(minimum=-200, maximum=200, default=200, label="平移: Y轴平移")

output_image = gr.outputs.Image(type="pil")


# 创建函数根据下拉菜单的选择来执行不同的方法
def apply_opencv_methods(input_image, method, rotation_angle, iterations, dilation_iterations,
                         translation_x, translation_y):
    if method == "原图":
        return original_image(input_image)
    elif method == "图像旋转":
        return rotate_image(input_image, rotation_angle)
    elif method == "腐蚀":
        return erosion(input_image, iterations)
    elif method == "膨胀":
        return dilation(input_image, dilation_iterations)
    elif method == "Sobel边缘检测":
        return sobel_edge_detection(input_image)
    elif method == "平移":
        return translate_image(input_image, translation_x, translation_y)
    elif method == "自定义卷积核":
        return custom_filter(input_image)
    else:
        methods = {
            "灰度化": grayscale,
            "Canny边缘检测": edge_detection,
            "反转颜色": invert_colors,
            "均值滤波": mean_blur,
            "中值滤波": median_blur,
            "高斯滤波": gaussian_blur,
            "双边滤波": bilateral_filter,
            "方块滤波": box_filter,
            "仿射变换": affine_transform,
            "透射变换": perspective_transform,
            "直方图均衡化": histogram_equalization,
        }
        return methods[method](input_image)


# 创建 Gradio 接口
gr.Interface(
    fn=apply_opencv_methods,
    inputs=[input_image, method, rotation_angle, iterations, dilation_iterations, translation_x,
            translation_y],
    outputs=output_image,
    live=True,
    title="图像处理初学者导引",
    description="选择一张图像, 并选择对应方法"
).launch(share=False)

http://www.niftyadmin.cn/n/5064455.html

相关文章

C++算法 —— 动态规划(7)两个数组的dp

文章目录 1、动规思路简介2、最长公共子序列3、不相交的线4、不同的子序列5、通配符匹配6、正则表达式匹配7、交错字符串8、两个字符串的最小ASCII删除和9、最长重复子数组 每一种算法都最好看完第一篇再去找要看的博客,因为这样会帮你梳理好思路,看接下…

SpringCloud Alibaba - 分布式事务理论(CAP 定理 和 BASE 理论)

目录 一、分布式事务理论 1.1、分布式事务问题 1.2、什么是分布式事务 1.3、解决分布式事务思路 1.3.1、CAP 定理 a)Consistency(一致性) b)Availability(可用性) c)Partition tolerance…

摄影后期图像编辑软件Lightroom Classic 2023 mac中文特点介绍

Lightroom Classic 2023 mac是一款图像处理软件,是数字摄影后期制作的重要工具之一,lrc2023 mac适合数字摄影后期制作、摄影师、设计师等专业人士使用。 Lightroom Classic 2023 mac软件特点 高效的图像管理:Lightroom Classic提供了强大的图…

腾讯云南京服务器性能如何?南京服务器测速IP地址

腾讯云服务器南京地域怎么样?南京地域很不错,正好处于中间的位置,南方北方用户均可以选择,网络延迟更低速度更快,并且目前南京地域有活动,南京地域可用区可选南京一区、南京二区和南京三区,腾讯…

番外3:下载+安装VMware(前期准备)

step1: 查看自己笔记本电脑配置; step2: 下载并安装VMware(下载地址www..kkx.net/soft/16841.html)这里选择本地普通下载; step3: 安装VMware过程中需要填写密钥(本人用的最后一个); #UU54R-FVD91-488PP-7N…

【JavaEE】JavaScript webAPI的基本知识

JavaScript Web API 文章目录 JavaScript Web APIwebAPI背景DOMDOM树 获取元素querySelectorquerySelectorAll 事件初识键盘事件onkeydownonkeypressonkeyup 操作元素获取/修改元素内容1.innerText2.innerHTML 获取/修改元素属性获取/修改表单元素属性获取/修改样式属性行内样式…

获取网卡上的IP、网关及DNS信息,获取最佳路由,遍历路由表中的条目(附源码)

VC常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...)https://blog.csdn.net/chenlycly/article/details/124272585C软件异常排查从入门到精通系列教程(专栏文章列表,欢迎订阅,持续更新...&a…

服务网关Gateway_入门案例

创建cloud-gateway-gateway9527工程 pom文件引入依赖 <dependencies><!-- 引入网关Gateway依赖 --><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-gateway</artifactId></depe…