初学者 Python 项目:使用 OpenCV 和 Mediapipe 构建增强现实绘图应用程序

wufei123 2025-01-26 阅读:1 评论:0
本Python项目构建一个简单的增强现实(AR)绘图应用程序。利用摄像头和手势,您可以在屏幕上进行虚拟绘画,自定义画笔,甚至保存您的作品! 项目设置 首先,创建一个新文件夹,并使用以下命令初始化新的虚拟环境: python -m venv...

初学者 python 项目:使用 opencv 和 mediapipe 构建增强现实绘图应用程序

本Python项目构建一个简单的增强现实(AR)绘图应用程序。利用摄像头和手势,您可以在屏幕上进行虚拟绘画,自定义画笔,甚至保存您的作品!

项目设置

首先,创建一个新文件夹,并使用以下命令初始化新的虚拟环境:

python -m venv venv
./venv/scripts/activate

然后,使用pip或您选择的包管理器安装必要的库:

pip install mediapipe opencv-python

注意:

安装最新版mediapipe时可能遇到兼容性问题。本文撰写时使用Python 3.11.2。请确保使用与您的Python版本兼容的mediapipe版本。

步骤一:获取摄像头图像

第一步是设置摄像头并显示视频流。我们将使用OpenCV的VideoCapture来访问摄像头并连续显示帧:

import cv2

cap = cv2.VideoCapture(0)  # 0表示默认摄像头

while True:
    ret, frame = cap.read()
    if not ret:
        break

    frame = cv2.flip(frame, 1)  # 水平翻转,镜像效果

    cv2.imshow('摄像头', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

小技巧:

cv2.waitKey(1) & 0xFF中的& 0xFF用于处理不同平台下按键返回值的差异,确保按键检测的可靠性。

步骤二:集成手部检测

使用MediaPipe的手部解决方案,我们将检测手部并提取关键点位置,例如食指尖和中指尖:

import cv2
import mediapipe as mp

mp_hands = mp.solutions.hands
hands = mp_hands.Hands(min_detection_confidence=0.9, min_tracking_confidence=0.9)

cap = cv2.VideoCapture(0)
while True:
    ret, frame = cap.read()
    if not ret:
        break

    frame = cv2.flip(frame, 1)
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = hands.process(frame_rgb)

    if results.multi_hand_landmarks:
        for hand_landmarks in results.multi_hand_landmarks:
            h, w, _ = frame.shape
            cx, cy = int(hand_landmarks.landmark[mp_hands.HandLandmark.INDEX_FINGER_TIP].x * w), 
                     int(hand_landmarks.landmark[mp_hands.HandLandmark.INDEX_FINGER_TIP].y * h)
            mx, my = int(hand_landmarks.landmark[mp_hands.HandLandmark.MIDDLE_FINGER_TIP].x * w), 
                     int(hand_landmarks.landmark[mp_hands.HandLandmark.MIDDLE_FINGER_TIP].y * h)
            cv2.circle(frame, (cx, cy), 10, (0, 255, 0), -1)

    cv2.imshow('摄像头', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

步骤三:追踪手指位置并绘图

我们将追踪食指,只有当食指和中指分开一定距离时才允许绘图。我们将维护一个食指坐标列表用于绘图,当食指和中指距离小于阈值时,添加None到列表中,表示中断绘图。

import cv2
import mediapipe as mp
import math

mp_hands = mp.solutions.hands
hands = mp_hands.Hands(min_detection_confidence=0.9, min_tracking_confidence=0.9)

draw_points = []
reset_drawing = False
brush_color = (0, 0, 255)
brush_size = 5

cap = cv2.VideoCapture(0)
while True:
    ret, frame = cap.read()
    if not ret:
        break

    frame = cv2.flip(frame, 1)
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = hands.process(frame_rgb)

    if results.multi_hand_landmarks:
        for hand_landmarks in results.multi_hand_landmarks:
            h, w, _ = frame.shape
            cx, cy = int(hand_landmarks.landmark[mp_hands.HandLandmark.INDEX_FINGER_TIP].x * w), 
                     int(hand_landmarks.landmark[mp_hands.HandLandmark.INDEX_FINGER_TIP].y * h)
            mx, my = int(hand_landmarks.landmark[mp_hands.HandLandmark.MIDDLE_FINGER_TIP].x * w), 
                     int(hand_landmarks.landmark[mp_hands.HandLandmark.MIDDLE_FINGER_TIP].y * h)
            distance = math.sqrt((mx - cx) ** 2 + (my - cy) ** 2)
            threshold = 40

            if distance > threshold:
                if reset_drawing:
                    draw_points.append(None)
                    reset_drawing = False
                draw_points.append((cx, cy))
            else:
                reset_drawing = True

    for i in range(1, len(draw_points)):
        if draw_points[i - 1] and draw_points[i]:
            cv2.line(frame, draw_points[i - 1], draw_points[i], brush_color, brush_size)

    cv2.imshow('摄像头', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

步骤四:改进方向

  • 使用OpenCV的cv2.rectangle()和cv2.putText()创建按钮来切换画笔大小和颜色。
  • 添加保存图像的功能。
  • 添加橡皮擦工具,使用新的坐标修改draw_points数组。

这个改进的版本提供了更完整的功能,并对代码进行了更清晰的组织和注释。 记住安装必要的库才能运行代码。

以上就是初学者 Python 项目:使用 OpenCV 和 Mediapipe 构建增强现实绘图应用程序的详细内容,更多请关注知识资源分享宝库其它相关文章!

版权声明

本站内容来源于互联网搬运,
仅限用于小范围内传播学习,请在下载后24小时内删除,
如果有侵权内容、不妥之处,请第一时间联系我们删除。敬请谅解!
E-mail:dpw1001@163.com

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀

    华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀
    华为 mate 70 或将首发麒麟新款处理器,并将此前有博主爆料其性能跑分将突破110万,这意味着 mate 70 性能将重新夺回第一梯队。也因此,苹果 iphone 16 唯一能有一战之力的性能,也要被 mate 70 拉近不少了。 据悉,华为 Mate 70 性能会大幅提升,并且销量相比 Mate 60 预计增长40% - 50%,且备货充足。如果 iPhone 16 发售日期与 Mate 70 重合,销量很可能被瞬间抢购。 不过,iPhone 16 还有一个阵地暂时难...
  • 酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元

    酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元
    本站 5 月 16 日消息,酷凛 id-cooling 近日推出霜界 240/360 一体式水冷散热器,采用黑色无光低调设计,分别定价 239/279 元。 本站整理霜界 240/360 散热器规格如下: 酷凛宣称这两款水冷散热器搭载“自研新 V7 水泵”,采用三相六极马达和改进的铜底方案,缩短了水流路径,相较上代水泵进一步提升解热能力。 霜界 240/360 散热器的水泵为定速 2800 RPM 设计,噪声 28db (A)。 两款一体式水冷散热器采用 27mm 厚冷排,...
  • 惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起

    惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起
    本站 5 月 14 日消息,继上线官网后,新款惠普战 99 商用笔记本现已上架,搭载酷睿 ultra / 锐龙 8040处理器,最高可选英伟达rtx 3000 ada 独立显卡,售价 4999 元起。 战 99 锐龙版 R7-8845HS / 16GB / 1TB:4999 元 R7-8845HS / 32GB / 1TB:5299 元 R7-8845HS / RTX 4050 / 32GB / 1TB:7299 元 R7 Pro-8845HS / RTX 2000 Ada...
  • python中def什么意思

    python中def什么意思
    python 中,def 关键字用于定义函数,这些函数是代码块,执行特定任务。函数语法为 def (参数列表)。函数可以通过其名字和圆括号调用。函数可以接受参数作为输入,并在函数体中使用参数名访问。函数可以使用 return 语句返回一个值,它将成为函数调用的结果。 Python 中 def 关键字 在 Python 中,def 关键字用于定义函数。函数是代码块,旨在执行特定任务。 语法 def 函数定义的语法如下: def (参数列表): # 函数体 示例 定义...
  • python中int函数的用法

    python中int函数的用法
    int() 函数将值转换为整数,支持多种类型(字符串、字节、浮点数),默认进制为 10。可以指定进制数范围在 2-36。int() 返回 int 类型的转换结果,丢弃小数点。例如,将字符串 "42" 转换为整数为 42,将浮点数 3.14 转换为整数为 3。 Python 中的 int() 函数 int() 函数用于将各种类型的值转换为整数。它接受任何可以解释为整数的值作为输入,包括字符串、字节、浮点数和十六进制表示。 用法 int(object, base=10) 其中...