摔倒检测，基于骨骼点人体动作识别，部分代码用 Chatgpt 完成- 汇维网

哈喽，大家好。

今天给大家分享一个摔倒检测项目，准确地说是基于骨骼点的人体动作识别。

大概分为三个步骤

识别人体
识别人体骨骼点
动作分类

项目源码已经打包好了，获取方式见文末。

0. chatgpt

首先，我们需要获取监控的视频流。这段代码比较固定，我们可以直接让chatgpt完成

chatgpt写的这段代码是没有问题的，可以直接使用。

但后面涉及到业务型任务，比如：用mediapipe识别人体骨骼点，chatgpt给出的代码是不对的。

我觉得chatgpt可以作为一个工具箱，能独立于业务逻辑，都可以试着交给chatgpt完成。

所以，我觉得未来对程序员的要求会更加注重业务抽象的能力。扯远了，言归正传。

1. 人体识别

人体识别可以用目标检测模型，比如：YOLOv5，之前我们也分享过好多训练YOLOv5模型的文章。

但这里我没有用YOLOv5，而是用mediapipe。因为mediapipe运行速度更快，在 CPU 上也能流畅地运行。

2. 骨骼点识别

识别骨骼点的模型有很多，如：alphapose、openpose，每种模型识别出来的骨骼点个数和位置都有所差异。比如下面这两种：

mediapipe 32个骨骼点

coco 17个骨骼点

骨骼点的识别我仍然使用mediapipe，除了速度快，另一个优势是mediapipe识别的骨骼点多，有 32 个，能满足我们的使用。因为下面要用的人体动作分类，强依赖于骨骼点。

image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
results = pose.process(image)

if not results.pose_landmarks:
    continue

# 识别人体骨骼点
image.flags.writeable = True
image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

mp_drawing.draw_landmarks(
    image,
    results.pose_landmarks,
    mp_pose.POSE_CONNECTIONS,
    landmark_drawing_spec=mp_drawing_styles.get_default_pose_landmarks_style()
)

3. 动作识别

动作识别使用的是基于骨架动作识别的时空图卷积网络，开源方案是STGCN（Skeleton-Based Graph Convolutional Networks）

https://github.com/yysijie/st-gcn

一组动作，如：摔倒，由 N 帧组成，每一帧可以构造出以骨骼点坐标组成的空间图，骨骼点在帧之间连接起来就构成时间图，骨骼点的连接和时间帧的连接便可以构造一张时空图。

时空图

在时空图上进行多层图卷积运算，便可生成更高层次的特征图。然后输入到SoftMax分类器进行动作分类(Action Classification)。

图卷积

本来我打算训练STGCN模型的，但遇到的坑实在是太多了，最后直接用了别人训练好的模型。

坑1. STGCN 支持 OpenPose 识别的骨骼点，有数据集Kinetics-skeleton可以直接用。坑的地方在于OpenPose安装太麻烦，需要一堆步骤，挣扎后放弃。

坑2. STGCN 还支持 NTU RGB+D数据集，该数据集有 60 个动作分类，如：起立、行走、摔倒等。这份数据集的人体包含 25 个骨骼点，只有坐标数据，原始视频基本搞不到，所以没办法知道这 25 个骨骼点对应哪些位置，以及用什么模型能识别出这 25 个骨骼点，挣扎后放弃。

上面两个大坑，导致没法直接训练STGCN模型，找了一个开源的方案，它用的是alphapose识别 14 个骨骼点，同时修改STGCN源码支持自定义骨骼点。

https://github.com/GajuuzZ/Human-Falling-Detect-Tracks

我看了下mediapipe包含了这 14 个骨骼点，所以可以用mediapipe识别的骨骼点输入他的模型，实现动作分类。

mediapipe 32个骨骼点

选出14个关键骨骼点

14个骨骼点提取代码：

KEY_JOINTS = [
    mp_pose.PoseLandmark.NOSE,
    mp_pose.PoseLandmark.LEFT_SHOULDER,
    mp_pose.PoseLandmark.RIGHT_SHOULDER,
    mp_pose.PoseLandmark.LEFT_ELBOW,
    mp_pose.PoseLandmark.RIGHT_ELBOW,
    mp_pose.PoseLandmark.LEFT_WRIST,
    mp_pose.PoseLandmark.RIGHT_WRIST,
    mp_pose.PoseLandmark.LEFT_HIP,
    mp_pose.PoseLandmark.RIGHT_HIP,
    mp_pose.PoseLandmark.LEFT_KNEE,
    mp_pose.PoseLandmark.RIGHT_KNEE,
    mp_pose.PoseLandmark.LEFT_ANKLE,
    mp_pose.PoseLandmark.RIGHT_ANKLE
]

landmarks = results.pose_landmarks.landmark
joints = np.array([[landmarks[joint].x * image_w,
                    landmarks[joint].y * image_h,
                    landmarks[joint].visibility]
                   for joint in KEY_JOINTS])

STGCN原始方案构造的空间图只支持openpose18个骨骼点和NTU RGB+D数据集25个骨骼点

修改这部分源码，以支持自定义的14个骨骼点

模型直接使用Human-Falling-Detect-Tracks项目已经训练好的，实际运行发现识别效果很差，因为没有看到模型训练过程，不确定问题出在哪。

有能力的朋友可以自己训练模型试试，另外，百度的Paddle也基于STGCN开发了一个跌倒检测模型，只支持摔倒这一种行为的识别。

当然大家也可以试试Transformer的方式，不需要提取骨骼点特征，直接将 N 帧图片送入模型分类。

关于STGCN的原理，大家可以参考文章：https://www.jianshu.com/p/be85114006e3 总结的非常好。

需要源码的朋友留言区回复即可。

如果大家觉得本文对你有用就点个在看鼓励一下吧，后续我会持续分享优秀的 Python+AI 项目。

1 原创文章作者：卡门，如若转载，请注明出处： https://www.52hwl.com/58547.html

2 温馨提示：软件侵权请联系469472785#qq.com（三天内删除相关链接）资源失效请留言反馈

3 下载提示：如遇蓝奏云无法访问，请修改lanzous(把s修改成x)

4 免责声明：本站为个人博客，所有软件信息均来自网络修改版软件，加群广告提示为修改者自留，非本站信息，注意鉴别

摔倒检测，基于骨骼点人体动作识别，部分代码用 Chatgpt 完成

0. chatgpt

1. 人体识别

2. 骨骼点识别

3. 动作识别

关于作者

卡门注册用户

摔倒检测，基于骨骼点人体动作识别，部分代码用 Chatgpt 完成

0. chatgpt

1. 人体识别

2. 骨骼点识别

3. 动作识别

关于作者

卡门注册用户

相关推荐

实施机器人的七个技巧

ChatGPT发布iOS版App！国产已在路上！

让机器人学会咖啡拉花，得从流体力学搞起！CMU&MIT推出流体模拟平台

从科幻到现实，自动驾驶发展还面临哪些问题？

九大思维框架：让你ChatGPT使用能力提升百倍

Gartner发布报告称，中国企业平均已部署超过5个AI用例