AI第6课：计算机视觉

青少年联合AI专业课程（首页）

青少年联合AI专业课程

AI第6课：计算机视觉

青少年人工智能管理委员会

计算机视觉：让AI"看懂"世界的魔法

——给青少年的趣味科普课

大家好！今天我们要探索一个超酷的AI超能力——计算机视觉（Computer Vision）！就是让计算机像人类一样"看懂"照片和视频。从手机人脸解锁到自动驾驶，计算机视觉正在改变我们的生活。想知道AI是怎么认出你的脸的吗？为什么它有时会把熊猫认成长臂猿？让我们一起来解密！

1. 什么是计算机视觉？

计算机视觉是AI的一个分支，教会计算机从图像/视频中获取信息，完成三大核心任务：

识别（这是什么？）→ 比如扫二维码

检测（东西在哪？）→ 比如照片中标记好友

理解（发生了什么？）→ 比如监控异常行为

🌰举个栗子：

当你用手机拍作业时，AI会：

检测纸张边缘 → 2. 识别文字 → 3. 自动矫正角度 → 4. 提取答案

2. 计算机视觉的五大超能力

🔍 超能力1：人脸识别

原理：测量五官间距/轮廓等128个关键点

应用：手机解锁、机场安检、寻找走失儿童

趣闻：香港大学用AI识别猕猴面部，研究它们的情绪！

📸 超能力2：图像分类

经典测试：ImageNet数据集（1400万张图片，2万类别）

挑战：区分哈士奇和狼（关键看眼睛颜色和鼻梁形状！）

🚗 超能力3：目标检测

YOLO算法（You Only Look Once）：实时标出物体位置

应用：自动驾驶识别行人、超市自动结算

🎨 超能力4：图像生成

GAN网络：让AI创作不存在的人脸（thispersondoesnotexist.com）

DeepDream：把普通照片变成梦幻画作

🖐️ 超能力5：手势交互

Leap Motion：用手势控制电脑

手术导航：医生隔空操作医疗影像

3. 计算机视觉如何工作？

四步处理流程

获取图像：摄像头/卫星/显微镜拍摄

预处理：去噪、增强对比度（像手机修图）

特征提取：

传统方法：检测边缘/角点（如SIFT算法）

深度学习方法：用CNN卷积神经网络自动学习

决策输出：分类/定位/生成描述

🤖 技术核心：

卷积神经网络（CNN）：模仿人脑视觉皮层，层层提取特征

注意力机制：像人类一样"聚焦"关键区域

5. 为什么AI会看错？

计算机视觉仍有局限：

对抗样本：在熊猫图片上加特定噪点，AI会误认为长臂猿

数据偏见：如果训练数据多是浅肤色人脸，深肤色识别率会下降

语义鸿沟：能认出"狗"，但不懂"忠诚"的概念

💡 小实验：

在纸上画个扭曲的停车标志，测试手机AI能否识别！

6. 你也能玩转计算机视觉！

零基础体验

Google Vision API：上传照片，看AI如何解析内容

Snapchat滤镜：自己开发一个AR特效

OpenCV入门：用Python做简单的人脸检测

进阶挑战

训练AI区分不同品牌的运动鞋

用树莓派制作会跟踪人脸的摄像头

7. 未来展望

医疗：AI显微镜实时检测癌细胞

农业：无人机识别病虫害，精准喷洒农药

环保：用卫星图像监控森林砍伐

🌟 思考题：

如果让你设计一个校园计算机视觉应用，你会解决什么问题？（比如自动检查校服穿着？）

总结

计算机视觉让AI获得"看"的能力

核心技术是深度学习+图像处理

已广泛应用于生活，但仍面临挑战

你们这一代将创造更智能的视觉AI！

📸 小任务：

用手机给家里的宠物拍照，试试不同AI相机的识别效果！