青少年联合AI专业课程
AI第6课:计算机视觉
青少年人工智能管理委员会
计算机视觉:让AI"看懂"世界的魔法
——给青少年的趣味科普课
大家好!今天我们要探索一个超酷的AI超能力——计算机视觉(Computer Vision)!就是让计算机像人类一样"看懂"照片和视频。从手机人脸解锁到自动驾驶,计算机视觉正在改变我们的生活。想知道AI是怎么认出你的脸的吗?为什么它有时会把熊猫认成长臂猿?让我们一起来解密!
1. 什么是计算机视觉?
计算机视觉是AI的一个分支,教会计算机从图像/视频中获取信息,完成三大核心任务:
识别(这是什么?)→ 比如扫二维码
检测(东西在哪?)→ 比如照片中标记好友
理解(发生了什么?)→ 比如监控异常行为
🌰举个栗子:
当你用手机拍作业时,AI会:
检测纸张边缘 → 2. 识别文字 → 3. 自动矫正角度 → 4. 提取答案
2. 计算机视觉的五大超能力
🔍 超能力1:人脸识别
原理:测量五官间距/轮廓等128个关键点
应用:手机解锁、机场安检、寻找走失儿童
趣闻:香港大学用AI识别猕猴面部,研究它们的情绪!
📸 超能力2:图像分类
经典测试:ImageNet数据集(1400万张图片,2万类别)
挑战:区分哈士奇和狼(关键看眼睛颜色和鼻梁形状!)
🚗 超能力3:目标检测
YOLO算法(You Only Look Once):实时标出物体位置
应用:自动驾驶识别行人、超市自动结算
🎨 超能力4:图像生成
GAN网络:让AI创作不存在的人脸(thispersondoesnotexist.com)
DeepDream:把普通照片变成梦幻画作
🖐️ 超能力5:手势交互
Leap Motion:用手势控制电脑
手术导航:医生隔空操作医疗影像
3. 计算机视觉如何工作?
四步处理流程
获取图像:摄像头/卫星/显微镜拍摄
预处理:去噪、增强对比度(像手机修图)
特征提取:
传统方法:检测边缘/角点(如SIFT算法)
深度学习方法:用CNN卷积神经网络自动学习
决策输出:分类/定位/生成描述
🤖 技术核心:
卷积神经网络(CNN):模仿人脑视觉皮层,层层提取特征
注意力机制:像人类一样"聚焦"关键区域
5. 为什么AI会看错?
计算机视觉仍有局限:
对抗样本:在熊猫图片上加特定噪点,AI会误认为长臂猿
数据偏见:如果训练数据多是浅肤色人脸,深肤色识别率会下降
语义鸿沟:能认出"狗",但不懂"忠诚"的概念
💡 小实验:
在纸上画个扭曲的停车标志,测试手机AI能否识别!
6. 你也能玩转计算机视觉!
零基础体验
Google Vision API:上传照片,看AI如何解析内容
Snapchat滤镜:自己开发一个AR特效
OpenCV入门:用Python做简单的人脸检测
进阶挑战
训练AI区分不同品牌的运动鞋
用树莓派制作会跟踪人脸的摄像头
7. 未来展望
医疗:AI显微镜实时检测癌细胞
农业:无人机识别病虫害,精准喷洒农药
环保:用卫星图像监控森林砍伐
🌟 思考题:
如果让你设计一个校园计算机视觉应用,你会解决什么问题?(比如自动检查校服穿着?)
总结
计算机视觉让AI获得"看"的能力
核心技术是深度学习+图像处理
已广泛应用于生活,但仍面临挑战
你们这一代将创造更智能的视觉AI!
📸 小任务:
用手机给家里的宠物拍照,试试不同AI相机的识别效果!