CNN & Image Classification
课程简介
图像分类(Image classification),可以定义为将图像归入到几个预定义类中的一项分类或识别任务,是计算机视觉的一个基本问题。构成了其它计算机视觉任务的基础,如目标定位、目标检测和实例分割等。虽然这项任务对人类来说再自然不过了,但对自动化系统来说却更具挑战性。
近年来,利用多层非线性信息处理(卷积),用于特征提取和转换以及模式分析和分类的深度学习模型已经被证明可以克服传统图像分类所面临的挑战。其中,卷积神经网络(Convolutional Neural Network,CNN)已经成为大多数图像识别、分类和目标检测任务的领先架构。随着GPU、更大的数据集和更好的算法的出现,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)大放异彩。深度卷积神经网络在ImageNet数据集分类测试中的性能表现已经接近人类。
图像分类技术可以用来识别特定人员的脸部或指纹、识别手写数字、识别特定车辆、检测医学图像中可能存在的异常细胞或组织、检测自动道路收费系统中的车辆等等,因此在工业制造、医学影像、机器视觉、军事、自动驾驶、触觉反馈、现代农业、教育等领域必将发挥越来越重要的作用。
第1周课程内容主要讲述神经网络入门知识,包括自然神经元结构、演化、神经信号传导机制、人工神经元结构、简单神经网络结构等,是本科生学习卷积神经网络必须了解的过渡和基础知识。
2~8周课程涉及7个用于图像分类的著名卷积神经网络模型,分别是:LeNet-5(识别手写数字)、AlexNet(宠物猫狗识别)、VGG(表情识别)GoogleNet(车辆品牌识别)、ResNet(宠物猫狗品种识别)、MobileNet(新疆苹果品种识别)和EfficientNet(新疆核桃品种识别)。
先修课程要求
为了顺利完成本课程,请你先学习下列课程:
- 线性代数
- 微积分
- Python编程语言
- 机器学习
课程组成员
穆妮热·穆合塔尔
郭钊汝
徐金
张泽宇
赵昀杰
姚芷馨
刘悦
常见问题
我需要购买教材吗?
需要,请务必购置课程组主编的《卷积神经网络与图像分类》教材,同时课程网站提供了大量的文档和资源链接,可以补充课程学习的推展需要。
我需要自己配备计算机吗?
是的。要想掌握卷积神经网络开发技术,你必须自动动手编写实现特定功能的程序代码,仅靠课程安排的实验环节是不够的。在你自己的计算机上进行开发会方便的多。
该课程的最终成绩是如何构成的?
MOOC平台上的单元测验占40%,项目开发(共16个)占60%。