课题名称 基于卷积神经网络的猫的品种识别模型的构建与实现课题性质 基础研究●应用课题 设计型 调研综述 理论研究开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)一、 研究背景随着软硬件技术的飞速发展和大数据时代的到来,深度学习在越来越多的领域中取得了突破性成果。
其中,卷积神经网络受生物视觉系统启发,具备局部感受野、参数共享、降采样、稀疏连接等技术,适合完成图像分析任务,如手写数字、车牌和门牌号的识别,近年来已成为计算机视觉领域和人工智能领域中相对活跃的研究方向。
[1] [2]猫作为人类驯养的宠物的一种,受到许多饲养者的喜爱。
本课题的研究结果能够为猫咪爱好者提供一种从猫的图片中快速鉴别猫种类的方法,有助于人们能够根据各品种的习性科学地饲养猫,并能在本课题研究的基础上推广到其他各类动植物种类鉴别的应用中。
二、 国内外研究现状目前已经有多种卷积神经网络模型被提出,2012年,Krizhevsky等[3]提出的AlexNet在大型图像数据库ImageNet[4]的图像分类竞赛中以准确度达到62.5%夺得了冠军。
ImageNet是由美国斯坦福的计算机科学家为模拟人类的识别系统建立的,目前世界上图像识别最大的数据库 ,它包含12个子树共三千两百万个注释,图像超过5247个类别,为每一个同步集收集了超过600张图像。
AlexNet之后,不断有新的卷积神经网络模型被提出,如牛津大学的VGG(Visual Geometry Group)[5]、Google的GoogLeNet[6]、微软的ResNet[7]等,ResNet在ImageNet图像分类任务中达到了80.62%的准确率。
[7] 在我国,卷积神经网络也得到了广泛应用,如浪潮联合Altera和科大讯飞,共同发布了一套并行化设计和优化的深度学习DNN的语音识别方案;2017年,阿里云在云栖大会上宣布推出ET医疗大脑和ET工业大脑,通过计算机视觉技术,在甲状腺B超影像上圈出结节点,并给出良性或者恶性的判断;腾讯觅影是腾讯首款人工智能与医学结合的AI医学影像产品,运用计算机视觉和深度学习技术对各类医学影像(内窥镜、病理、钼靶、超声、CT、MRI等)进行学习训练,有效地辅助医生诊断和重大疾病早期筛查等任务。
三、 课题研究内容1. 课题概述本课题将实现从互联网上搜集猫的各个品种与其公开图片,并对图片做预处理以增强数据集,按照一定比例分成训练集和测试集,对已有的卷积神经网络模型进行修改,实现对猫的品种进行识别。
使用训练集的数据对模型进行训练,调整神经网络训练的超参数来优化模型;使用测试集的数据来评价各模型的识别性能(准确率、召回率和曲线下面积等)。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。