wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN_本港台直播_J2开奖直播_www.wzatv.cc

本港台开奖现场直播

j2开奖直播报码现场

当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

时间:2017-03-28 13:00来源:香港现场开奖作者:118KJ 点击: 次

【新智元导读】本文会通过 Keras 搭建一个深度卷积神经网络来识别一张图片是猫还是狗，在验证集上的准确率可以达到99.6%，建议使用显卡来运行该项目。本项目使用的 Keras 版本是

　　【新智元导读】本文会通过 Keras 搭建一个深度卷积神经网络来识别一张图片是猫还是狗，在验证集上的准确率可以达到99.6%，建议使用显卡来运行该项目。本项目使用的 Keras 版本是1.2.2。

　　本文涉及的所有代码都可以在这里下载：https://github.com/ypwhs/dogs_vs_cats

　　新智元327技术大会爱奇艺回播视频链接，请点击阅读原文。

　　本文授权转载自Udacity知乎机构号，作者杨培文 , Udacity 机器学习项目 reviewer，特此感谢！

　　猫狗大战

　　数据集来自 kaggle 上的一个竞赛：Dogs vs. Cats，训练集有25000张，猫狗各占一半。测试集12500张，没有标定是猫还是狗。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　下面是训练集的一部分例子：

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　数据预处理

　　由于我们的数据集的文件名是以type.num.jpg这样的方式命名的，比如cat.0.jpg，但是使用 Keras 的 ImageDataGenerator 需要将不同种类的图片分在不同的文件夹中，因此我们需要对数据集进行预处理。这里我们采取的思路是创建符号链接(symbol link)，这样的好处是不用复制一遍图片，占用不必要的空间。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　我们可以从下面看到文件夹的结构，train2里面有两个文件夹，分别是猫和狗，每个文件夹里是12500张图。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　导出特征向量

　　对于这个题目来说，使用预训练的网络是最好不过的了，经过前期的测试，我们测试了 ResNet50 等不同的网络，但是排名都不高，现在看来只有一两百名的样子，所以我们需要提高我们的模型表现。那么一种有效的方法是综合各个不同的模型，从而得到不错的效果，兼听则明。如果是直接在一个巨大的网络后面加我们的全连接，那么训练10代就需要跑十次巨大的网络，而且我们的卷积层都是不可训练的，那么这个计算就是浪费的。所以我们可以将多个不同的网络输出的特征向量先保存下来，以便后续的训练，这样做的好处是我们一旦保存了特征向量，即使是在普通笔记本上也能轻松训练。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　为了复用代码，我觉得写一个函数是非常有必要的，那么我们的函数就需要输入模型，输入图片的大小，以及预处理函数，因为 Xception 和 Inception V3 都需要将数据限定在 (-1, 1) 的范围内，然后我们利用 GlobalAveragePooling2D 将卷积层输出的每个激活图直接求平均值，不然输出的文件会非常大，且容易过拟合。然后我们定义了两个 generator，利用 model.predict_generator 函数来导出特征向量，最后我们选择了 ResNet50, Xception, Inception V3 这三个模型（如果有兴趣也可以导出 VGG 的特征向量）。每个模型导出的时间都挺长的，在 aws p2.xlarge 上大概需要用十分钟到二十分钟。这三个模型都是在ImageNet 上面预训练过的，所以每一个模型都可以说是身经百战，j2直播，通过这三个老司机导出的特征向量，可以高度概括一张图片有哪些内容。

　　最后导出的 h5 文件包括三个 numpy 数组：

train (25000, 2048)

test (12500, 2048)

label (25000,)

　　如果你不想自己计算特征向量，可以直接在这里下载导出的文件：GitHub releases（）

　　参考资料：

ResNet 15.12

Inception v3 15.12

Xception 16.10

　　载入特征向量

　　经过上面的代码以后，我们获得了三个特征向量文件，分别是：

gap_ResNet50.h5

gap_InceptionV3.h5

gap_Xception.h5

　　我们需要载入这些特征向量，并且将它们合成一条特征向量，然后记得把 X 和 y 打乱，不然之后我们设置validation_split的时候会出问题。这里设置了 numpy 的随机数种子为2017，这样可以确保每个人跑这个代码，输出都能是一样的结果。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　构建模型

　　模型的构建很简单，直接 dropout 然后分类就好了。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　我们还可以对模型进行可视化：

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

　　训练模型

　　模型构件好了以后，我们就可以进行训练了，这里我们设置验证集大小为 20% ，也就是说训练集是20000张图，验证集是5000张图。

　　

wzatv:【j2开奖】猫狗大战识别准确率直冲 Kaggle Top 2%，手把手教你在 Keras 搭建深度 CNN

(责任编辑：本港台直播)

顶一下

(0)

0%

踩一下

(0)

0%

------分隔线----------------------------

栏目列表

推荐内容

码报:央行要求支付宝纠正支付宝年
（原标题：支付宝年度账单默认勾选引央行关注，曾要求其纠正...
紫光控股继续增持联想控股 22日再
啪啪啪讯12月22日，紫光控股发布公告称，于12月22日进一步购入...
wzatv:Alphabet董事长明年1月卸任：他
（原标题：谷歌母公司执行董事长施密特明年1月卸任：他给谷歌...
码报:和创金服房平：再过三五年会
啪啪啪讯12月21日消息，近日和创金服CEO房平在接受啪啪啪采访中...
码报:外媒：腾讯悄悄打造中国迪斯
（原标题：China's Tencent Has Quietly Built An Entertainment Empire That Wes...
wzatv:CBNData消费大数据报告：90后是
啪啪啪讯 12月20日消息，今日CBNData根据过去一年里对中国大消费...

热点内容