博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
神经网络CNN训练心得--调参经验
阅读量:6196 次
发布时间:2019-06-21

本文共 535 字,大约阅读时间需要 1 分钟。

1.样本要随机化,防止大数据淹没小数据

2.样本要做归一化。关于归一化的好处请参考:
3.激活函数要视样本输入选择(多层神经网络一般使用relu)
4.mini batch很重要,几百是比较合适的(很大数据量的情况下)
5.学习速率(learning rate)很重要,比如一开始可以lr设置为0.01,然后运行到loss不怎么降的时候,学习速率除以10,接着训练
6.权重初始化,可用高斯分布乘上一个很小的数,这个可以看:
7.Adam收敛速度的确要快一些,可结果往往没有sgd + momentum的解好(如果模型比较复杂的话,sgd是比较难训练的,这时候adam的威力就体现出来了
8.Dropout的放置位置以及大小非常重要
9.early stop,发现val_loss没更新,就尽早停止
另:心得体会
深度学习真是一门实验科学,很多地方解释不了为什么好,为什么不好。
网络层数、卷积核大小、滑动步长,学习速率这些参数的设置大多是通过已有的架构来做一些微调
参考:知乎讨论 https://www.zhihu.com/question/41631631

转载于:https://www.cnblogs.com/dailidong/p/7571094.html

你可能感兴趣的文章
1073B. Vasya and Books
查看>>
RabbitMQ学习总结(3)——入门实例教程详解
查看>>
一步步构建大型网站架构
查看>>
C# 利用反射动态给模型Model 赋值
查看>>
课堂作业(类与对象)
查看>>
内存初始化
查看>>
最大公约数和最小公倍数
查看>>
【转载】PHP中require(),include(),require_once()和include_once()区别
查看>>
php函数篇
查看>>
窗口启用/禁用功能函数EnableWindow的使用
查看>>
网页布局基础 第四次
查看>>
hdu 2099(整除的尾数)
查看>>
sqlserver 自增字段修改为普通主键字段
查看>>
Java 集合结构图
查看>>
Java中final的用法总结
查看>>
amazeui学习笔记--css(常用组件6)--图标Icon
查看>>
vector代替数组
查看>>
CSS.5布局
查看>>
day--16页面布局
查看>>
Ubuntu下两个gcc版本切换
查看>>