由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - adam有时候第一个epoch就跑飞了
相关主题
Tf里面怎么选optimizer?有没有做sentiment analysis的,求思路
how to get the number of days between two dates in C++求问 tf.estimator.trainspec max_steps
问一个c的问题神经网络的开窍现象
boost的deadline_timer要多脑残才能整出来?无论啥争论最后都可以收敛到w2。。。
mint 是啥语言写的别转machine learning,坚守马工 (转载)
知道R为什么那么流行了哈哈各位专家,DP明年哪个平台会占优?
再问机器学习。。。用keras分类应不应该用pretrain的model
xiaoju 老师进来一下请推荐讲算法和数据结构的好书!
相关话题的讨论汇总
话题: epoch话题: adam话题: 第一个
进入Programming版参与讨论
1 (共1页)
L****8
发帖数: 3938
1
重启几次 如果第一个epoch收敛 后面就收敛了
adam 这个算法 大家还用么?
w***g
发帖数: 5958
2
learning rate太大
L****8
发帖数: 3938
3
learning rate 太小 看着着急啊 哈哈

【在 w***g 的大作中提到】
: learning rate太大
1 (共1页)
进入Programming版参与讨论
相关主题
[bssd] 讨论一点参数调节的浅见mint 是啥语言写的
一个小问题知道R为什么那么流行了哈哈
请问macbook自带的perl怎样可以替换掉? (转载)再问机器学习。。。用keras分类
温州动车事故启示:重启动(初始化)程序难搞啊!xiaoju 老师进来一下
Tf里面怎么选optimizer?有没有做sentiment analysis的,求思路
how to get the number of days between two dates in C++求问 tf.estimator.trainspec max_steps
问一个c的问题神经网络的开窍现象
boost的deadline_timer要多脑残才能整出来?无论啥争论最后都可以收敛到w2。。。
相关话题的讨论汇总
话题: epoch话题: adam话题: 第一个