s****y 发帖数: 581 | 1 请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干什
么用的?
用的pyspark.
splits = iviris_df.randomSplit([0.7,0.3],1)
Thanks a lot! |
s****y 发帖数: 581 | |
I******i 发帖数: 203 | 3 set seed is used to repeat a random sequence from random generator. |
d*****u 发帖数: 17243 | 4 一般来说固定了seed以后每次执行程序产生的随机数是一致的。
这个在初期训练模型的时候经常用,可以用来比较各种设置的效果。 |
F********3 发帖数: 256 | 5 电脑产生的随机数不是真的随机产生的。
固定种子,则每次产生的随机数都是同一个数字。
所有在早期调试中应该固定这个种子
【在 s****y 的大作中提到】 : 请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干什 : 么用的? : 用的pyspark. : splits = iviris_df.randomSplit([0.7,0.3],1) : Thanks a lot!
|
F********3 发帖数: 256 | 6 至于种子具体数字无所谓,
随便什么正整数都行
所以1是一个常用的种子,
你选123也行,那就以后固定用123
【在 F********3 的大作中提到】 : 电脑产生的随机数不是真的随机产生的。 : 固定种子,则每次产生的随机数都是同一个数字。 : 所有在早期调试中应该固定这个种子
|
d********m 发帖数: 3662 | 7 我就进来看看什么叫data engineering |
d********m 发帖数: 3662 | |
a******9 发帖数: 20431 | 9 不设一个种子 每次跑出来结果都不一样
:请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干
什么用的?
: |