由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 哪位将军懂data engineering的请进
相关主题
[ML]Naïve Bayes, 哥们帮解释一下这个方程式加密算法公司RSA被美国国家安全局以一千万美元买通
关于先锋PH4CV, 我找到两个资料,有兴趣的不妨看看我的博客竟然有30万的访问量
Could Chinese beat Indian in US? Look at this article in NYT是不是学数学的很瞧不起学统计的
贴个科普,别在给高外发开脱了万能的军版求问个数学问题
世博威武 (转载)其实海日是机器人,算法很简单
破解北斗编码的清华美女感觉powerball的伪随机算法出问题了
号外!孔庆东被双规。——刚看到的贴子,立马转来。(图)最简单的机器人是骂街机器人
浅谈信息加密与老中的自我保护如果李第二盘完全重复第一盘的走法
相关话题的讨论汇总
话题: seed话题: naive话题: ye话题: 请进
进入Military版参与讨论
1 (共1页)
s****y
发帖数: 581
1
请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干什
么用的?
用的pyspark.
splits = iviris_df.randomSplit([0.7,0.3],1)
Thanks a lot!
s****y
发帖数: 581
2
Re. Ye
I******i
发帖数: 203
3
set seed is used to repeat a random sequence from random generator.
d*****u
发帖数: 17243
4
一般来说固定了seed以后每次执行程序产生的随机数是一致的。
这个在初期训练模型的时候经常用,可以用来比较各种设置的效果。
F********3
发帖数: 256
5
电脑产生的随机数不是真的随机产生的。
固定种子,则每次产生的随机数都是同一个数字。
所有在早期调试中应该固定这个种子

【在 s****y 的大作中提到】
: 请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干什
: 么用的?
: 用的pyspark.
: splits = iviris_df.randomSplit([0.7,0.3],1)
: Thanks a lot!

F********3
发帖数: 256
6
至于种子具体数字无所谓,
随便什么正整数都行
所以1是一个常用的种子,
你选123也行,那就以后固定用123

【在 F********3 的大作中提到】
: 电脑产生的随机数不是真的随机产生的。
: 固定种子,则每次产生的随机数都是同一个数字。
: 所有在早期调试中应该固定这个种子

d********m
发帖数: 3662
7
我就进来看看什么叫data engineering
d********m
发帖数: 3662
8
原来如此
a******9
发帖数: 20431
9
不设一个种子 每次跑出来结果都不一样

:请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候,seed是干
什么用的?
1 (共1页)
进入Military版参与讨论
相关主题
如果李第二盘完全重复第一盘的走法世博威武 (转载)
打牌是人类无敌,这个星姐难得对了一次破解北斗编码的清华美女
量子保密根本就没有理论基础号外!孔庆东被双规。——刚看到的贴子,立马转来。(图)
随机数的突破。好消息啊浅谈信息加密与老中的自我保护
[ML]Naïve Bayes, 哥们帮解释一下这个方程式加密算法公司RSA被美国国家安全局以一千万美元买通
关于先锋PH4CV, 我找到两个资料,有兴趣的不妨看看我的博客竟然有30万的访问量
Could Chinese beat Indian in US? Look at this article in NYT是不是学数学的很瞧不起学统计的
贴个科普,别在给高外发开脱了万能的军版求问个数学问题
相关话题的讨论汇总
话题: seed话题: naive话题: ye话题: 请进