哪位将军懂data engineering的请进 - Military版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Military版 - 哪位将军懂data engineering的请进

相关主题
● [ML]Naïve Bayes, 哥们帮解释一下这个方程式	● 加密算法公司RSA被美国国家安全局以一千万美元买通
● 关于先锋PH4CV, 我找到两个资料，有兴趣的不妨看看	● 我的博客竟然有30万的访问量
● Could Chinese beat Indian in US? Look at this article in NYT	● 是不是学数学的很瞧不起学统计的
● 贴个科普,别在给高外发开脱了	● 万能的军版求问个数学问题
● 世博威武 (转载)	● 其实海日是机器人，算法很简单
● 破解北斗编码的清华美女	● 感觉powerball的伪随机算法出问题了
● 号外！孔庆东被双规。——刚看到的贴子，立马转来。（图）	● 最简单的机器人是骂街机器人
● 浅谈信息加密与老中的自我保护	● 如果李第二盘完全重复第一盘的走法

相关话题的讨论汇总
话题: seed话题: naive话题: ye话题: 请进

进入Military版参与讨论

1

(共1页)

s****y 发帖数: 581	1 请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候，seed是干什么用的？用的pyspark. splits = iviris_df.randomSplit([0.7,0.3],1) Thanks a lot!
s****y 发帖数: 581	2 Re. Ye
I******i 发帖数: 203	3 set seed is used to repeat a random sequence from random generator.
d*****u 发帖数: 17243	4 一般来说固定了seed以后每次执行程序产生的随机数是一致的。这个在初期训练模型的时候经常用，可以用来比较各种设置的效果。
F********3 发帖数: 256	5 电脑产生的随机数不是真的随机产生的。固定种子，则每次产生的随机数都是同一个数字。所有在早期调试中应该固定这个种子【在 s****y 的大作中提到】 : 请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候，seed是干什 : 么用的？ : 用的pyspark. : splits = iviris_df.randomSplit([0.7,0.3],1) : Thanks a lot!
F********3 发帖数: 256	6 至于种子具体数字无所谓，随便什么正整数都行所以1是一个常用的种子，你选123也行，那就以后固定用123 【在 F********3 的大作中提到】 : 电脑产生的随机数不是真的随机产生的。 : 固定种子，则每次产生的随机数都是同一个数字。 : 所有在早期调试中应该固定这个种子
d********m 发帖数: 3662	7 我就进来看看什么叫data engineering
d********m 发帖数: 3662	8 原来如此
a******9 发帖数: 20431	9 不设一个种子每次跑出来结果都不一样：请解释一下seed=1在建立spark 的Naive bayes的model 时在split的时候，seed是干什么用的？：

1

(共1页)

进入Military版参与讨论

相关主题
● 如果李第二盘完全重复第一盘的走法	● 世博威武 (转载)
● 打牌是人类无敌，这个星姐难得对了一次	● 破解北斗编码的清华美女
● 量子保密根本就没有理论基础	● 号外！孔庆东被双规。——刚看到的贴子，立马转来。（图）
● 随机数的突破。好消息啊	● 浅谈信息加密与老中的自我保护
● [ML]Naïve Bayes, 哥们帮解释一下这个方程式	● 加密算法公司RSA被美国国家安全局以一千万美元买通
● 关于先锋PH4CV, 我找到两个资料，有兴趣的不妨看看	● 我的博客竟然有30万的访问量
● Could Chinese beat Indian in US? Look at this article in NYT	● 是不是学数学的很瞧不起学统计的
● 贴个科普,别在给高外发开脱了	● 万能的军版求问个数学问题

相关话题的讨论汇总
话题: seed话题: naive话题: ye话题: 请进

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)