数据挖掘方面入门级别询问 - CS版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

CS版 - 数据挖掘方面入门级别询问

相关主题
● 数据挖掘以后有前途吗?	● [转载]我知道的几个数据库/数据挖掘会议(不同的意见/
● 哪个组的数据挖掘比较好？	● [转载]会议有多好要看你从哪个角度看
● 数据的游戏：冰与火 (zz) (转载)	● University of Vermont的CS PhD怎么样啊？
● 阿里巴巴招数据科学家	● 请问date mining方向好找工作吗？需要学些什么核心课程？
● 【求审稿机会】求机器学习，统计，优化，数据挖掘方面的审稿机	● 做生物类数据挖掘的请教
● 计算机系的理论课到底怎么学呢	● 再问CS的方向选择问题
● How to get TCP delay variation (jitter)	● 求比较M.S CS【感谢】
● Re: How to get TCP delay variation (jitt	● 2011 CS master 可以找IT实习吗?

相关话题的讨论汇总
话题: 数据话题: average话题: number话题: 合成话题: 事务

进入CS版参与讨论

1

(共1页)

w********0 发帖数: 341	1 刚开始搞数据挖掘，下载了IBM合成数据（事务数据）的工具，因此关于合成数据有个不明白，希望牛牛不吝赐教：发现事务数据和前面生成的项目集的conf没有关系呀？比如：参数如下： Number of transactions in database = 10000 Average transaction length = 7 Number of items = 200 Large Itemsets: Number of patterns = 80 Average length of pattern = 4 Correlation between consecutive patterns = 0 Average confidence in a rule = 0.7 Variation in the confidence = 0.1 从生成的事务数据中如何体现Average confidence？其实最本质的问题是：合成数据的标准是什么? 多谢了，本人是菜鸟一个，呵呵。
h********0 发帖数: 440	2 I am not niu ren. But really don't understand your meaning. What is "合成数据"? what is "事务数据"? I roughly guess they are synthetic data and transaction dataset, am I right? But I am totally lost when you talk about "项目集的conf"... Are those the normal Chinese terms? Can you describe your question again in English? 【在 w********0 的大作中提到】 : 刚开始搞数据挖掘，下载了IBM合成数据（事务数据）的工具，因此关于合成数据有个 : 不明白，希望牛牛不吝赐教： : 发现事务数据和前面生成的项目集的conf没有关系呀？ : 比如：参数如下： : Number of transactions in database = 10000 : Average transaction length = 7 : Number of items = 200 : Large Itemsets: : Number of patterns = 80 : Average length of pattern = 4
w********0 发帖数: 341	3 多谢你答复，我的意思就是：我想仿真一个算法，没有真数据，所以就用代码生成数据（合成数据）合成数据的标准是什么？就是输入参数－>输出数据，这么如何评价这个数据好坏呢？我个人认为评价这种数据是不是只要保证数据中有我想找的模式即可！？多谢答复，你真是个好人！！！你说的是对的！ right? （对对对）有这个东东，所以我也不怎么懂，但是我是比葫芦画瓢，知道一点。 right?
p******o 发帖数: 125	4 合成数据：association pattern？

1

(共1页)

进入CS版参与讨论

相关主题
● 2011 CS master 可以找IT实习吗?	● 【求审稿机会】求机器学习，统计，优化，数据挖掘方面的审稿机
● 《数据挖掘》(Data Mining- Concepts And Techniques)第三版[EPUB]	● 计算机系的理论课到底怎么学呢
● 工作 VS PhD? (转载)	● How to get TCP delay variation (jitter)
● 请内行讲讲数据挖掘	● Re: How to get TCP delay variation (jitt
● 数据挖掘以后有前途吗?	● [转载]我知道的几个数据库/数据挖掘会议(不同的意见/
● 哪个组的数据挖掘比较好？	● [转载]会议有多好要看你从哪个角度看
● 数据的游戏：冰与火 (zz) (转载)	● University of Vermont的CS PhD怎么样啊？
● 阿里巴巴招数据科学家	● 请问date mining方向好找工作吗？需要学些什么核心课程？

相关话题的讨论汇总
话题: 数据话题: average话题: number话题: 合成话题: 事务

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)