w********0 发帖数: 341 | 1 刚开始搞数据挖掘,下载了IBM合成数据(事务数据)的工具,因此关于合成数据有个
不明白,希望牛牛不吝赐教:
发现事务数据和前面生成的项目集的conf没有关系呀?
比如:参数如下:
Number of transactions in database = 10000
Average transaction length = 7
Number of items = 200
Large Itemsets:
Number of patterns = 80
Average length of pattern = 4
Correlation between consecutive patterns = 0
Average confidence in a rule = 0.7
Variation in the confidence = 0.1
从生成的事务数据中如何体现Average confidence?
其实最本质的问题是:合成数据的标准是什么?
多谢了,本人是菜鸟一个,呵呵。 |
h********0 发帖数: 440 | 2 I am not niu ren.
But really don't understand your meaning.
What is "合成数据"?
what is "事务数据"?
I roughly guess they are synthetic data and transaction dataset, am I right?
But I am totally lost when you talk about "项目集的conf"...
Are those the normal Chinese terms?
Can you describe your question again in English?
【在 w********0 的大作中提到】 : 刚开始搞数据挖掘,下载了IBM合成数据(事务数据)的工具,因此关于合成数据有个 : 不明白,希望牛牛不吝赐教: : 发现事务数据和前面生成的项目集的conf没有关系呀? : 比如:参数如下: : Number of transactions in database = 10000 : Average transaction length = 7 : Number of items = 200 : Large Itemsets: : Number of patterns = 80 : Average length of pattern = 4
|
w********0 发帖数: 341 | 3 多谢你答复,我的意思就是:
我想仿真一个算法,没有真数据,所以就用代码生成数据(合成数据)
合成数据的标准是什么?
就是输入参数->输出数据,这么如何评价这个数据好坏呢?
我个人认为评价这种数据是不是只要保证数据中有我想找的模式即可!?多谢答复,你
真是个好人!!!
你说的是对的!
right? (对对对)
有这个东东,所以我也不怎么懂,但是我是比葫芦画瓢,知道一点。
right? |
p******o 发帖数: 125 | 4 合成数据:association pattern? |