N**D 发帖数: 10322 | 1 separable SVM is obained by minimizing an upper bound on the expected risk
of a linear classifier, which depends on VC dimension, which is upper
bounded by a quantitty depends on margin, which is again inverse
proportional to ||w||^2 (if the margin is measured using Euclidean norm).
The slack variable is a technique to handle non-separable case.
intuit |
|
c*********e 发帖数: 16335 | 2 data warehouse里面,所有dimension table的数据要拷贝到新的fact table里面,觉
得这做法比较傻。
我知道这其实是想一劳永逸,只copy一次就够了。但是,table和table之间,应该用
foreign key之类的来维持数据的一致和可靠,这种copy已经脱离了relational
database的本意。 |
|
E*****e 发帖数: 197 | 3 没看明白...为啥要把所有dimension的数据拷到新的fact table 里呀? |
|
y*****g 发帖数: 677 | 4 我也不明白
Fact 和 dimension 不是独立的吗? |
|
c*********e 发帖数: 16335 | 5 比如一個star schema,要把各个dimension table的数据拷贝到fact table里面,拷贝
完后,就只对这个fact table做各种query. |
|
l******t 发帖数: 660 | 6 你的意思是query的时候做 data base denomalization吧? 就是join fact table和
dimension table成一个大的data set, 这个都是query time或者 单独一个view,要
是都pre populate成为一个大table, 就失去了star schema的意义 |
|
c*********e 发帖数: 16335 | 7 data warehouse里面,所有dimension table的数据要拷贝到新的fact table里面,觉
得这做法比较傻。
我知道这其实是想一劳永逸,只copy一次就够了。但是,table和table之间,应该用
foreign key之类的来维持数据的一致和可靠,这种copy已经脱离了relational
database的本意。 |
|
E*****e 发帖数: 197 | 8 没看明白...为啥要把所有dimension的数据拷到新的fact table 里呀? |
|
y*****g 发帖数: 677 | 9 我也不明白
Fact 和 dimension 不是独立的吗? |
|
c*********e 发帖数: 16335 | 10 比如一個star schema,要把各个dimension table的数据拷贝到fact table里面,拷贝
完后,就只对这个fact table做各种query. |
|
l******t 发帖数: 660 | 11 你的意思是query的时候做 data base denomalization吧? 就是join fact table和
dimension table成一个大的data set, 这个都是query time或者 单独一个view,要
是都pre populate成为一个大table, 就失去了star schema的意义 |
|
e****7 发帖数: 4387 | 12
这样一来你的ETL简化了只要导入FACT,所有DIM都是degenerate dimension 了。如果
数据量大,这个可能会比较低效率,除非OLAP process 系统对此优化了。
看你用啥系统,数据到底有多少,有多复杂了。 |
|
d****n 发帖数: 12461 | 13 这点很重要啊。因为dimension会改变,如果不在原始数据还在etl的时候和fact联合的
话,以后也许就再也没机会了。
relation只是万不得已的时候才用的。至于fk,那是给前台input时候搞的,中间给自
己用就是枷锁。
在dw里面,其实单个数据可靠不可靠不重要。重要的是即使有一批不可靠数据,系统还
能容错,不可靠数据也不会影响结果。 |
|
i*******d 发帖数: 81 | 14 常见的是transitive dependency。不会引入什么anomaly。比如product dimension。
有谁能举一些partial dependency的例子么?很少看到。可能引入什么坏处?
多谢! |
|
|
d***e 发帖数: 793 | 16 DIMENSION是描述性的,说的是你这个东西是什么;Fact是度量性说,说的是你这个东
西有多少。 |
|
y*****g 发帖数: 677 | 17 都说得对,还是举例子好:
FACT table:
SALES (day_key, salerep_key, product_key, order_amount);
dimension tables:
DAY,
SALEREP,
PRODUCT
PRODUCT
|
|
\ /
DAY --> SALES <--SALEREP |
|
|
d***e 发帖数: 793 | 19 DIMENSION是描述性的,说的是你这个东西是什么;Fact是度量性说,说的是你这个东
西有多少。 |
|
y*****g 发帖数: 677 | 20 都说得对,还是举例子好:
FACT table:
SALES (day_key, salerep_key, product_key, order_amount);
dimension tables:
DAY,
SALEREP,
PRODUCT
PRODUCT
|
|
\ /
DAY --> SALES <--SALEREP |
|
s**********o 发帖数: 14359 | 21 三个都是DIMENSION TABLES,你的回答表明你没真正懂得DW
建好的微软的CUBE当然是用MDX来QUERY |
|
s**********o 发帖数: 14359 | 22 SALE是有FACT的嫌疑,但是没有那么多KEY了怎么可能是FACT TABLE
FACT至少要有CUSTOMID,PRODUCTID了
其实SALE就是ORDER,就是个DIMENSION,这位问问题的人也是
随口说说,没仔细准备
column。 |
|
a****b 发帖数: 489 | 23 Any thoughts/concerns/best practices about two slowly chaning dimensions
have FK relationship?
Thanks |
|
s*********t 发帖数: 296 | 24 通常的做法是象eagle7说的:两个dimension table(dimEmp & dimAccount),关联通过
fact table实现。
如果确实需要关联dimEmp & dimAccount,可以在dimEmp & dimAccount中间建一个
bridge table。一对多的关系下,也有人在dimEmp里加dimAccount的logical key 作为
FK。
between
useful
for |
|
a******g 发帖数: 725 | 25 slowly chaning dimensions只能用在简单的东西上,就是点鼠标。
垃圾货, 实用性太差。 复杂的都是CODE 解决。 |
|
j*****I 发帖数: 2626 | 26 这可能是啥问题? 还发现另外一个问题,就是cpu usage总是是在%15到%40之间蹦来蹦去。重装的XP,就装了个McAfee,而且没有在scan。
dell dimension 3000 老古董拉 |
|
j*****I 发帖数: 2626 | 27 现在风扇又发疯了。看来thermal grease不是主要问题。search了一下,说dimension
3000的mother board上没有temperature sensor. 听着好像有点道理,因为BIOS里面根
本就没有办法看温度。但是,又很奇怪。如果主板上没有sensor,怎么控制风扇转速什
么的? |
|
r***e 发帖数: 2539 | 28 很老的主板没有调节转速的,
老奔四该扔了,太慢费电。
dimension |
|
s********n 发帖数: 944 | 29 戴尔compact型dimension 4700c台式机咋就不能装second硬盘呢?
打开盖盖一看,压根儿就没有装second硬盘的空间。本想用这种办法尽可能恢复几个坏
了的硬盘数据 |
|
f******w 发帖数: 1856 | 30 接上线就行, 不一定要架子, 能搁在一个地方就可以了
戴尔compact型dimension 4700c台式机咋就不能装second硬盘呢?
打开盖盖一看,压根儿就没有装second硬盘的空间。本想用这种办法尽可能恢复几个坏
了的硬盘数据 |
|
s********n 发帖数: 944 | 31 谢谢您的建议!
看来只能这样凑合着用。
发信人: fhxysnow (风雪), 信区: Hardware
标 题: Re: 戴尔compact型dimension 4700c台式机咋就不能装second硬盘?br /> 发
信站: BBS 未名空间站 (Sun Sep 19 17:10:41 2010, 美东)
接上线就行, 不一定要架子, 能搁在一个地方就可以了 |
|
l********8 发帖数: 25 | 32 请教一下如下一个积分:
i=23;
b=2;
g(1:2,i+1)=[0.0089 0.0401]';
v_g(1:2,i)=[0.0205 0.0120]';
eta_g(1:2,1:2,i)=[924.1483 -127.3713 ; -127.3713 87.6577];
% Y is a number ranging from zero to infinity.
fun=@(Y)mvnpdf(g(1:2,i+1),v_g(1:2,i),eta_g(1:2,1:2,i)./Y)*gampdf(Y,2*b+i-1,1
);
P_gt1_gt(i+1)=quad(fun,0,inf);
出错了
Error using ./
Matrix dimensions must agree.
可是单独的一个个函数运算都是对的
多谢先。 |
|
w*x 发帖数: 518 | 33 首先,你指的是order(次)而不是dimension(维)吧?维是由数据决定的,次是可选
的,比如线性(一次)、抛物线(二次)等等。
然后,次数越高肯定效果会越好,因为一次是二次的一个nested model (可以wiki一
下就明白了)。是不是值得用二次(换句话说,是不是增加的拟合效果值得多花两个系
数),可以采取F检验,也可以WIKI一下。 |
|
j***b 发帖数: 5901 | 34 我这个dell dimension 3000明显是有一个系统恢复盘的。
可能是我在装机的时候删除了一些应用程序。现在找不到
启动系统恢复的入口。有谁知道怎么弄么? |
|
h***e 发帖数: 296 | 35 【 以下文字转载自 Mathematics 讨论区 】
【 原文由 huige 所发表 】
我不知道中文名字是什么。
问题是这样,我有一个图形,现在需要计算fractal dimension.
我想了想,自己画方块,然后数数,几乎是不可能的事情。
google了一下,发现有一个软件是Mac的,
找到一个windows的,竟然要200dollors。
想请大家帮助找一个windows的软件,如果是Mac的free的,也行,
总归不能自己用手数。
谢谢了先 |
|
n**h 发帖数: 22 | 36 The Cramer-Wold theorem states that if every fixed linear combination of d
random variables converges to a normal distribution, then the d variables
jointly converges to a multivariate normal distribution. Does this theorem
hold when the dimension d goes to infinity? Thanks. |
|
n**h 发帖数: 22 | 37 The Cramer-Wold theorem states that if every fixed linear combination of d
random variables converges to a normal distribution, then the d variables
jointly converges to a multivariate normal distribution. Does this theorem
hold when the dimension d goes to infinity? Thanks. |
|
y***s 发帖数: 23 | 38 Cramer-wold only applies in finite dimension case.
We call a random variable X is Gaussian in a (infinite) Banach space
if f(X) is normal for all linear functionals. |
|
h*******7 发帖数: 1 | 39 Hi,
A recruiter from HD Dimension called me several time. Does any body know
this company? I remembered some posts gave negative comments on it. What is
its problem? Thanks! |
|
s******e 发帖数: 841 | 40 Can anybody recommend some good methods to do classification for high
dimension data, which might have relatively smaller prediction errors
compared with logistic regression
Thanks |
|
A*****s 发帖数: 13748 | 41 try PCA first to reduce dimension |
|
c*******n 发帖数: 718 | 42 PC analysis had nothing to do with classification.
Actually I can give an example where it screws up after PCA removes the more
importance dimensions (even though with smaller variation) |
|
o****o 发帖数: 8077 | 43 you are right
try some method based on canonical correlation measurements, such as PLS
for very high dimension classification, try some algorithm from Text Mining
literature
but I am not aware of any method that can beat logistic regression in erro
rate universally, it is really case dependent
more |
|
s******e 发帖数: 841 | 44 the misclassification rate of logistic regression is a little bit high, I
want to see if any other method can give a good result.
I have not tried k-NN, because of the high dimension |
|
s**5 发帖数: 68 | 45 小弟刚刚开始接触dimension reduction的项目,想了解下这个领域的应用面及前景如
何,谢谢! |
|
R********n 发帖数: 519 | 46 恩,Machine Learning里面non linear的方法基本上都会在某个步骤用到linear
method,这个没法避免。不过出发点还是non linear的
我觉得比如manifold dimension reduction,LLE,LLC, LTSA,Laplacian等,应该是
出发点就是non linear,但是中间都会用到linear的method |
|
g********r 发帖数: 8017 | 47 sufficient dimension reduction.就是Denis cook和他的一众弟子们积极研究的方向。
这种有response variable的降维似乎还是挺有可为的。 |
|
R********n 发帖数: 519 | 48 sufficient dimension reduction, got it, 去看看他们的paper
向。 |
|
s*******3 发帖数: 1172 | 49 各位大牛们,我不是学统计的,但是我马上要修一些统计的课,而且要用一些统计方法
在我的research里面。现在主要方向是fractal dimension的应用。但是没有太多基础
,实在是看着头大啊。请教一下有熟悉这方面的同学们,我应该怎么入手好呢?没有时
间从最基础看起,想边学边应用的。先谢谢大家了 |
|
n**h 发帖数: 22 | 50 The Cramer-Wold theorem states that if every fixed linear combination of d
random variables converges to a normal distribution, then the d variables
jointly converges to a multivariate normal distribution. Does this theorem
hold when the dimension d goes to infinity? Thanks. |
|