由买买提看人间百态

topics

全部话题 - 话题: pca
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
l*****i
发帖数: 20533
1
根据官方信息,这个野鸡法庭甚至也不能算国际常设仲裁院(PCA)自己的正式行为,
因为没有遵循其自身设立仲裁案的规则以及程序。只是PCA为了赚钱,把自己的场地借
用给这个草台班子唱戏,并提供秘书服务(处理文件以及发布之类)。至于这个草台班
子‘法庭’,它是由菲律宾和日本人柳井俊二共同凑出来的。这位柳井俊二自己是推动
日本解除安保条约的积极分子,唯一和这事搭上边的是他当时也已经是国际海洋法庭的
轮值庭长。但是这事没有在正式的国际海洋法庭上处理,而是弄这么个草台班子,这已
经很清楚的说明正经海洋法庭也绝不会听这个庭长个人瞎捣鼓的。
至于说PCA自己,根据其规则,提供arbitration服务的要求必须是争议双方共同书面要
求PCA来给他提供裁判意见。具体见下面引文。所以既然中国一开始就拒绝去掺和,这
个根本连PCA也不能提供仲裁意见。
总之,这就是一个草台的无以复加的野鸡‘法庭’,就跟你我在大街上拉几个人凑个‘
法庭’没两样。而PCA的角色就是为了赚钱违背自己的规则以及职业道德,把名义借给
这么个野鸡‘法庭’去发布信息。
(PCA)
Scope of Application
Article ... 阅读全帖
l*****i
发帖数: 20533
2
pca的确提供服务了,所以绝对是参与者。但是就如同我已经引用的,pca自己的组建仲
裁‘法庭’的规定是必须参与双方书面要求pca仲裁。这个显然不符合这次的情况。就
算是pca一些人与草台班子的合作吧,她也违反了pca明文规定。这不是说给他往外摘责
任,而是说就连pca本来具有的那么一点点历史严肃性这个草台‘法庭’也不具备。换
句话说pca就像莆田'老中医‘,至少是个'老’的懂一点点‘中医’皮毛的家伙吧?可
现在这个连这点都没有,纯粹莆田系再次外包给不知道什么人。low的不能再low。
t********i
发帖数: 7856
3
PCA的官网Case Repository里列出了这个案子,PCA Case No是2013-19:
https://pcacases.com/web/allcases/
http://www.pcacases.com/view/7
PCA Case No. 2013-19: The Republic of Philippines v. The People's Republic
of China
所以它是PCA自己的正式行为,不是野鸡草台班子租用PCA的场地。只不过PCA为了赚钱
,违背其自身设立的仲裁规则及程序,进行的违法仲裁。中国不接受不承认的做法是正
确的。
j****n
发帖数: 2
4
近期,我校电子工程学院获得Intel PCA大学教育计划资助。Intel公司此次邀请了国内
9所在IT领域有影响力的大学参与其PCA大学教育计划资助“投标”,总共收到10份建议
计划书,最终选择了3所大学进行重点支持,我校是其中之一。
今年六月份Intel公司在中国寻求在IT领域领先的大学开展PCA大学教育计划,电子
工程学院积极参与申报工作。学院组织相关人员,积极准备材料,充分展示学院在PCA技
术领域所取得的成果,制定了详细的课程建设计划。经过Intel专家对申报材料的最终评
审,取得了Intel PCA大学教育计划的资助。目前,电工学院已获赠首批仪器设备及现金
共计价值约4万美元。
PCA全称Personal Internet Client Architecture (个人互联网客户端体系结构)
,是Intel公司从以CPU为主转向兼备无线通讯领域战略下推广的新技术,它以Intel&ac
ute;Xscale低功耗、高集成度的PXA255CPU为基础,将接入互联网的多媒体、手持移动客
户端从体系结构上划分为三个主要子系统:通讯子系统、存储器子系统、应用子系统。
三个子系统完成相对
y***i
发帖数: 11639
5
我们有这样的老鼠的gene expression array 数据:
1. Control cell with geneA
2. Control cell knockout geneA
3. Tumor cell with geneA
4. Tumor cell knockout geneA
1~2 样本是配对的,3~4样本是配对的。第二张图的连线情况就是配对情况
PCA 的图和基因表达分析吻合的有两点:
1. control 和 tumor 基因表达pattern大不相同,基因分析结果也吻合:比较这两者
时有上千的基因显著的up or down regulated (比较红色和蓝色)
2. PCA 显示Normal sample中有无GeneA,基因表达变化不大。这个和array分析结果也
吻合。(比较红方块和红小球)
但有一点PCA 的图和基因表达分析不吻合:
1. PCA 显示 在tumor中有没有GeneA,表达pattern也应该有相当显著的区别,但我用
fold change>3; FDR<0.05的阈值算,只有58个基因有显著变化。(比较蓝方块和蓝小球)
奇怪的是当我把所... 阅读全帖
E**********e
发帖数: 1736
6
【 以下文字转载自 DataSciences 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: DataSciences
标 题: 有没有大牛来classifiy一下 PCA用法吗?
发信站: BBS 未名空间站 (Wed May 20 11:52:29 2015, 美东)
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysi... 阅读全帖
l*****i
发帖数: 20533
7
来自主题: Military版 - 中国应该要求PCA做程序性说明
哪怕PCA自己组建‘仲裁庭’的规则也是必须双方书面申请。所以这个并非PCA提供的仲
裁服务,而只是‘秘书服务’,也就是场地文书什么的。那几个人的‘法庭’压根没有
任何国际组织正式授过权组建,甚至也不符合PCA的规定。
其实中国既然有人参加PCA,应该要求PCA作进一步澄清,到底算不算他组建的正式‘仲
裁庭’?如果算,为何可以违背他自己的明文规定?
E**********e
发帖数: 1736
8
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
一下好像不能用来select significant variables。 谢谢。
欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。
E**********e
发帖数: 1736
9
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
一下好像不能用来select significant variables。 谢谢。
欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。
l*****i
发帖数: 20533
10
看来你被他搞混乱了。有几个机构的概念你得先弄清楚:
1.联合国的国际法庭(ICJ),这是联合国正式的法庭,判决有约束效力,具体有联合
国安理会负责执行。
2.常设仲裁法庭(PCA),这不是真正的法庭,只是一个国际机构,可以接受委托人的
要求进行调停或者国际法方面的咨询,服务对象包括国家,组织和个人都可以。中国的
确有人去参加这个组织,但也不过就是参与其法律服务而已。再说一遍,这不是法庭。
3.海洋公约法庭。这是基于海洋公约的法庭,负责解决公约成员间的纠纷。他有自己的
一套法官选举机制,共有20多位法官。目前的轮值庭长是那个日本人。但是这次的所谓
‘裁决’并非经由这个法庭。
4.所谓的‘南海仲裁法庭’。这是由那个日本人个人以及菲律宾方面挑选了5个人凑出
来的‘法庭’。他们购买了PCA的秘书类服务,并且租用了其场地,从而可以以PCA的名
义发布‘裁决’信息。此次的‘裁决’就是有这个草台班子发布。需要注意的是,由于
中国不同意参与这闹剧,所以这个也不符合PCA的组建仲裁庭规定。就只是一个彻头彻
尾的草台班子野鸡法院而已。
l*****i
发帖数: 20533
11
根据他自己的信息,pca有各种服务,仲裁只是一项。由于目前这个情况明显违背pca自
己组建‘仲裁庭’的程序,所以我不知道他到底是怎么个过程建立的。网上中国发言人
做出了解释,说只是相关草台班子购买了其秘书服务。我觉得这个很有可能。所以我标
题就是,那个草台班子‘可能连pca都不是’。
但整件事pca无疑是参与了。

发帖数: 1
12
来自主题: Military版 - PCA 仲裁院是一个包租机构
注意,是仲裁院。翻译成仲裁法院非常误导。这个院不产生法律意义上的裁决,其决议
non-binding. 这个大家都已经清楚了。其决议的影响可大可小,要看具体事例。这次
,由于西方一致反中,对中国的反感来了个小爆发,所以把中国恶心得不行。
这个PCA是个包租机构。如果某几个国家想要对某事做个裁决,怎么办,办法之一就是
找PCA。PCA临时组建一个针对那个问题的仲裁“法庭”。怎么组建由各国商定,也可由
某人某组织出面搞定。注意这个临时性和针对性。最关键的是各国都要参与,PCA 不能
进行缺席审判。
这次的“南海仲裁法庭”的组建由日本人负责,中国人并未参与也未同意。随后对中国
进行缺席审判,其决议就没有意义了。但他们按程序还是可以产生决议,那没问题,有
问题的是他们的credibility.
b*****o
发帖数: 817
13
来自主题: TexasHoldem版 - Play the 2012 PCA in The Bahamas!
anyone got this?
FYI.
Dear bdcinfo,
The PokerStars Caribbean Adventure (PCA) is the biggest
live poker event outside of the US, and it is back for 2012. The festival
runs from January 5-14 at the Atlantis Resort and Casino in The Bahamas with
a packed schedule of tournaments, including the Main Event, where millions
of dollars will be on the line.
You can buy-in to the Main Event, using any of these
methods: Wire transfer via your bank
C... 阅读全帖
w**********y
发帖数: 1691
14
来自主题: Quant版 - PCA and how to estimate sigmas
你这PCA做的不对吧?make sure一下,你的PCA=principal component analysis?
简单的讲,你有n(比如n=10)个随机变量X1,X2...,X10..或者它们的sample(x11,x12...,
x1m),(x21,x22...,x2m),...(x10,1,x10,2...,x10,m)
PCA做的事情是,比如找出r(比如,用来做volatility smile的常用r=3)个component,
which 能够最大化的描述原来的covariance.且这r个component mutually independent
.. 而每个component是原来的X1,...,X10的weighted sum.
那么,如果你的数据是10个股票500天的log return,那么你可以算出它们的sample
covariance matrix(10乘10的矩阵).然后用PCA..比如你前两个components能够足够解
释它们之间的variance covariance,那么你的r=2.
你的第一个component可能是sth like 0.42
s*********h
发帖数: 6288
15
不是大牛。我说说我的看法
PCA categorical 肯定没法直接用。
我觉得说PCA选variables的面试官自己也不太清楚吧?
PCA已经改变了所有的变量,不能叫“选”变量了。
减少线性相关的feature是正确的。
传统统计如果重视解释性的话,PCA的结果不好用,虽然可以在某些情况下勉强给
feature定义,感觉并不是通用的方法。
此外可以用information value来选categorical variables
还有random forest。
l*****i
发帖数: 20533
16
根据PCA这次的这么个无下限操作,只要有钱,随便什么人,包括这里的人,就可以这
样:以私人名义购买PCA的服务。同时凑一桌5个人成立一个'tribunal',并以个人名义
向日本政府申索钓鱼岛所有权提交给这个‘仲裁庭’。然后随便判一下,最后要求日本
政府接受这个‘判决’。PCA的服务就是把所有文件整的类似它的官方文件,并且负责
发布等事宜。
l*****i
发帖数: 20533
17
再强调一次:不管是根据海洋公约的规定还是甚至PCA内部规定,任何‘仲裁’都必须
是所涉双方都同意才能进行。具体参见海洋公约第298条以及上面给出的PCA自己的规定
。所以这个玩意一开始就注定不可能经由海洋法庭或者正式的PCA进行仲裁。这也是为
什么这帮逗b不得不另组一个彻底的草台班子的原因。
l*****i
发帖数: 20533
18
根据联合国国际法庭的澄清内容,PCA只是提供了秘书服务,而并非仲裁服务。当然提
供服务就是合作,尤其秘书服务可能需要包括文件存档备案发布等,有个编号并不奇怪
吧。
按字面理解,两种服务的区别在于,秘书服务就是当个秘书,其他的恐怕就不管了。而
仲裁服务至少还是PCA根据其自身规定负责建立仲裁‘法庭’,但那个需要双方书面同
意,至少其规定如此。
PCA已经不是法庭,再连建立这五个人的班子他都不管,那这个草台班子区别于你我他
的法理依据到底从何而来?我现在就是这个疑问。
a*****9
发帖数: 372
19
来自主题: Military版 - 中国应该要求PCA做程序性说明
你就是个二百五, 到现在还提 PCA, 这次仲裁和PCA 没有关系, 你懂吗?
不懂,就滚回家去。
发信人: laoafei (afei), 信区: Military
标 题: Re: 中国应该要求PCA做程序性说明
发信站: BBS 未名空间站 (Wed Jul 13 23:19:23 2016, 美东)
没有干货的话,轮子就不要来纠缠了,好么?你回家转法轮不是更有效么?你这个智商
就算我想教都教不明白,我实在没办法。
【 在 addadd9 (haha9) 的大作中提到: 】
B**********g
发帖数: 498
20
C.H. Tung. Forbes: China Wants To Peacefully Settle Maritime Territorial
Disputes.
http://www.forbes.com/sites/realspin/2016/07/16/china-wants-to-peacefully-settle-maritime-territorial-disputes/#21870a771bf2
PCA是个流氓破产组织。这次确实阴了我土共一把。如果我是中央当事的,一定狠狠告
倒PCA和搞臭那五个法官。 那怕比菲利宾多花2倍的律师费也要他们赔偿对中国的名誉
损失。老百姓也会赞成。
赞老董的文笔,不愧为前特首和港科大的前董事会主席。
m****s
发帖数: 402
21
来自主题: CS版 - 请教Kernel PCA
有点糊涂,如果有PCA程序,
W=PCA(X)
如果用KPCA,是不是就是W=PCA(F(X))?如果用Gaussian Kernel,怎么处理F(X)?
x******a
发帖数: 6336
22
来自主题: Programming版 - Re: 请教一个pca的问题 (转载)
【 以下文字转载自 Statistics 讨论区 】
发信人: xiaojiya (xiaojiya), 信区: Statistics
标 题: Re: 请教一个pca的问题
发信站: BBS 未名空间站 (Fri Jul 25 13:29:01 2014, 美东)
thanks, that is what I think. however, I tried the python package sklearn
and statsmodels.sandbox.tools.pca, I got the following result that I don't
understand.
---sklearn-----
pca3.explained_variance_
Out[1001]:
array([ 1.78290607, 1.08429872, 0.42104483, 0.31175038])
---------------
The eigenvalues by statsmodels.sandbox.tools.pca are
array([ 1.98100675, 1.... 阅读全帖
s********k
发帖数: 6180
23
PCA本来用在高纬度到低纬度的的投射吧,现在用autoencoder也可以吧而且做得更好,
比PCA或者kernel PCA好?
B******a
发帖数: 61
24
来自主题: Quant版 - Matlab PCA 问题请教
请问一下Matlab 专家:
coeff = pca(X)
这里coeff 是
PCA= coeff * X
还是 X = coeff * PCA
X is input data
o****o
发帖数: 8077
25
来自主题: Statistics版 - 请问哪里有PCA的SAS code 啊
what do u want to do with PCA?
PROC PRINCOMP for PCA
PROC PLS for PCA REGRESSION
z*****n
发帖数: 413
26
来自主题: Statistics版 - PCA and linear regression
I don't think there is specific relationship between PCA and regression.
But covariates of regression can be replaced by PCs, if the X matrix has
strong colinearity. Or PCA is a good way to reduce the number of covariates.
I doubt the meaning of what LOUzhu did. For y=mu + b * x, b can be treated
as a scale of the x vector in the n-space. The first component of x,y should
be vector x+y, and this is non-sense if you haven't standardized your data
before PCA.
E**********e
发帖数: 1736
27
来自主题: Statistics版 - PCA拟合问题
pca用来降维, 但是pca也可以用做regression啊。 你可以plot scree。 选top N个新
变量其中eigen value(或variance) 之和比上所有eigen value 之和大于一个设定值
,比如95%。 那么这95%包含的top N个新变量就可以用来做regression。 余下的5% 的
变量其实对model 贡献就很小或者可以忽略了。如果你要是光想选features的话,
pca是不适合的。
那这样的话, 可以用 stepwise, forward, backward, univariate screeing, 还
有一些像, k-neighbor local search, annealing, genitic 算法是么的。
b******x
发帖数: 826
28
covariance is the solution of PCA, not the motivation of PCA
the motivation is a low-rank matrix factorization
when the approximation error is measured in squared errors we get back PCA
other approximation error can be used for categorical variables
E**********e
发帖数: 1736
29
我的问题是用pca 来选signifiant variabales。 好像还没看到pca可以适合
categorial variables的。 昨天问了老师,答案也是negative, 倒是提了
correspondse analysis。 不过不是用来variables selections的。
比如一个binary variable(0,1), 难道可以用PCA来算它的variance的大小, 从而
确定看在total variance占的比例大小决定保留还是剔除。
我的一个想法是把categorial 和continouous 分开, 分开分析从而确定significant
varialbes

interpret
k*****n
发帖数: 361
30
面试官并没有问你pca能不能用在categorical data上面,但是他说的pca方法用于选
variables是对的,因为pca的用途就是reduce dimension by reduce
multicollinearity variables,其实和stepwise variables selection一个道理
l*****i
发帖数: 20533
31
你又在混淆。他是真正海洋法庭的现任庭长没错。但是目前这个所谓裁决根本不是经由
海洋法庭作出的,而是他个人另外找人组一个野鸡班子租用PCA的服务搞的。说到底他
的海洋法庭庭长身份在这里除了宣传效应根本毫无实际意义。而这个野鸡班子本身完全
没有任何国际法背景,甚至都不符合PCA的内部规定,根本就是利用名字故意误导从而
诈骗。
你如果不是故意混淆,那么请你自己先把对这件事来龙去脉已有的解释看清楚再说。你
如果发现了不同的证据你可以提。但如果毫无实据只是一味纠缠不清,那我只能怀疑你
另有什么任务在身。
f****e
发帖数: 24964
32
根据联合国海洋法公约 287(1), 缔约国可以选择以下任一方法解决争端:国际海洋法
法庭,国际法院,或仲裁法庭。仲裁法庭和国际海洋法法庭,国际法院具有相同权威性
PCA是海牙公约仲裁法庭组织和支持机构,这次只是为海洋法公约南海仲裁法庭提供管
理服务
PCA的仲裁员名单是海牙公约缔约国提名,海洋法公约仲裁法庭仲裁员是由联合国海洋
法公约缔约国提名,名单由联合国秘书长编制并保持
5人仲裁庭有4个是国际海洋法法庭的现任或前任法官,那个加纳仲裁长更是首任
president
f****e
发帖数: 24964
33
The PCA is not a court, but rather an organiser of arbitral tribunals to
resolve conflicts between member states.
PCA是海牙公约仲裁法庭组织和支持机构,这次只是为海洋法公约南海仲裁法庭提供管
理服务
n***y
发帖数: 2730
34
给小将们大致讲一下Chagos Archipelago的主权问题。英国对该群岛的主权是基于1830
年左右的一场仗,老阴把老法赶走了,老法签字同意的,而老法是第一个宣示自己主权
的西方国家,大约在大清国成立的时候。当时英国获得的主权也包括现在的毛里球丝。
六十年代毛里求斯独立前夕,英国就Chagos Archipelago的问题和准备独立的毛人进行
过长时间谈判,后来英国承诺了一笔钱,毛人独立了,没要Chagos。当时Chagos的居民
可以选择去英国或者去当毛人,大部分去了英国。这样独立后,Chagos继续归英国。
再后来联合国说分裂前殖民地不道德,要归还就得成立一个国,于是毛人以此为依据和
阴人就主权问题再吵,英国的态度是主权现在是我的,如果以后没有defense需要可以
考虑归还。
至于PCA的MPA裁决是另一回事。2010年左右,左逼影响阴人,要搞环保,英人就搞了个
MPA,结果毛人不干了,官司打到PCA,闹出一个楼主小将的结果。
阴毛的问题和南海问题最大的问题是老中拿不出像样的证据来证明那些岛属于中国。
a********9
发帖数: 3813
35
MPA裁决,大家都遵守啊。
至于Chagos Archipelago主权问题, 和这个裁决屁关系都没有。
小将连这个都搞不清楚。
发信人: xwzxjhq (谁的帝), 信区: Military
标 题: Re: 尼玛,美军的迪戈加西亚基地也被PCA仲裁,美军直接当废纸
发信站: BBS 未名空间站 (Sun Jul 17 10:23:20 2016, 美东)
我帝有没有将这个PCA的仲裁当废纸?
【 在 njguy (牛姐吸的男人) 的大作中提到: 】
1830
: 年左右的一场仗,老阴把老法赶走了,老法签字同意的,而老法是第一个宣示自己
主权
a********9
发帖数: 3813
36
小太监回家找你妈吧。
发信人: neohawk (neohawk), 信区: Military
标 题: Re: 尼玛,美军的迪戈加西亚基地也被PCA仲裁,美军直接当废纸
发信站: BBS 未名空间站 (Sun Jul 17 16:47:35 2016, 美东)
addadd黄皮狗快去,你白大爷赏你泡屎吃。
【 在 addadd9999 (haha99) 的大作中提到: 】
: 标 题: Re: 尼玛,美军的迪戈加西亚基地也被PCA仲裁,美军直接当废纸
: 矫情的老将,口口声声人民人民。南海拓展疆土不是为了你口中的人民吗。老将反
共没
s********k
发帖数: 6180
37
auto encoder能比PCA更好的映射到embedding space,是不是单纯的PCA没啥用处了?
除非及其简单的数据集
l*******m
发帖数: 1096
38
pca 只能dense to dense. 在sparse to dense 的情况下,本来就没pca什么事
c****r
发帖数: 576
39
我觉得你的问题不难,但描述却不太清晰:
1. 总共多少基因?
2. 对于每个基因,你有4个样本,那么每个样本有多少测量值?是重复测量还是时间序
列?
3. 你具体怎么做PCA的?PCA测的是所有样本之间的变化,不是两两比较。
4. fold change是哪两个样本之间的差值?是用平均值还是中位值算的?
5. 把多个样本放一起,怎样判定基因显著变化?相对于谁变化?
6. 阈值是什么,fold change?
BTW,这是什么软件做的图?
k*****2
发帖数: 135
40
来自主题: Biology版 - PCA explained variance 太低怎么办?
random feature是说如果你random shuffle你的treatment(没有给出任何信息),重
新做PCA,你的结果是否会显著变差。
除了PCA,你可以试试其他classification方法(比如SVM,RF),用cross validation
看看谁的cross validation error比较低就选谁。
我也只是上过相关课程、做过课程项目的水平,如果哪里讲的没道理,还请包涵啦~
s******s
发帖数: 13035
41
来自主题: Biology版 - t-SNE和PCA哪个好?为什么?
这个完全两种东西。PCA是linear transformation, 如果plot出来
两个点之间的相似程度和他们的距离相关。t-SNE主要是为了低维
可视化设计的,做cluster一般比PCA漂亮多了,但是除非两个点
很近,否则你没法根据距离做啥可靠的结论。
c********e
发帖数: 598
42
来自主题: Biology版 - t-SNE和PCA哪个好?为什么?

pca?两个点之间的相似程度和他们的距离相关?? Not always.
PCA subspace is to maximize the retained sample variance, rather than
keeping
similarity.
s******s
发帖数: 13035
43
来自主题: Biology版 - t-SNE和PCA哪个好?为什么?
PCA retains similarity in terms of distance
tSNE retains similarity in terms of probability
我已经说了,distance matrix做eigenanalysis, distance当然相关,和你
说retain variance并不是非此即彼的关系
至于similarity还是dissimilarity, PCA里面叫similarity matrix, PCoA里面叫
dissimilarity matrix, 叫法不一样而已。
c********e
发帖数: 598
44
来自主题: Biology版 - t-SNE和PCA哪个好?为什么?
Firstly,tSNE probability is calculated based on the euclidean distance.
Secondly, for biological data, retain sample variance does not mean '
naturally capture'. You have to assume linear structure, eigenvalues are
actually inflated loadings, a modern version probabilistic PCA might be
better (to solve contaminated error variance).
Thirdly, PCA is not able to directly measure true relationship of high
dimensional data without helping with other ML technique.
j*****n
发帖数: 1545
45
来自主题: Computation版 - 高维 PCA
有一个向量是1200维的,有10个data。 怎么做PCA啊? 维数我觉得太高了。
看见有个人是这样做的, 本来是x*x',他用的是x'*x,这样的自相关矩阵只有10×10
维的,用这个去做 PCA, 得到的10*1的eigen_vector再用x去乘,又得到一个1200×1的
玩意。
这样有道理吗?eigenvalue最多就10个,很奇怪。
r****y
发帖数: 1437
46
来自主题: Computation版 - 高维 PCA
PCA can be done to either dimension.
In your case, because you only have 10 data points, so
all trash for eigen values lower than the 10th one.
In another word, only 10-dimension is need to span your space
1200 is nothing. It seems you have not get the essence of PCA.

10
j*****n
发帖数: 1545
47
来自主题: Computation版 - 高维 PCA
昨天研究了一下PCA.
10维并不能把不在这10个data里面的一个1200维的data表达出来啊。
eigenvector 应该是1200维的,两种方法的主要的10个eigenvalue是一样的.rank是10
,但是那个10维的eigenvector要通过某种变换(乘一个什么)得到正确的1200的
eigenvector.
我现在的问题是 我有一个1200维的数据 要投影到这个PCA上面去。如果只用10个
eigenvalue的话,投影之后再重建和原是数据差别太大。 如果用1200维的eigenvalue
就能投影之后正确的重建。 就是维数太高了。
c******x
发帖数: 350
48
来自主题: Mathematics版 - PCA 分析请教 (转载)
【 以下文字转载自 Statistics 讨论区 】
发信人: cassimox (cassimox), 信区: Statistics
标 题: PCA 分析请教
发信站: BBS 未名空间站 (Mon Feb 24 20:06:06 2014, 美东)
假设x1,x2联合高斯分布,有cov为:[1 x;x 2]。x为非零。
现在我想把x1和x2表达为:
x1=a11*G1 + a12*G2
x2=a21*G1 + a22*G2
G1和G2为独立的两个单变量高斯分布。
不知道如何从PCA分析得到4个a系数,以及这两个高斯分布。
多谢。
n*********3
发帖数: 21
49
来自主题: Quant版 - PCA and how to estimate sigmas
You are given data for 10 different columns and 501 days (say 501*10
array). It is assumed that the prices satisfy the model:
dS_k =\SUM_{j=1}^r\sigma_(kj)dW_j k = 1, . . . , 10
where {W_j(t)} are independent Brownian motions. The number r is unknown a
priori. Using PCA method in MATLAB determine r and estimate the
coefficients {\sigma_(kj)}.
From PCA, now I have got r = 2. hence:
dS_k = \sigma_{k1}dW_1 + \sigma_{k2}dW_2, k=1,2,...10
How can I proceed to estimate the sigmas...
h******a
发帖数: 198
50
来自主题: Statistics版 - 请教PCA
R里PCA的命令是princomp(data, cor=TRUE)。cor=TRUE是用correlation matrix来做
PCA。问题是,我用princomp(data, cor=TRUE)$score得到的principal component和自
己算的差的有点远。不知道哪里错了?附件是data
我自己是这样算的:
data是1256 x 8的matrix,一行是一个observation。用eigen()函数算data的
correlation matrix的单位化正交特征向量,每一列是一个特征向量,按特征值大小排
好序。最后用data * eigen,理论上也应该是component。
code:
score<-princomp(data,cor=TRUE)$scores
cor_pca<-cor(data)
score1<-data%*%eigen(cor_pca)$vectors
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)