|
l******n 发帖数: 1683 | 2 不是一个东东呀, 虽然有点关联. 正好手上有个二代的i3-2120, 浮点峰值是: 3.3 x 8
x 2 = 52.8Gflops, 实际结果贴一部分吧. 对应的i7 920浮点峰值只不过: 2.6 x 4 x
4=41.6Glops而已.
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
1000 1000 4 0.049 13.6485 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.0284 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.034 19.7985 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.2894 1.029343e-12 3.510325e-02 pass
2000 ... 阅读全帖 |
|
s****y 发帖数: 503 | 3
LDA
多谢wdong,码了这么多字。
topic model应该怎么学?可以看哪些东西? |
|
z****e 发帖数: 54598 | 4 利益驱使,工业界有对学术界成果的需求
同样,学术界也需要工业界的funding
能做到这个才是一个国家一个地区兴旺之所在
早日跟工业界主流接轨是王道
ml之后的市场大有可为,大大大有可为
远不是今天所能够想象的,以后再砸出一片天地来很有可能
到时候scala会批量输出学术成果到jvm上去
其实你现在就可以开始做
你看你说的那个lda就可以想办法基于spark上实现 |
|
z****e 发帖数: 54598 | 5 你真无聊,wdong啊
其他人在datasciences发的那篇clustering的论文我看spark上mllib还没有实现
现在mllib只有最简单的k means
你可以考虑一下做出来嘛
青史留名的东西哦
比你在这里灌这种算术的废水那是要强太多了
那篇论文你应该能看到,你的大学应该会帮你
实在看不到,我可以发给你
还有plsi和lda也都没实现
bm25也没看到 |
|
w***g 发帖数: 5958 | 6 别人写open source都有公司/学校在背后发工资,我又没拿钱瞎掺和什么。
等着用免费的轮子才是王道。我劳动力贱,implement这个东西也得收$10k吧,不然你
问问goodbug他会不会干。
pLSA和LDA需要用gibbs sampling/variational method实现,目前并行化的方法
是用mini batch。问题是batch一大收敛速度就会下降,而batch不大的话又没发发挥
并行计算的优势。我觉得spark上那个SGD可能都挺勉强的。 |
|
d******e 发帖数: 2265 | 7 什么情况啊。二爷说说,go有这么强?都可以做矩阵什么的了? |
|
|
|
|
|
|
|
|
d*******r 发帖数: 3299 | 15 我觉得 concurrency 和 parallelism 强相关呀 |
|
|
N*****m 发帖数: 42603 | 17 比速度应该比不上C++,不过写起来方便;JVM么,显然parallelism不如Go么 |
|
l*******m 发帖数: 1096 | 18 这个不是真正的矩阵计算,只是用矩阵表示。而且是稀疏的。简单说就是不需要矩阵库 |
|
l*******m 发帖数: 1096 | 19 内幕是project lead以前业余时间用go写了个开源,现在的就是基于这个的,当然他把
github的删掉了。没啥选择的问题 |
|
|
|
l****r 发帖数: 119 | 22 我是EE转码的,去年毕业,公司码农的工作没找到,在一个医院做了半年(号称研究机
器学习)的博后(工资低),说说感受:
能接触真实的医疗数据,数据库里有病人就诊记录包括吃的药和化验指标,但是数据比
较乱也很深奥,没有医疗行业知识,不懂药名和化验指标是什么意思,现学的话总觉得
差好远。所以,老板说让做什么就做什么。主要用python,pandas,sklearn,某些问
题用R做。研究的问题感觉都比较trivial。感觉都不是真正的机器学习,是简单的算数
分析。问题的定义也不是特别清楚。
还做了几个NLP的小project,论文的聚类,涉及到:
web scraping, 把论文从网上扒下来,用python beautiful soup, asyncio
feature 提取:用一个Medical Text Indexer (MTI)的网络API,把医学论文的关键字
找出来
machine learning算法: 用了LDA和k-means,都是调用sklearn库
pandas用的还挺熟的,各种groupby,apply。但去看job description,好多都要求会
tensorf... 阅读全帖 |
|
h*******o 发帖数: 4884 | 23 最近作了一些Taqman的Low Density Array (LDA), 老板要cluster analysis
Array 小白,只会用data analysis assist那个软件, 里面有2个 选项,
一个是Pearson's Correlation 一个是 Euclidean Distance。
哪位大侠能深入浅出的给讲讲,有什么区别?
如果我相比较组间gene expression区别有多大,是不是用Euclidean Distance 比较好?
谢谢! |
|
m*******7 发帖数: 28 | 24 谢谢:)
这东西沉在瓶底,不像是液体,针筒不好抽吧。
我以前也是用丁基锂和二异丙基胺反应现场制的。现在手上刚好有这个现成的,想先问
一下大家这个该怎么操作的。
google |
|
p****e 发帖数: 254 | 25 我以前用过买来的那种,效果不怎么好。还不如自己制的。 |
|
j*********5 发帖数: 6221 | 26 淡黄色,有时候有点浅浅的橙色
深红色肯定不行了,
一般要自己制备吧, |
|
|
s********g 发帖数: 252 | 28 Oh, God
看来我做实验太tough了
呵呵
谢谢
黄。 |
|
s*******h 发帖数: 3731 | 29 介个属于基本技能。。。。
不用谢,我给你发invoice,咨询费20刀。。请打到我paypal账户。。多谢。 |
|
|
|
j*********5 发帖数: 6221 | 32 If lz is lazy, amine is not necessary to distill,
add a little bit overdose of BuLi could kill the water residue.
BuLi titration is complicated, I prefer to buy a new bottle if your boss is
rich.
黄。 |
|
s*******h 发帖数: 3731 | 33 小孩子不懂别瞎说。。。滴定挺容易的。。开瓶滴一次,封好了放冰箱,几周内不用重
滴。。。最简单的用二苯基乙酸。。。
is |
|
m****c 发帖数: 2416 | 34 我记得我第一次用nBuLi做定量反应的时候看了文献打算滴定。。
结果当时问了一圈全有一个人滴定过的,都说差不多直接用吧。。。我当时比较寒。。
不过后来倒是来了很多会经常滴定的特别仔细的同行。。。 |
|
e****2 发帖数: 2723 | 35 旁边位置上连接的是氧原子, 不可能形另外的ENOLATE,只是你的保护集团是否能忍受
LDA不水解? |
|
F****I 发帖数: 270 | 36 "Becke suggested coefficients
a_0 = 0.2, a_x, = 0.72, and a_c, = 0.81
...
The Becke3LYP functional in Gaussian 92 uses the
values of a_0, a_x, and a_c, suggested by Becke but uses LYP for
the correlation functional."
P. J. Stephens, F. J. Devlin, C. F. Chabalowski, M. J. Frisch
J. Phys. Chem., 1994, 98 (45), pp 11623–11627
核对一下Gaussian网站上的参数
http://www.gaussian.com/g_tech/g_ur/k_dft.htm
****************
User-Defined Models. Gaussian 09 can use any model of the general form:
P2EXHF + P1(P4EXS... 阅读全帖 |
|
h*****y 发帖数: 298 | 37 DFT已经是凝聚态物理里研究材料的标准工具了。model hamitonian最后不回到数值解
的有几个?现在计算机的计算能力越来越强,不管凝聚态还是化学,ab initio是个趋
势。强关联问题现在DFT还不能完全处理,这反过来也说明这个领域大有可为。DMFT, G
-W, S-B这些都是可以继续完善的方案。得到精确ec也不是完全没有办法,LDA方案中的
ec参数就可以用QMC算出来。回头说说传统理论物理,现在的趋势是数学越来越fancy,
但是在问题的实质上并没有新的突破。一个例子就是 ferroelectricity,多少年了都是
Ginzburg–Landau theory,DFT一下子就把认识推进到了微观层次。不管物理还是化学
,理论还是计算,只要有新见解,就是好的研究,只是打着纯理论的幌子,即使方法再
高深,数学推导再繁琐,也是不可取的。
50
correlation |
|
C**R 发帖数: 1047 | 38 “得到精确ec也不是完全没有办法,LDA方案中的
ec参数就可以用QMC算出来。”
一看这句就知道你是半壶水。
G |
|
C**R 发帖数: 1047 | 39 首先
Accurate quantum Monte Carlo (QMC) simulations for the energy of the HEG
have been performed for several intermediate values of the density, in turn
providing accurate values of the correlation energy density.[3]
Vosko-Wilk-Nusair (VWN) [4]
Perdew-Zunger (PZ81) [5]
Cole-Perdew (CP) [6]
Perdew-Wang (PW92) [7]
HEG就是homogeneous electron gas,现在绝大多数functional都是基于这个
approximation的,问题就是这个HEG approximation很难进一步有突破(因为qmc实在
是太慢了),所以你说的那个什么精确Eex,就是你不懂。
在问你个我知道答案问题,为什么QMC算Cuprates... 阅读全帖 |
|
p****g 发帖数: 70 | 40 就是先上2eq的LDA 先deprotonation pyrrole N-H 和ester的α位H,
然后上1eq的alkylation 试剂,alkylation ester的α位。
文献上报道的产率都挺高70-80%的,怎么自己做总是不超过50%。
请有做过这类反应的人指点一下。 |
|
s*******h 发帖数: 3731 | 41 你LDA自己做的?你丁基锂滴定了?你用重水quench dianion了吗?能拿到啥? |
|
p****g 发帖数: 70 | 42 LDA买的,我用薄荷醇滴定过的。
没有用重水quench过,不过这是个好方法。
反应后主要是原料没有反应完,但是如果反应温度高的话,选择性很差,会到N上去。 |
|
s*******h 发帖数: 3731 | 43 买来的LDA一般来说,用不了两次就挂了。。
自己做吧。。另外quench一下中间体看看拔氢拔的怎么样。。
如果回收的就是原料,估计就是拔氢不彻底或者是底物反应比较慢。。。 |
|
|
p****g 发帖数: 70 | 45 算了,还是上teflon或者stainless steel了.更robust一些. |
|
|
|
|
z*****o 发帖数: 5758 | 49 超工你可以出书了,关于常用试剂的制备流程什么的
UCLA |
|
s*******h 发帖数: 3731 | 50 我操,又被打脸了。。。。这耳光打在千老我的脸上是啪啪响。。。。 |
|