第3页 - 关于lda的讨论汇总 - 话题女王

s*******n
发帖数: 38

在做PCA+LDA的飘过。。。

l******n
发帖数: 1683

不是一个东东呀, 虽然有点关联. 正好手上有个二代的i3-2120, 浮点峰值是: 3.3 x 8
x 2 = 52.8Gflops, 实际结果贴一部分吧. 对应的i7 920浮点峰值只不过: 2.6 x 4 x
4=41.6Glops而已.
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
1000 1000 4 0.049 13.6485 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.0284 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.034 19.7985 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.2894 1.029343e-12 3.510325e-02 pass
2000 ... 阅读全帖

s****y
发帖数: 503

来自主题: Programming版 - NLP是使用什么技术或框架实现的？

LDA
多谢wdong，码了这么多字。
topic model应该怎么学？可以看哪些东西？

z****e
发帖数: 54598

来自主题: Programming版 - 分析一下scala为什么能拿到funding吧

利益驱使，工业界有对学术界成果的需求
同样，学术界也需要工业界的funding
能做到这个才是一个国家一个地区兴旺之所在
早日跟工业界主流接轨是王道
ml之后的市场大有可为，大大大有可为
远不是今天所能够想象的，以后再砸出一片天地来很有可能
到时候scala会批量输出学术成果到jvm上去
其实你现在就可以开始做
你看你说的那个lda就可以想办法基于spark上实现

z****e
发帖数: 54598

来自主题: Programming版 - 已经全上内存了，还要40多秒啊

你真无聊，wdong啊
其他人在datasciences发的那篇clustering的论文我看spark上mllib还没有实现
现在mllib只有最简单的k means
你可以考虑一下做出来嘛
青史留名的东西哦
比你在这里灌这种算术的废水那是要强太多了
那篇论文你应该能看到，你的大学应该会帮你
实在看不到，我可以发给你
还有plsi和lda也都没实现
bm25也没看到

w***g
发帖数: 5958

来自主题: Programming版 - 已经全上内存了，还要40多秒啊

别人写open source都有公司/学校在背后发工资，我又没拿钱瞎掺和什么。
等着用免费的轮子才是王道。我劳动力贱，implement这个东西也得收$10k吧，不然你
问问goodbug他会不会干。
pLSA和LDA需要用gibbs sampling/variational method实现，目前并行化的方法
是用mini batch。问题是batch一大收敛速度就会下降，而batch不大的话又没发发挥
并行计算的优势。我觉得spark上那个SGD可能都挺勉强的。

d******e
发帖数: 2265

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

什么情况啊。二爷说说，go有这么强？都可以做矩阵什么的了？

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

link?

d******e
发帖数: 2265

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

http://flickering.qiniudn.com/%E5%A4%A7%E8%A7%84%E6%A8%A1%E4%B8
seach 大规模主题模型建模及其在腾讯业务中的应用.
page 18.

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

不错，看来我在本版推荐的几个都还很准

p*****2
发帖数: 21240

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

这东西我不在行
看了一下也没有说为什么用go

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

感觉主要是parallelism

p*****2
发帖数: 21240

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

这个go有什么优势吗？

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

跟谁比？

d*******r
发帖数: 3299

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

我觉得 concurrency 和 parallelism 强相关呀

p*****2
发帖数: 21240

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

比如JVM，C++

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

比速度应该比不上C++，不过写起来方便；JVM么，显然parallelism不如Go么

l*******m
发帖数: 1096

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

这个不是真正的矩阵计算，只是用矩阵表示。而且是稀疏的。简单说就是不需要矩阵库

l*******m
发帖数: 1096

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

内幕是project lead以前业余时间用go写了个开源，现在的就是基于这个的，当然他把
github的删掉了。没啥选择的问题

N*****m
发帖数: 42603

来自主题: Programming版 - 昨天看slides,腾讯用go lang做LDA

分特

s********k
发帖数: 6180

来自主题: Programming版 - 被docker气死了

LDA不就是研究long tail的工具？

l****r
发帖数: 119

来自主题: Programming版 - 离成功转码还有多远？

我是EE转码的，去年毕业，公司码农的工作没找到，在一个医院做了半年（号称研究机
器学习）的博后（工资低），说说感受：
能接触真实的医疗数据，数据库里有病人就诊记录包括吃的药和化验指标，但是数据比
较乱也很深奥，没有医疗行业知识，不懂药名和化验指标是什么意思，现学的话总觉得
差好远。所以，老板说让做什么就做什么。主要用python，pandas，sklearn，某些问
题用R做。研究的问题感觉都比较trivial。感觉都不是真正的机器学习，是简单的算数
分析。问题的定义也不是特别清楚。
还做了几个NLP的小project，论文的聚类，涉及到：
web scraping, 把论文从网上扒下来，用python beautiful soup, asyncio
feature 提取：用一个Medical Text Indexer (MTI)的网络API，把医学论文的关键字
找出来
machine learning算法: 用了LDA和k-means，都是调用sklearn库
pandas用的还挺熟的，各种groupby，apply。但去看job description，好多都要求会
tensorf... 阅读全帖

h*******o
发帖数: 4884

来自主题: Biology版 - 作array cluster analysis的时候用Pearson correlation和Euclidean Distance有什么区别？

最近作了一些Taqman的Low Density Array (LDA), 老板要cluster analysis
Array 小白，只会用data analysis assist那个软件, 里面有2个选项，
一个是Pearson's Correlation 一个是 Euclidean Distance。
哪位大侠能深入浅出的给讲讲，有什么区别？
如果我相比较组间gene expression区别有多大，是不是用Euclidean Distance 比较好？
谢谢！

m*******7
发帖数: 28

来自主题: Chemistry版 - 请教 LDA（Lithium diisopropylamide）使用问题

谢谢：）
这东西沉在瓶底，不像是液体，针筒不好抽吧。
我以前也是用丁基锂和二异丙基胺反应现场制的。现在手上刚好有这个现成的，想先问
一下大家这个该怎么操作的。

google

p****e
发帖数: 254

来自主题: Chemistry版 - 请教 LDA（Lithium diisopropylamide）使用问题

我以前用过买来的那种，效果不怎么好。还不如自己制的。

j*********5
发帖数: 6221

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

淡黄色，有时候有点浅浅的橙色
深红色肯定不行了，
一般要自己制备吧，

s*******h
发帖数: 3731

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

赞牛人。。。。。。。。。。。

s********g
发帖数: 252

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

Oh， God
看来我做实验太tough了
呵呵
谢谢

黄。

s*******h
发帖数: 3731

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

介个属于基本技能。。。。
不用谢，我给你发invoice，咨询费20刀。。请打到我paypal账户。。多谢。

s********g
发帖数: 252

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

届不抢钱了麻
那个麻吧，打个则

j*********5
发帖数: 6221

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

bang zhu bu hou dao!!!

j*********5
发帖数: 6221

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

If lz is lazy, amine is not necessary to distill,
add a little bit overdose of BuLi could kill the water residue.
BuLi titration is complicated, I prefer to buy a new bottle if your boss is
rich.

黄。

s*******h
发帖数: 3731

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

小孩子不懂别瞎说。。。滴定挺容易的。。开瓶滴一次，封好了放冰箱，几周内不用重
滴。。。最简单的用二苯基乙酸。。。

is

m****c
发帖数: 2416

来自主题: Chemistry版 - 请教,LDA应该是什么颜色的阿?

我记得我第一次用nBuLi做定量反应的时候看了文献打算滴定。。
结果当时问了一圈全有一个人滴定过的，都说差不多直接用吧。。。我当时比较寒。。
不过后来倒是来了很多会经常滴定的特别仔细的同行。。。

e****2
发帖数: 2723

来自主题: Chemistry版 - 合成求助

旁边位置上连接的是氧原子，不可能形另外的ENOLATE，只是你的保护集团是否能忍受
LDA不水解？

F****I
发帖数: 270

来自主题: Chemistry版 - 为什么量子化学的大部分进展都是数学和物理背景的人做的？

"Becke suggested coefficients
a_0 = 0.2, a_x, = 0.72, and a_c, = 0.81
...
The Becke3LYP functional in Gaussian 92 uses the
values of a_0, a_x, and a_c, suggested by Becke but uses LYP for
the correlation functional."
P. J. Stephens, F. J. Devlin, C. F. Chabalowski, M. J. Frisch
J. Phys. Chem., 1994, 98 (45), pp 11623–11627
核对一下Gaussian网站上的参数
http://www.gaussian.com/g_tech/g_ur/k_dft.htm
****************
User-Defined Models. Gaussian 09 can use any model of the general form:
P2EXHF + P1(P4EXS... 阅读全帖

h*****y
发帖数: 298

来自主题: Chemistry版 - 量子化学已经接近完全死亡了

DFT已经是凝聚态物理里研究材料的标准工具了。model hamitonian最后不回到数值解
的有几个？现在计算机的计算能力越来越强，不管凝聚态还是化学，ab initio是个趋
势。强关联问题现在DFT还不能完全处理，这反过来也说明这个领域大有可为。DMFT, G
-W, S-B这些都是可以继续完善的方案。得到精确ec也不是完全没有办法，LDA方案中的
ec参数就可以用QMC算出来。回头说说传统理论物理，现在的趋势是数学越来越fancy,
但是在问题的实质上并没有新的突破。一个例子就是 ferroelectricity,多少年了都是
Ginzburg–Landau theory，DFT一下子就把认识推进到了微观层次。不管物理还是化学
，理论还是计算，只要有新见解，就是好的研究，只是打着纯理论的幌子，即使方法再
高深，数学推导再繁琐，也是不可取的。

50
correlation

C**R
发帖数: 1047

来自主题: Chemistry版 - 量子化学已经接近完全死亡了

“得到精确ec也不是完全没有办法，LDA方案中的
ec参数就可以用QMC算出来。”
一看这句就知道你是半壶水。

G

C**R
发帖数: 1047

来自主题: Chemistry版 - 量子化学已经接近完全死亡了

首先
Accurate quantum Monte Carlo （QMC) simulations for the energy of the HEG
have been performed for several intermediate values of the density, in turn
providing accurate values of the correlation energy density.[3]
Vosko-Wilk-Nusair (VWN) [4]
Perdew-Zunger (PZ81) [5]
Cole-Perdew (CP) [6]
Perdew-Wang (PW92) [7]
HEG就是homogeneous electron gas,现在绝大多数functional都是基于这个
approximation的，问题就是这个HEG approximation很难进一步有突破（因为qmc实在
是太慢了），所以你说的那个什么精确Eex，就是你不懂。
在问你个我知道答案问题，为什么QMC算Cuprates‎... 阅读全帖

p****g
发帖数: 70

来自主题: Chemistry版 - 选择性alkylation的问题

就是先上2eq的LDA 先deprotonation pyrrole N－H 和ester的α位H，
然后上1eq的alkylation 试剂，alkylation ester的α位。
文献上报道的产率都挺高70－80%的，怎么自己做总是不超过50%。
请有做过这类反应的人指点一下。

s*******h
发帖数: 3731

来自主题: Chemistry版 - 选择性alkylation的问题

你LDA自己做的？你丁基锂滴定了？你用重水quench dianion了吗？能拿到啥？

p****g
发帖数: 70

来自主题: Chemistry版 - 选择性alkylation的问题

LDA买的，我用薄荷醇滴定过的。
没有用重水quench过，不过这是个好方法。
反应后主要是原料没有反应完，但是如果反应温度高的话，选择性很差，会到N上去。

s*******h
发帖数: 3731

来自主题: Chemistry版 - 选择性alkylation的问题

买来的LDA一般来说，用不了两次就挂了。。
自己做吧。。另外quench一下中间体看看拔氢拔的怎么样。。
如果回收的就是原料，估计就是拔氢不彻底或者是底物反应比较慢。。。

s*******h
发帖数: 3731

来自主题: Chemistry版 - 能用PEEK传输LDA么?

问题不大。。。

p****g
发帖数: 70

来自主题: Chemistry版 - 能用PEEK传输LDA么?

算了,还是上teflon或者stainless steel了.更robust一些.

l********g
发帖数: 5070

来自主题: Chemistry版 - 为什么要用tBuLi去制备LDA呢？

我们为啥都是用nBuLi做？？

d*******g
发帖数: 3972

来自主题: Chemistry版 - 为什么要用tBuLi去制备LDA呢？

现做的比直接买的好

e*********6
发帖数: 3453

来自主题: Chemistry版 - 为什么要用tBuLi去制备LDA呢？

打错了，是nBuLi

z*****o
发帖数: 5758

来自主题: Chemistry版 - 为什么要用tBuLi去制备LDA呢？

超工你可以出书了，关于常用试剂的制备流程什么的

UCLA

s*******h
发帖数: 3731

来自主题: Chemistry版 - 为什么要用tBuLi去制备LDA呢？

我操，又被打脸了。。。。这耳光打在千老我的脸上是啪啪响。。。。

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天