由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 机器学习日报 2015年3月楼
相关主题
机器学习周报 2015-03-15DS需要会的手艺 真不少
机器学习日报2015年2月楼机器学习需要自己搞算法吗
大数据日报 2015年2月楼公司招DATA SCIENTIST
有考虑回国发展的同学吗?招大量咨询师、大数据机器学习、算法、神经网络、自然语言工程师...请推荐一个NLP的data set (转载)
大数据日报 2015年3月楼text mining中的relation extraction
[求建议] growth组值得去不, 做sde还是ds (转载)deep learning就是小团体 (转载)
所谓的大数据说说最近的一次面试,兼告诫国人
欢迎加入“机器学习实践” 俱乐部求职求内推
相关话题的讨论汇总
话题: 关键词话题: 学习话题: 机器话题: 自然语言话题: 日报
进入DataSciences版参与讨论
1 (共1页)
m***r
发帖数: 359
1
机器学习日报 2015-03-01
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-01/short.html
1) 【稀疏线性模型】 by @爱可可-爱生活
关键词:算法, Trevor Hastie
[视频]《Sparse Linear Models》 [1] Stanford的Trevor Hastie教授在H2O.ai Meet-
Up上的报告,讲稀疏线性模型——面向“宽数据”(特征维数超过样本数)的线性模型
云: [2] 13年同主题报告: [3] 讲义: [4]
[1] http://new.livestream.com/accounts/10932136/events/3779068
[2] http://pan.baidu.com/s/1jGy0WB0
[3] http://pan.baidu.com/s/1kTMf6h5
[4] http://pan.baidu.com/s/1jGpD6Ii
2) 【Awesome Computer Vision】 by @爱可可-爱生活
关键词:视觉, 资源, 代码
[资源]《Awesome Computer Vision》 [1] 分类整理的机器视觉相关资源列表,秉承
Awesome系列风格,有质有量,推荐
[1] https://github.com/jbhuang0604/awesome-computer-vision
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1eppulbfe3uj20lgclm4qs.jpg
3) 【Economic and social networks课程】 by @rayblue2011
关键词:应用, 资源, Adam Szeidl, 课程, 社交网络
再对那些对social networks感兴趣的推荐一下 Adam Szeidl( [1] )的课程Economic
and social networks Fall2014 [2] Szeidl毕业于哈佛大学,入选当年的RES TOUR,
在取得UCB的终身教职之后,返回祖国匈牙利的中欧大学任教
[1] http://www.personal.ceu.hu/staff/Adam_Szeidl/
[2] http://www.personal.ceu.hu/staff/Adam_Szeidl/networkscourse/networkscourse.htm
4) 【金融建模和传统的机器学习方法有什么异同?】 by @Nash_Equilibrium
关键词:公告板, 应用, 金融
好多答案看了几遍,工作中也觉得很在理——不要吐槽我现在不在金融行业混≥﹏≤
——对于 Quant 来说, Financial Modeling 和传统的机器学习方法有什么联系和区
别? [1] (分享自 @知乎 )
[1] http://www.zhihu.com/question/22221540
5) 【在线最优化求解】 by @wbrecom
关键词:经验总结, 算法, 博客
【#在线最优化求解#之一:预备篇】高维高数据量场景下的最优化求解多采用在线学习
方式。不同于批量处理,在线方式无法在L1正则化下产生稀疏性模型。本系列以模型的
稀疏性为主线,分5篇博文进行介绍。系列第一篇:预备篇 [1] 介绍在线最优化求解的
相关预备知识
[1] http://www.wbrecom.com/?p=264
--------
完整版 39条
http://ml.memect.com/archive/2015-03-01/long.html
m***r
发帖数: 359
2
机器学习日报 2015-03-02
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-02/short.html
1) 【VALSE视觉与学习青年学者研讨会视频】 by @视觉机器人
关键词:会议活动, 视觉, 活动, 教育网站, 李学龙, 潘纲, 山世光, 颜水成
VALSE是山世光教授(博士、研究员、博导)等发起的一项研讨会,主要目的是为计算
机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者(以70后和80后为
主)提供一个深层次学术交流的舞台 [1] ,历次QQ群活动信息: [2] ,技术分享视频
列表: [3]
[1] http://vipl.ict.ac.cn/valse/
[2] http://valse.mmcheng.net
[3] http://vision.ouc.edu.cn/valse/
2) 【Why word2vec works】 by @爱可可-爱生活
关键词:自然语言处理, 论文
[论文]《Random Walks on Context Spaces: Towards an Explanation of the
Mysteries of Semantic Word Embeddings》(2015) S Arora, Y Li, Y Liang等 [1]
用对数线性生成模型为word2vec等word embedding方法寻求合理解释。简化版解释一篇
:《Why word2vec works》 [2]
[1] http://arxiv.org/abs/1502.03520
[2] http://andyljones.tumblr.com/post/111299309808/why-word2vec-works
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1eprf6k33xjj213y42s4qp.jpg
3) 【LIBFFM场感知分解】 by @爱可可-爱生活
关键词:算法, 教育网站
[开源] LIBFFM: A Library for Field-aware Factorization Machines [1] 场感知FM
,又一开源FM实现(C++),FM可对任意实值向量进行预测,可看作自动的特征选择/组合
方法。 云: [2] 关于FM的更多内容可参见上次介绍的libFM:http://weibo.com/1402400261/C3VoTBv7X
[1] http://www.csie.ntu.edu.tw/~r01922136/libffm/
[2] http://pan.baidu.com/s/1jGwzjIu
4) 【我们是这样理解语言的-2:统计语言模型】 by @火光摇曳Flickering
关键词:算法, 自然语言处理, 神经网络
[我们是这样理解语言的-2]统计语言模型 | 火光摇曳 [1] 旧文重发,系统介绍了 N-
Gram 语言模型的数学表示、效果评估、模型平滑及模型训练(尤其是分布式),为后
续介绍神经网络语言模型和序列标注技术打个好基础。
[1] http://t.jiathis.com/7dZWC
5) 【TransE、TransH和TransR全部开源】 by @刘知远THU
关键词:会议活动, 知识工程, 资源, AAAI, PDF, 代码, 会议, 教育网站, 林衍凯,
知识库, 知识提取
TransE通过h + r = t的目标学习知识图谱表示,效果引人关注。最近我组林衍凯同学
针对TransE对1-N、N-1类型关系效果不佳的问题,提出TransR将实体映射到不同关系空
间中构建优化目标,效果最高比TransE提升近20%。论文 [1] ,实现TransE、TransH和
TransR全部开源: [2]
[1] http://nlp.csai.tsinghua.edu.cn/~lzy/publications/aaai2015_transr.pdf
[2] https://github.com/mrlyk423/relation_extraction
--------
完整版 40条
http://ml.memect.com/archive/2015-03-02/long.html
m***r
发帖数: 359
3
机器学习日报 2015-03-03
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-03/short.html
1) 【奇异值分解(SVD) --- 线性变换几何意义】 by @徽沪一郎
关键词:经验总结, 算法, 博客, 矩阵
讲解SVD(#奇异值分解#)的绝世好文, [1] 附中文翻译 [2]
[1] http://www.ams.org/samplings/feature-column/fcarc-svd
[2] http://blog.sciencenet.cn/home.php?mod=space&uid=696950&do=blog&quickforward=1&id=699380
2) 【eHarmony如何做用户推荐】 by @breezedeus
关键词:应用, 推荐系统
国外在线交友网站eHarmony是如何做用户推荐的: [1] ,对应视频下载: [2] 。里面
干活不少,比如介绍了如何从照片中抽取特征。很多地方跟我们的思路其实挺像的: [
3] 。另外,V r Hiring More ...(推荐、机器学习、分布式系统、php)
[1] http://xcorr.net/2015/01/16/machine-learning-in-online-dating/
[2] http://pan.baidu.com/s/1qWx8OYK
[3] http://breezedeus.github.io/2015/01/31/breezedeus-review-for-year-2014-tech.html
长微博图:http://ww3.sinaimg.cn/large/62fe561bgw1epso24xhkcj20lk1ajdns.jpg
3) 【微软猜字谜】 by @CSDN
关键词:自然语言处理
【人工智能推理又出新应用,与计算机一起猜谜闹元宵】元宵将至!是否想要成为猜谜
达人?近日,微软亚洲研究院推出一款新功能“微软猜字谜”。我们不仅在输入字形谜
的谜面后可以看到最佳答案,而且还可以看到推理的过程。是不是很有趣?一起试试吧
! [1]
[1] http://www.csdn.net/article/2015-03-03/2824090
4) 【Peacock:大规模主题模型及其在腾讯业务中的应用(完整版)】 by @火光摇曳
Flickering
关键词:架构, 应用, 自然语言处理, 广告系统, 行业动态, 主题模型
Peacock:大规模主题模型及其在腾讯业务中的应用(完整版) [1] 腾讯广点通成功研
发 Peacock,通过对10亿x1亿级别的大规模矩阵做分解,从海量样本数据中学习十万到
百万量级的隐含语义。已应用到文本语义理解、QQ群推荐、用户商业兴趣挖掘、相似用
户扩展、广告点击率预估等业务中。
[1] http://t.jiathis.com/7Ufl1
5) 【用KNN和DTW作时序信号分类】 by @爱可可-爱生活
关键词:资源, Python, 课程
[IPN]《Timeseries Classification: KNN & DTW》 [1] Python下用KNN和DTW(Dynamic
Time Warping)作时序信号分类
[1] http://nbviewer.ipython.org/github/markdregan/K-Nearest-Neighbors-with-Dynamic-Time-Warping/blob/master/K_Nearest_Neighbor_Dynamic_Time_Warping.ipynb
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1eps5ehr1o7j20nb9j9x6r.jpg
--------
完整版 34条
http://ml.memect.com/archive/2015-03-03/long.html
m***r
发帖数: 359
4
机器学习日报 2015-03-04
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-04/short.html
1) 【The NLP Engine: A Universal Turing Machine for NLP】 by @王威廉
关键词:资源, 自然语言处理, Eduard Hovy, Jiwei Li, PDF, 论文
来自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章:The NLP Engine: A
Universal Turing Machine for NLP [1] 作者用Shannon Entropy来刻画NLP中各项任
务的难度。
[1] http://arxiv.org/pdf/1503.00168.pdf
2) 【信息检索排序模型BM25】 by @iB37
关键词:应用, 资源, PDF, 信息检索
信息检索排序模型BM25(Besting Matching)。1)从经典概率模型演变而来 2)捕捉了
向量空间模型中三个影响索引项权重的因子:IDF逆文档频率;TF索引项频率;文档长
度归一化。3)并且含有集成学习的思想:组合了BM11和BM15两个模型。4)作者是BM25
的提出者和Okapi实现者Robertson [1]
[1] http://staff.city.ac.uk/~sb317/papers/foundations_bm25_review.pdf
3) 【自回归滑动平均(ARMA)时间序列的简单介绍】 by @爱可可-爱生活
关键词:经验总结, 算法, 博客, 回归
[文章]《Auto-regression and Moving-average time series - Simplified》 [1] 自
回归滑动平均(ARMA)时间序列的简单介绍,ARMA是研究时间序列的重要方法,由自回归
模型(AR模型)与滑动平均模型(MA模型)为基础“混合”构成
[1] http://www.analyticsvidhya.com/blog/2015/03/introduction-auto-regression-moving-average-time-series/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eptzzubfo1j20i73mrau5.jpg
4) 【All Models of Learning have Flaws】 by @王威廉
关键词:经验总结, John Langford, 博客
推荐VW作者John Langford一篇有意思的博客 All Models of Learning have Flaws [1
] 作者以表格的方式,介绍了各种机器学习方法的概念,讨论了主要优点与不足之处。
[1] http://hunch.net/?p=224
5) 【回顾:Deep learning 之赞美篇】 by @老师木
关键词:深度学习
Deep learning 之赞美篇
长微博图:http://ww3.sinaimg.cn/large/76b0e04fjw1dzmpd48vjhj.jpg
--------
完整版 40条
http://ml.memect.com/archive/2015-03-04/long.html
m***r
发帖数: 359
5
机器学习日报 2015-03-05
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-05/short.html
1) 【Grounded Language Learning】 by @刘挺
关键词:会议活动, 资源, 自然语言处理, AAAI, Ray Mooney, 幻灯片, 会议, 视频
推荐:Grounded Language Learning,Invited talk at AAAI’2013,Ray Mooney, 把
自然语言处理与感知、行动相关联,从而在环境中实现“落地”,而不只是在语言的空
间里转,想一想孩子不是看了海量语料才学会语言的!有视频,有PPT: [1]
[1] http://videolectures.net/aaai2013_mooney_language_learning/
2) 【IBM收购Alchemy API】 by @ZDNet
关键词:深度学习, 自然语言处理
【IBM收购“深度学习”初创企业Alchemy API并雇用四万名开发人员】深度学习技术初
创企业Alchemy API的专长在于对非结构化文本及数据进行收集、筛选以及分析。根据
蓝色巨人的说法,此次收购将强化IBM的“沃森生态系统”。 [1]
[1] http://soft.zdnet.com.cn/software_zone/2015/0305/3047395.shtml
3) 【深度学习在Flickr的应用】 by @爱可可-爱生活
关键词:深度学习, 视觉
[视频]《Deep Learning at Flickr》 [1] 介绍深度学习在Flickr的应用,主要是图像
标签自动提取 云: [2]
[1] http://techjaw.com/2015/03/04/deep-learning-at-flickr-pierre-garrigues/
[2] http://pan.baidu.com/s/1eQxTtwI
4) 【大规模机器学习流程的构建与部署】 by @伯乐在线官方微博
关键词:经验总结, 算法, SVM, 博客, 回归
《大规模机器学习流程的构建与部署》现如今有许多算法实现了对大规模数据集的扩展
(包括矩阵因式分解、SVM、逻辑回归等等)。事实上,机器学习专家很喜欢这一点:
如果你能把你的问题抽象成一个简单的优化问题,那么他们很乐意去解决它…… [1] @
dengcy028 译
[1] http://blog.jobbole.com/84605/
5) 【脸识别开发包】 by @CSDN下载频道
关键词:视觉
#CSDN下载频道分享# #0分干货来了# 人脸识别开发包(免费,可商用,有演示、范例
、说明书) - 简介:人脸识别二次开发包,免费,可商用,有演示、范例、说明书 -
分享下载链接: [1]
[1] http://download.csdn.net/detail/lswtzw/8469997#6874737-tsina-1-84236-3048ae643c93bac2c9a415075e9789bc
--------
完整版 34条
http://ml.memect.com/archive/2015-03-05/long.html
m***r
发帖数: 359
6
机器学习日报 2015-03-01
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-01/short.html
1) 【稀疏线性模型】 by @爱可可-爱生活
关键词:算法, Trevor Hastie
[视频]《Sparse Linear Models》 [1] Stanford的Trevor Hastie教授在H2O.ai Meet-
Up上的报告,讲稀疏线性模型——面向“宽数据”(特征维数超过样本数)的线性模型
云: [2] 13年同主题报告: [3] 讲义: [4]
[1] http://new.livestream.com/accounts/10932136/events/3779068
[2] http://pan.baidu.com/s/1jGy0WB0
[3] http://pan.baidu.com/s/1kTMf6h5
[4] http://pan.baidu.com/s/1jGpD6Ii
2) 【Awesome Computer Vision】 by @爱可可-爱生活
关键词:视觉, 资源, 代码
[资源]《Awesome Computer Vision》 [1] 分类整理的机器视觉相关资源列表,秉承
Awesome系列风格,有质有量,推荐
[1] https://github.com/jbhuang0604/awesome-computer-vision
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1eppulbfe3uj20lgclm4qs.jpg
3) 【Economic and social networks课程】 by @rayblue2011
关键词:应用, 资源, Adam Szeidl, 课程, 社交网络
再对那些对social networks感兴趣的推荐一下 Adam Szeidl( [1] )的课程Economic
and social networks Fall2014 [2] Szeidl毕业于哈佛大学,入选当年的RES TOUR,
在取得UCB的终身教职之后,返回祖国匈牙利的中欧大学任教
[1] http://www.personal.ceu.hu/staff/Adam_Szeidl/
[2] http://www.personal.ceu.hu/staff/Adam_Szeidl/networkscourse/networkscourse.htm
4) 【金融建模和传统的机器学习方法有什么异同?】 by @Nash_Equilibrium
关键词:公告板, 应用, 金融
好多答案看了几遍,工作中也觉得很在理——不要吐槽我现在不在金融行业混≥﹏≤
——对于 Quant 来说, Financial Modeling 和传统的机器学习方法有什么联系和区
别? [1] (分享自 @知乎 )
[1] http://www.zhihu.com/question/22221540
5) 【在线最优化求解】 by @wbrecom
关键词:经验总结, 算法, 博客
【#在线最优化求解#之一:预备篇】高维高数据量场景下的最优化求解多采用在线学习
方式。不同于批量处理,在线方式无法在L1正则化下产生稀疏性模型。本系列以模型的
稀疏性为主线,分5篇博文进行介绍。系列第一篇:预备篇 [1] 介绍在线最优化求解的
相关预备知识
[1] http://www.wbrecom.com/?p=264
--------
完整版 39条
http://ml.memect.com/archive/2015-03-01/long.html
m***r
发帖数: 359
7
机器学习日报 2015-03-02
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-02/short.html
1) 【VALSE视觉与学习青年学者研讨会视频】 by @视觉机器人
关键词:会议活动, 视觉, 活动, 教育网站, 李学龙, 潘纲, 山世光, 颜水成
VALSE是山世光教授(博士、研究员、博导)等发起的一项研讨会,主要目的是为计算
机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者(以70后和80后为
主)提供一个深层次学术交流的舞台 [1] ,历次QQ群活动信息: [2] ,技术分享视频
列表: [3]
[1] http://vipl.ict.ac.cn/valse/
[2] http://valse.mmcheng.net
[3] http://vision.ouc.edu.cn/valse/
2) 【Why word2vec works】 by @爱可可-爱生活
关键词:自然语言处理, 论文
[论文]《Random Walks on Context Spaces: Towards an Explanation of the
Mysteries of Semantic Word Embeddings》(2015) S Arora, Y Li, Y Liang等 [1]
用对数线性生成模型为word2vec等word embedding方法寻求合理解释。简化版解释一篇
:《Why word2vec works》 [2]
[1] http://arxiv.org/abs/1502.03520
[2] http://andyljones.tumblr.com/post/111299309808/why-word2vec-works
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1eprf6k33xjj213y42s4qp.jpg
3) 【LIBFFM场感知分解】 by @爱可可-爱生活
关键词:算法, 教育网站
[开源] LIBFFM: A Library for Field-aware Factorization Machines [1] 场感知FM
,又一开源FM实现(C++),FM可对任意实值向量进行预测,可看作自动的特征选择/组合
方法。 云: [2] 关于FM的更多内容可参见上次介绍的libFM:http://weibo.com/1402400261/C3VoTBv7X
[1] http://www.csie.ntu.edu.tw/~r01922136/libffm/
[2] http://pan.baidu.com/s/1jGwzjIu
4) 【我们是这样理解语言的-2:统计语言模型】 by @火光摇曳Flickering
关键词:算法, 自然语言处理, 神经网络
[我们是这样理解语言的-2]统计语言模型 | 火光摇曳 [1] 旧文重发,系统介绍了 N-
Gram 语言模型的数学表示、效果评估、模型平滑及模型训练(尤其是分布式),为后
续介绍神经网络语言模型和序列标注技术打个好基础。
[1] http://t.jiathis.com/7dZWC
5) 【TransE、TransH和TransR全部开源】 by @刘知远THU
关键词:会议活动, 知识工程, 资源, AAAI, PDF, 代码, 会议, 教育网站, 林衍凯,
知识库, 知识提取
TransE通过h + r = t的目标学习知识图谱表示,效果引人关注。最近我组林衍凯同学
针对TransE对1-N、N-1类型关系效果不佳的问题,提出TransR将实体映射到不同关系空
间中构建优化目标,效果最高比TransE提升近20%。论文 [1] ,实现TransE、TransH和
TransR全部开源: [2]
[1] http://nlp.csai.tsinghua.edu.cn/~lzy/publications/aaai2015_transr.pdf
[2] https://github.com/mrlyk423/relation_extraction
--------
完整版 40条
http://ml.memect.com/archive/2015-03-02/long.html
m***r
发帖数: 359
8
机器学习日报 2015-03-03
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-03/short.html
1) 【奇异值分解(SVD) --- 线性变换几何意义】 by @徽沪一郎
关键词:经验总结, 算法, 博客, 矩阵
讲解SVD(#奇异值分解#)的绝世好文, [1] 附中文翻译 [2]
[1] http://www.ams.org/samplings/feature-column/fcarc-svd
[2] http://blog.sciencenet.cn/home.php?mod=space&uid=696950&do=blog&quickforward=1&id=699380
2) 【eHarmony如何做用户推荐】 by @breezedeus
关键词:应用, 推荐系统
国外在线交友网站eHarmony是如何做用户推荐的: [1] ,对应视频下载: [2] 。里面
干活不少,比如介绍了如何从照片中抽取特征。很多地方跟我们的思路其实挺像的: [
3] 。另外,V r Hiring More ...(推荐、机器学习、分布式系统、php)
[1] http://xcorr.net/2015/01/16/machine-learning-in-online-dating/
[2] http://pan.baidu.com/s/1qWx8OYK
[3] http://breezedeus.github.io/2015/01/31/breezedeus-review-for-year-2014-tech.html
长微博图:http://ww3.sinaimg.cn/large/62fe561bgw1epso24xhkcj20lk1ajdns.jpg
3) 【微软猜字谜】 by @CSDN
关键词:自然语言处理
【人工智能推理又出新应用,与计算机一起猜谜闹元宵】元宵将至!是否想要成为猜谜
达人?近日,微软亚洲研究院推出一款新功能“微软猜字谜”。我们不仅在输入字形谜
的谜面后可以看到最佳答案,而且还可以看到推理的过程。是不是很有趣?一起试试吧
! [1]
[1] http://www.csdn.net/article/2015-03-03/2824090
4) 【Peacock:大规模主题模型及其在腾讯业务中的应用(完整版)】 by @火光摇曳
Flickering
关键词:架构, 应用, 自然语言处理, 广告系统, 行业动态, 主题模型
Peacock:大规模主题模型及其在腾讯业务中的应用(完整版) [1] 腾讯广点通成功研
发 Peacock,通过对10亿x1亿级别的大规模矩阵做分解,从海量样本数据中学习十万到
百万量级的隐含语义。已应用到文本语义理解、QQ群推荐、用户商业兴趣挖掘、相似用
户扩展、广告点击率预估等业务中。
[1] http://t.jiathis.com/7Ufl1
5) 【用KNN和DTW作时序信号分类】 by @爱可可-爱生活
关键词:资源, Python, 课程
[IPN]《Timeseries Classification: KNN & DTW》 [1] Python下用KNN和DTW(Dynamic
Time Warping)作时序信号分类
[1] http://nbviewer.ipython.org/github/markdregan/K-Nearest-Neighbors-with-Dynamic-Time-Warping/blob/master/K_Nearest_Neighbor_Dynamic_Time_Warping.ipynb
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1eps5ehr1o7j20nb9j9x6r.jpg
--------
完整版 34条
http://ml.memect.com/archive/2015-03-03/long.html
m***r
发帖数: 359
9
机器学习日报 2015-03-04
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-04/short.html
1) 【The NLP Engine: A Universal Turing Machine for NLP】 by @王威廉
关键词:资源, 自然语言处理, Eduard Hovy, Jiwei Li, PDF, 论文
来自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章:The NLP Engine: A
Universal Turing Machine for NLP [1] 作者用Shannon Entropy来刻画NLP中各项任
务的难度。
[1] http://arxiv.org/pdf/1503.00168.pdf
2) 【信息检索排序模型BM25】 by @iB37
关键词:应用, 资源, PDF, 信息检索
信息检索排序模型BM25(Besting Matching)。1)从经典概率模型演变而来 2)捕捉了
向量空间模型中三个影响索引项权重的因子:IDF逆文档频率;TF索引项频率;文档长
度归一化。3)并且含有集成学习的思想:组合了BM11和BM15两个模型。4)作者是BM25
的提出者和Okapi实现者Robertson [1]
[1] http://staff.city.ac.uk/~sb317/papers/foundations_bm25_review.pdf
3) 【自回归滑动平均(ARMA)时间序列的简单介绍】 by @爱可可-爱生活
关键词:经验总结, 算法, 博客, 回归
[文章]《Auto-regression and Moving-average time series - Simplified》 [1] 自
回归滑动平均(ARMA)时间序列的简单介绍,ARMA是研究时间序列的重要方法,由自回归
模型(AR模型)与滑动平均模型(MA模型)为基础“混合”构成
[1] http://www.analyticsvidhya.com/blog/2015/03/introduction-auto-regression-moving-average-time-series/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eptzzubfo1j20i73mrau5.jpg
4) 【All Models of Learning have Flaws】 by @王威廉
关键词:经验总结, John Langford, 博客
推荐VW作者John Langford一篇有意思的博客 All Models of Learning have Flaws [1
] 作者以表格的方式,介绍了各种机器学习方法的概念,讨论了主要优点与不足之处。
[1] http://hunch.net/?p=224
5) 【回顾:Deep learning 之赞美篇】 by @老师木
关键词:深度学习
Deep learning 之赞美篇
长微博图:http://ww3.sinaimg.cn/large/76b0e04fjw1dzmpd48vjhj.jpg
--------
完整版 40条
http://ml.memect.com/archive/2015-03-04/long.html
m***r
发帖数: 359
10
机器学习日报 2015-03-05
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-05/short.html
1) 【Grounded Language Learning】 by @刘挺
关键词:会议活动, 资源, 自然语言处理, AAAI, Ray Mooney, 幻灯片, 会议, 视频
推荐:Grounded Language Learning,Invited talk at AAAI’2013,Ray Mooney, 把
自然语言处理与感知、行动相关联,从而在环境中实现“落地”,而不只是在语言的空
间里转,想一想孩子不是看了海量语料才学会语言的!有视频,有PPT: [1]
[1] http://videolectures.net/aaai2013_mooney_language_learning/
2) 【IBM收购Alchemy API】 by @ZDNet
关键词:深度学习, 自然语言处理
【IBM收购“深度学习”初创企业Alchemy API并雇用四万名开发人员】深度学习技术初
创企业Alchemy API的专长在于对非结构化文本及数据进行收集、筛选以及分析。根据
蓝色巨人的说法,此次收购将强化IBM的“沃森生态系统”。 [1]
[1] http://soft.zdnet.com.cn/software_zone/2015/0305/3047395.shtml
3) 【深度学习在Flickr的应用】 by @爱可可-爱生活
关键词:深度学习, 视觉
[视频]《Deep Learning at Flickr》 [1] 介绍深度学习在Flickr的应用,主要是图像
标签自动提取 云: [2]
[1] http://techjaw.com/2015/03/04/deep-learning-at-flickr-pierre-garrigues/
[2] http://pan.baidu.com/s/1eQxTtwI
4) 【大规模机器学习流程的构建与部署】 by @伯乐在线官方微博
关键词:经验总结, 算法, SVM, 博客, 回归
《大规模机器学习流程的构建与部署》现如今有许多算法实现了对大规模数据集的扩展
(包括矩阵因式分解、SVM、逻辑回归等等)。事实上,机器学习专家很喜欢这一点:
如果你能把你的问题抽象成一个简单的优化问题,那么他们很乐意去解决它…… [1] @
dengcy028 译
[1] http://blog.jobbole.com/84605/
5) 【脸识别开发包】 by @CSDN下载频道
关键词:视觉
#CSDN下载频道分享# #0分干货来了# 人脸识别开发包(免费,可商用,有演示、范例
、说明书) - 简介:人脸识别二次开发包,免费,可商用,有演示、范例、说明书 -
分享下载链接: [1]
[1] http://download.csdn.net/detail/lswtzw/8469997#6874737-tsina-1-84236-3048ae643c93bac2c9a415075e9789bc
--------
完整版 34条
http://ml.memect.com/archive/2015-03-05/long.html
相关主题
[求建议] growth组值得去不, 做sde还是ds (转载)DS需要会的手艺 真不少
所谓的大数据机器学习需要自己搞算法吗
欢迎加入“机器学习实践” 俱乐部公司招DATA SCIENTIST
进入DataSciences版参与讨论
m***r
发帖数: 359
11
机器学习日报 2015-03-06
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-06/short.html
1) 【踹不倒的谷歌大狗是怎样炼成的】 by @杨静Lillian
关键词:算法, 应用, 行业动态, 机器人, 杨强
【杨强】踹不倒的谷歌大狗是怎样炼成的? [1] 不管马克的谷歌大狗能做出多少动作
,它都并不真正具有智能:它的整个“头脑”,都是在算法控制下,计算如何保持平衡
而已。下面就让我们跟着杨强教授的分析,像拆穿魔术一样,来揭开踹不倒的谷歌大狗
的真面目吧!
[1] http://weibo.com/p/1001603817391019661074
2) 【DeepDive Open Datasets】 by @爱可可-爱生活
关键词:自然语言处理, 教育网站
[数据集] DeepDive Open Datasets [1] 经Stanford CoreNLP标注处理过的大型文本数
据集,包括PubMed、BioMed、PLOS、Google Patents和Wikipedia等,对于NLP研究的价
值不言而喻,强烈推荐
[1] http://deepdive.stanford.edu/doc/opendata/
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1epwa3a211wj20yn4pj1ky.jpg
3) 【NICAR15上的报告,总结文本可视化】 by @爱可可-爱生活
关键词:资源, 自然语言处理, Nick Diakopoulos, 幻灯片, 可视化
[幻灯]《From Words to Pictures: Text Analysis and Visualization》 [1] Nick
Diakopoulos在NICAR15上的报告,总结文本可视化的最新样式和主要技术流程, 非常
棒! 云: [2]
[1] http://www.nickdiakopoulos.com/wp-content/uploads/2015/03/From-words-to-pictures_text-analysis-and-visualization_diakopoulos.pptx
[2] http://pan.baidu.com/s/1jGvdwOI
4) 【张雨石的《卷积神经网络》】 by @爱可可-爱生活
关键词:经验总结, 入门, 深度学习, 算法, Yann Lecun, 博客, 神经网络, 张雨石
张雨石 @zyx_1991 写的《卷积神经网络》 [1] 不错的科普文,推荐给打算入门CNN的
朋友
[1] http://blog.csdn.net/stdcoutzyx/article/details/41596663
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1epvst2h6xgj213jac44qs.jpg
5) 【采用Torch用深度学习网络理解NLP】 by @网路冷眼
关键词:深度学习, 算法, 自然语言处理, 神经网络
【Facebook AI Research on Understanding Natural Language with Deep Neural
Networks Using Torch】 [1] 采用Torch用深度学习网络理解NLP,来自Facebook 人工
智能的文章。转需!
[1] http://devblogs.nvidia.com/parallelforall/understanding-natural-language-deep-neural-networks-using-torch/
--------
完整版 38条
http://ml.memect.com/archive/2015-03-06/long.html
m***r
发帖数: 359
12
机器学习日报 2015-03-07
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-07/short.html
1) 【52nlp上HMM相关文章索引】 by @52nlp
关键词:算法, HMM
HMM系列文章是52nlp上访问量较高的一批文章,这里做个索引,方便大家参考。 [1] [
2]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203765668&idx=1&sn=e0899d1267bf728b2a4b2de1869e0d06#rd
[2] http://www.52nlp.cn/hmm%E7%9B%B8%E5%85%B3%E6%96%87%E7%AB%A0%E7%B4%A2%E5%BC%95
2) 【TKDE: Tweet分割和在NER上的应用】 by @AixinSG
关键词:资源, 自然语言处理, PDF
Our paper "Tweet Segmentation and Its Application to Named Entity
Recognition" is featured on TKDE website [1] from the February 2015 issue.
Free download at [2]
[1] http://www.computer.org/web/tkde
[2] http://www.computer.org/cms/Computer.org/transactions/tkde/pdfs/tkde_featured.pdf
3) 【音乐文件聚类和可视化】 by @爱可可-爱生活
关键词:语音, Python, 可视化
[文章]《Mapping Your Music Collection》 [1] Python下对MP3音乐文件聚类和可视
化,涉及音频特征抽取、特征选择和面向可视化的聚类分析,很好的学习范例
[1] http://www.christianpeccei.com/musicmap/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1epwt4i948wj20ke6swx6q.jpg
4) 【Jürgen Schmidhuber在Reddit上的AMA】 by @爱可可-爱生活
关键词:经验总结, 经验
[Reddit]《I am Jürgen Schmidhuber, AMA!》 [1] Jürgen Schmidhuber在Reddit上
的AMA(Ask Me Anything)主题,有不少RNN和AI、ML的干货内容,关于开源&思想&方法&
建议……耐心阅读,相信你也会受益匪浅
[1] http://www.reddit.com/r/MachineLearning/comments/2xcyrl/i_am_j%C3%BCrgen_schmidhuber_ama/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1epwouq4cjpj20rtrca4r9.jpg
5) 【学术种子网站AcademicTorrents】 by @阳志平1949
关键词:资源, 自然语言处理, 学术搜索
【学术种子网站:AcademicTorrents】成G上T的学术数据,HN近期热议话题,一般人不
告诉TA [偷笑] 主题涉及机器学习、NLP、SNA等。下载最简单的方法,通过BT软件,
RSS订阅各集合即可: [1]
[1] http://academictorrents.com/collections.php
--------
完整版 31条
http://ml.memect.com/archive/2015-03-07/long.html
m***r
发帖数: 359
13
机器学习日报 2015-03-08
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-08/short.html
1) 【机器学习中距离和相似性度量方法】 by @陈晓鸣在硅谷
关键词:相似度量
《漫谈:机器学习中距离和相似性度量方法》 [1] 真不错!通俗易懂,温故知新~ 主
要介绍机器学习和数据挖掘中一些常见的距离公式,包括: 闵可夫斯基距离 欧几里得
距离 曼哈顿距离 切比雪夫距离 马氏距离 余弦相似度 皮尔逊相关系数 汉明距离 杰
卡德相似系数 编辑距离 DTW 距离 KL 散度
[1] http://dataunion.org/11710.html
2) 【机器学习ML简史】 by @数盟社区
关键词:Blaise Pascal, Von Leibniz
【译文:机器学习ML简史】在科学技术刚刚萌芽的时候,科学家Blaise Pascal和Von
Leibniz就想到了有朝一日能够实现人工智能。即让机器拥有像人一样的智能。机器学
习是AI中一条重要的发展线,在工业界和学术界都异常火爆。 [1]
[1] http://dataunion.org/11672.html
3) 【Peter Norvig解决编程问题的机器学习】 by @网路冷眼
关键词:算法, Peter Norvig
【解决编程问题的机器学习】 [1] 这是Peter Norvig在SPLASH上所做的KeyNotes,使
用机器学习技术解决更一般的软件问题,以帮助编程老手和新手。Peter Norvig是
Google研究院院长,曾是Google核心搜索算法组主任,人工智能大牛。干货!用机器学
习解决码农的编程问题,建议大家看看!
[1] http://www.infoq.com/presentations/machine-learning-general-programming
4) 【欧洲人脑计划改变其治理结构】 by @金连文
关键词:神经科学
Nature日前报道:欧洲人脑计划(HBP)解散了三人执委,改变其治理结构 ( [1] 。总金
额10亿欧元的HBP自提出以来争议不断,特别是认知神经科学界的质疑 (Nature去年两
篇相关报道: [2] , [3] 。在未来的HBP中,Neuroscience的声音是否要比ICT的大?
[1] http://www.nature.com/news/human-brain-project-votes-for-leadership-change-1.17060)
[2] http://www.nature.com/news/neuroscience-where-is-the-brain-in-the-human-brain-project-1.15803
[3] http://www.nature.com/news/row-hits-flagship-brain-plan-1.15519)
5) 【Hopfield Neural Networks为什么没有人提了呢?】 by @西瓜大丸子汤
关键词:算法, 简报, 神经网络
Hopfield Neural Networks和SOM这样的好东西,为什么没有人提了呢?机器学习日报5
个月了,没有见到提到一次,真的是前浪死在沙滩上了么?
--------
完整版 24条
http://ml.memect.com/archive/2015-03-08/long.html
m***r
发帖数: 359
14
机器学习日报 2015-03-09
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-09/short.html
1) 【孟凡东CNN用于机器翻译】 by @鲁东东胖
关键词:深度学习, 算法, 资源, PDF, 论文, 神经网络
#DL4NLP @Noah # 第一弹: 介绍下 @孟凡东_ICTNLP 的出色工作 ( [1] ),我们把
来自target的attention signal加入source encoding CNN的输入,得到了比BBN的模型
好的多neural network joint model (一个点的BLEU值提升), 这是和计算所 @刘群MT-
to-Death 老师的合作项目的初期工作的一部分
[1] http://arxiv.org/pdf/1503.01838v1.pdf
2) 【文本挖掘揭开印度菜的美味秘诀】 by @爱可可-爱生活
关键词:自然语言处理, 论文
[论文]《Spices form the basis of food pairing in Indian cuisine》A Jain, G
Bagler (2015) [1] 揭开印度菜的美味秘诀——通过对大量食谱原料关系的挖掘,发现
印度菜美味的原因之一是其中的味道互相冲突,很有趣的文本挖掘研究
[1] http://arxiv.org/abs/1502.03815
3) 【机器学习中导数最优化方法】 by @数盟社区
关键词:经验总结, 博客
【机器学习中导数最优化方法(基础篇)】 @迅猛龙Daniel 这篇博客主要总结一下使用
导数的最优化方法的几个基本方法,梳理梳理相关的数学知识,本人也是一边写一边学
,如有问题,欢迎指正,共同学习,一起进步。 [1]
[1] http://dataunion.org/11752.html
4) 【幂律分布】 by @iB37
关键词:资源, 自然语言处理, PDF, 教育网站, 齐夫, 语言学
#幂律分布# 1)词频与其降序排序的关系,最著名的是语言学家齐夫(Zipf,1902-1950)
1949年提出的Zipf‘s law,即二者成反比关系. 曼德勃罗(Mandelbrot,1924- 2010)引
入参数修正了对甚高频和甚低频词的刻画 2)Heaps' law: 词汇表与语料规模的平方根(
这是一个参数,英语0.4-0.6)成正比 [1]
[1] http://www.ccs.neu.edu/home/ekanou/ISU535.09X2/Handouts/Review_Material/zipfslaw.pdf
5) 【梯度下降算法的交互式演示】 by @网路冷眼
关键词:算法
【梯度下降算法的交互式演示】 [1] 点击功能图添加特性,至少要加入2个特性才能开
始动画。附matlib源代码。转需!
[1] http://lukaszkujawa.github.io/gradient-descent.html
--------
完整版 40条
http://ml.memect.com/archive/2015-03-09/long.html
m***r
发帖数: 359
15
机器学习日报 2015-03-10
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-10/short.html
1) 【如何评价季逸超、Peak Labs 和 Magi 搜索引擎?】 by @熊辰炎
关键词:知识工程, 季逸超, 知识库
我在 @知乎 回答了【如何评价季逸超、Peak Labs 和 Magi 搜索引擎?】:谢邀。 这
应该是在知乎最适合我的一道题目。趁着失眠来答一部分。 利益相关: 我是做知识图
谱和搜索的PhD,我之前一半的funding来自CMU机器学习系的never ending lang… [1]
[1] http://zhi.hu/gsnY
2) 【机器学习交互速查表】 by @爱可可-爱生活
关键词:资源, 课程, 速查卡
[速查] 机器学习交互速查表 [1] Scikit-Learn官网提供,在原有的Cheat Sheet基础
上加上了Scikit-Learn相关文档的链接,方便浏览
[1] http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
3) 【尚利峰:短文本自动回复系统】 by @鲁东东胖
关键词:算法, 自然语言处理, 论文, 神经网络
#DL4NLP @Noah # 第二弹: 介绍下 @尚利峰_FUNG 的工作 Neural Responding
Machine( [1] ), 我们在一个general的neural encoder-decoder 框架下设计了一个
对任意短文本自动生成回复的系统, 效果超越了我们之前的retrieval-based的系统
[1] http://arxiv.org/abs/1503.02364
4) 【深度学习的全面硬件指南】 by @爱可可-爱生活
关键词:深度学习, GPU
[文章]《A Full Hardware Guide to Deep Learning》 [1] 深度学习的全面硬件指南
,从GPU到RAM、CPU、SSD、PCIe
[1] https://timdettmers.wordpress.com/2015/03/09/deep-learning-hardware-
guide/
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1eq0iityr5lj20kta1te83.jpg
5) 【行人检测进展及数据集】 by @RocKof
关键词:视觉
各种行人数据库 [1]
[1] http://www.52ml.net/17004.html
--------
完整版 24条
http://ml.memect.com/archive/2015-03-10/long.html
m***r
发帖数: 359
16
机器学习日报 2015-03-11
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-11/short.html
1) 【如何看待Deepmind将研发能玩《毁灭战士1》的AI】 by @winsty
关键词:深度学习, 资源, Naiyan Wang, 幻灯片
我在 @知乎 回答了【如何看待Deepmind将研发能玩《毁灭战士1》的AI?】:说好的要
来更新,拖延症了下-.- 先来分享下我上周组会的slides: Naiyan Wang -
Miscellaneous 。 几点insight我愿意在这里再重复一遍: 1. 我个… [1]
[1] http://zhi.hu/gY0q
2) 【cxxnet实现深度神经网络】 by @phunter_lau
关键词:深度学习, 算法, 代码, 段子, 神经网络
《皮老师有话说》系列之三《蛋蛋和皮老师新论文》使用了深度学习方法在网页图片上
快速判断众多下载按钮中那个才是真的,附送测试数据集截图一张,请各位人类测试自
己能否在五秒之内判断哪个是真正的下载。该工作用到 @antinucleon 的cxxnet实现深
度神经网络,github传送门在 [1]
[1] https://github.com/antinucleon/cxxnet
3) 【神经网络C++教程】 by @网路冷眼
关键词:经验总结, 算法, 资源, 博客, 课程, 神经网络
【神经网络C++教程】 [1] 神经网络很好玩。本文介绍了用可调节梯度下降和可调节动
量法设计和编码经典BP神经网络,网络经过训练可以做出惊人和美妙的东西出来。要了
解更多的知识,可以访问作者的博客: [2] @2gua @伯乐头条 @Linux中国 @CSDN_CODE
@好东西传送门
[1] https://vimeo.com/19569529
[2] http://millermattson.com/dave/
4) 【神经科学碰撞人工智能】 by @安人心智
关键词:视觉, 论文, 神经科学
【神经科学碰撞人工智能】在脸部识别上你我都是专家,即使细微的差别也能辨认。研
究已证明人类和灵长类动物在面部加工上不同于其他物种,人类使用梭状回面孔区(
FFA)。Khaligh-Razavi等通过计算机模拟出人脸识别的FFA活动,堪称神经科学与人工
智能的完美结合。详情: [1]
[1] http://arxiv.org/abs/1502.01241
5) 【神经网络选择参考表】 by @爱可可-爱生活
关键词:深度学习, 算法, 神经网络
[文章]《How to Choose a Neural Network》 [1] deeplearning4j官网提供的实际应
用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
[1] http://deeplearning4j.org/neuralnetworktable.html
--------
完整版 28条
http://ml.memect.com/archive/2015-03-11/long.html
m***r
发帖数: 359
17
机器学习日报 2015-03-12
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-12/short.html
1) 【中英文维基百科语料上的Word2Vec实验】 by @52nlp
关键词:自然语言处理, 主题模型
中英文维基百科语料上的Word2Vec实验: 最近利用gensim word2vec模块在中英文维基
百科语料上分别测试了一下word2vec,记录一下实验的过程,欢迎观摩 [1]
[1] http://www.52nlp.cn/?p=8198
2) 【extreme learning machines】 by @黄广斌-ELM
关键词:算法, 资源, PDF, 教育网站, 神经网络
ELM的主要目的是使机器学习同时达到高准确度,较少的人工干预和实时学习。和过去
几十年传统的神经网络算法和理论信条相反,ELM理论显示隐层节点很重要但许多种神
经网络的隐层节点是不需要调整的, 是和应用无关的,其中一种方法是隐层节点随机
产生。在ELM体系中还有核节点等等。 [1]
[1] http://www.ntu.edu.sg/home/egbhuang/pdf/ELM-Suvey-Huang-Gao.pdf
3) 【黑客之概率编程及贝叶斯方法】 by @网路冷眼
关键词:资源, 代码, 课程, 统计
【黑客之概率编程及贝叶斯方法】 [1] 与其它介绍这两方面知识的教程不同,本文以
计算/理解第一,数学第二的视角介绍贝叶斯方法和概率编程。GitHub托管地址: [2]
转需! @52nlp @统计之都 @数盟社区 @爱可可-爱生活 @好东西传送门 @南非蜘蛛 @丕
子 @老师木
[1] https://camdavidsonpilon.github.io/Probabilistic-Programming-and-
Bayesian-Methods-for-Hackers/
[2] https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-
Bayesian-Methods-for-Hackers
4) 【图像中的卷积概念】 by @视觉机器人
关键词:经验总结, 深度学习, 视觉, 博客
欢迎讨论:信号处理中的卷积是指一个信号与另一个信号反转之后的信号求相关,可参
考维基百科的图。而图像中各种文档有时候卷积是指两个图像求正向的相关,而不是翻
转后求相关。实际上图像中也有相关算子、卷积算子,如博文 [1] 的描述,其相关和
卷积的两张图很形象
[1] http://www.cnblogs.com/pegasus/archive/2011/05/19/2051416.html
5) 【DL4NLP at Noah Deep matching model】 by @鲁东东胖
关键词:会议活动, 自然语言处理, NIPS, 会议, 机器翻译, 论文
#DL4NLP @Noah # 第三弹: 介绍我们在deep matching model上的系列工作以及其在短
文本对话和MT上的应用(包含NIPS14的文章),由 @轩轩_ICT_NLP @户保田 @涂兆鹏
等完成,是和 @刘群MT-to-Death @清才HIT 老师合作的成果, arXiv链接: [1] , [
2] , [3]
[1] http://arxiv.org/abs/1503.02357
[2] http://arxiv.org/abs/1503.02427
[3] http://arxiv.org/abs/1503.03244
--------
完整版 38条
http://ml.memect.com/archive/2015-03-12/long.html
m***r
发帖数: 359
18
机器学习日报 2015-03-13
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-13/short.html
1) 【多智能自然语言处理】 by @刘知远THU
关键词:深度学习, 自然语言处理, 问答系统, 赵东岩, 周明
计算机学会通讯2015年第3期专题是周明老师和赵东岩老师主持的《多智能自然语言处
理》,很多有意思的文章,例如 深度学习在自然语言处理中的应用,基于社会媒体的
预测技术,从问答系统看知识智能,拥抱社会智能,等等。 [1]
[1] http://www.ccf.org.cn/sites/ccf/jsjtbbd.jsp?contentId=2851766225495
2) 【计算机辅助翻译推荐作者】 by @青鸟leo翻译之声
关键词:资源, 自然语言处理, 崔启亮, 机器翻译, 钱多秀, 书籍, 王华树, 王华伟,
徐彬, 闫栗丽, 张霄军, 周兴华
计算机辅助翻译方面的书籍和论文,请搜索作者:崔启亮、徐彬、钱多秀、张霄军、王
华树、王华伟、闫栗丽、周兴华、王正、张政、穆雷等。 @翻译驴 推荐 机器翻译方面
,可以走马观花看《统计机器翻译》《统计自然语言处理》
3) 【FaceNet人脸识别】 by @爱可可-爱生活
关键词:视觉, 算法, 聚类, 论文
[论文]《FaceNet: A Unified Embedding for Face Recognition and Clustering》 [
1] Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in
the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别
和聚类
[1] http://arxiv.org/abs/1503.03832
4) 【霍威教授谈NLP发展趋势】 by @高立琦
关键词:自然语言处理, 霍威
[1] 转:专访卡内基梅隆大学爱德华•霍威教授。霍威教授谈NLP发展趋势。
[1] http://mp.weixin.qq.com/s?__biz=MjM5MTY5ODE4OQ==&mid=203749937&idx=4&sn=ffac1811c05083cf9b99e9bd78efd9bd&scene=1&from=groupmessage&isappinstalled=0#rd
5) 【MLlib中的Random Forests和Boosting】 by @CSDN云计算
关键词:经验总结, 算法, Joseph Bradley, Spark, 博客, 集成学习
【MLlib中的Random Forests和Boosting】本文来自Databricks公司网站的一篇博客文
章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和
Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些
简单的例子并建议该从何处上手。 [1]
[1] http://www.csdn.net/article/2015-03-11/2824178
--------
完整版 32条
http://ml.memect.com/archive/2015-03-13/long.html
m***r
发帖数: 359
19
机器学习日报 2015-03-14
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-14/short.html
1) 【LINE模型大规模网络降维公布论文以及源代码】 by @chuckpku
关键词:应用, 社交网络
我们的论文“LINE: Large-scale Information Network Embedding”被WWW2015接收。
该论文提出的LINE模型能够在单机上把大规模网络降维到低维空间表示,稍后我们将公
布论文以及源代码 @张铭PKUCS
2) 【概率图模型基础总结】 by @数盟社区
关键词:算法
【概率图模型基础总结】在这一过程中,模型往往是必须的,什么样的模型才是相对正
确的?这又是我们需要解决的问题。这些问题出现在很多领域,包括模式识别、差错控
制编码等。概率图模型是解决这些问题的工具之一。 [1]
[1] http://dataunion.org/12187.html
3) 【Sum-Product Networks】 by @爱可可-爱生活
关键词:深度学习, Pedro Domingos, 教育网站
[论文+代码] Sum-Product Networks(SPN) —— 华盛顿大学Pedro Domingos团队的DNN
,提供论文和实现代码 [1]
[1] http://spn.cs.washington.edu/index.shtml
4) 【IJCV 综述:图模型中的离散能量最小化】 by @赵家平USC
关键词:会议活动, 深度学习, 视觉, 自然语言处理, CVPR, 会议, 主题模型
IJCV 综述文章:Discrete energy minimization in graphical model [1] graphical
model 就是10年前的deep learning, 但它的难点是 inference, especially in the
presense of high-order cliques. 目前 inference仍然是CVPR的hot topics.
[1] http://link.springer.com/article/10.1007/s11263-015-0809-x
5) 【Stanford基于神经网络的自然语言依存关系解析器】 by @爱可可-爱生活
关键词:算法, 自然语言处理, 教育网站, 神经网络
[开源] Neural Network Dependency Parser [1] 基于神经网络的自然语言依存关系解
析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于
《A Fast and Accurate Dependency Parser Using Neural Networks》http://weibo.com/1402400261/C5SLzz84Z 思路实现
[1] http://nlp.stanford.edu/software/nndep.shtml
--------
完整版 28条
http://ml.memect.com/archive/2015-03-14/long.html
m***r
发帖数: 359
20
机器学习日报 2015-03-15
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-15/short.html
1) 【NICAR15主题报告Hands-on with machine learning】 by @爱可可-爱生活
关键词:入门, Chase Davis, 代码
[文章]《Hands-on with machine learning》 [1] Chase Davis在NICAR15上的主题报
告材料,用Scikit-Learn做监督学习的入门例子
[1] https://github.com/cjdd3b/nicar2015/tree/master/machine-learning
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eq638t357fj20os317qv5.jpg
2) 【《七周七并发模型》】 by @睡眼惺忪的小叶先森
关键词:架构, 资源, Spark, 书籍
《Seven Concurrency Models in Seven Weeks》感觉还不错啊。看到Concurrency
enables resilient, or fault-tolerant, software through independence and
fault detection.就想起了Spark里的RDD[嘻嘻] [1] [2] @skyline09_ @囧囧有神的小
杜霉女 @armsword
[1] http://download.csdn.net/detail/u011399549/8006943
[2] http://product.china-pub.com/3771014
3) 【两个R语言教程】 by @2gua
关键词:经验总结, 资源, Python, R语言, 博客, 课程, 数据科学
推荐两个R语言Tutorial,官网的: [1] ,还有: [2] 。再来一篇Python数据分析的
: [3] 。最后来看看这篇「Data Science, Data Analysis, R and Python」 [4] 比
较干,超值超量...[喵喵] @网路冷眼 @好东西传送门 @伯乐头条 @Linux中国
[1] http://cran.r-project.org/doc/manuals/R-intro.html
[2] http://cyclismo.org/tutorial/R/
[3] http://www.datacommunitydc.org/blog/2013/07/python-for-data-analysis-the-landscape-of-tutorials/
[4] http://www.r-bloggers.com/data-science-data-analysis-r-and-python/
4) 【经典老文Fast unfolding of communities in large networks】 by @爱可可-爱
生活
关键词:算法, 应用, 论文, 社交网络
[论文]《Fast unfolding of communities in large networks》VD Blondel, JL
Guillaume, R Lambiotte (2008) [1] 经典老文,复杂网络社区发现的高效算法,
Gephi中的Community detection即基于此 主页: [2] 源码: [3]
[1] http://arxiv.org/abs/0803.0476
[2] https://perso.uclouvain.be/vincent.blondel/research/louvain.html
[3] http://pan.baidu.com/s/1dD3vwFf
5) 【用PageRank计算世界杯参赛球队排行榜】 by @爱可可-爱生活
关键词:应用, PageRank, 论文, 信息检索
[论文]《PageRank Approach to Ranking National Football Teams》V Lazova, L
Basnarkov (2015) [1] 通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛
球队排行榜
[1] http://arxiv.org/abs/1503.01331
--------
完整版 28条
http://ml.memect.com/archive/2015-03-15/long.html
相关主题
请推荐一个NLP的data set (转载)说说最近的一次面试,兼告诫国人
text mining中的relation extraction求职求内推
deep learning就是小团体 (转载)data scientist job openings at Workday
进入DataSciences版参与讨论
m***r
发帖数: 359
21
机器学习日报 2015-03-16
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-16/short.html
1) 【神经网络语言模型】 by @火光摇曳Flickering
关键词:深度学习, 算法, 自然语言处理, Geoffrey Hinton, 神经网络
[我们是这样理解语言的-3]神经网络语言模型 | 火光摇曳 本文根据神经网络的发展历
程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003
]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变
形。 [1]
[1] http://t.jiathis.com/7tzZg
2) 【利用文本和可读性特征分类垃圾邮件】 by @iB37
关键词:会议活动, 算法, 资源, 自然语言处理, ICDM, PDF, SVM, 会议, 集成学习
经典问题的新研究:利用文本和可读性特征分类垃圾邮件。 [1] Classifying Spam
Emails using Text and Readability Features [Shams & Mercer,ICDM'13] 1)三组
特征:传统的(如垃圾词),文本的(如tf-idf),可读性的(如简单词)。2)五个
算法:RF,AdaBoost,Bagging,SVM,NB
[1] http://www.elg.uottawa.ca/~nat/Courses/csi5387_Winter2014/paper13.pdf
3) 【Kaggle脑控计算机交互(BCI)竞赛】 by @爱可可-爱生活
关键词:Kaggle, Python, 代码
[代码] BCI Challenge @ NER 2015 —— Kaggle脑控计算机交互(BCI)竞赛( [1] )优
胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参
赛框架的绝佳实例 [2]
[1] https://www.kaggle.com/c/inria-bci-challenge
[2] https://github.com/alexandrebarachant/bci-challenge-ner-2015
长微博图:http://ww1.sinaimg.cn/large/5396ee05gw1eq7rcizxroj20l48661kz.jpg
4) 【IPOL(在线图像处理)开放的科学和可重复的研究期刊】 by @视觉机器人
关键词:视觉, 算法, 自然语言处理
这个网站不错 [1] 。IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇
文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的
。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术
之间的距离。感谢 @命运规划部长
[1] http://www.ipol.im/
5) 【AAAI知识表示与推理研讨会会议安排】 by @王威廉
关键词:会议活动, 深度学习, AAAI, Antoine Bordes, David Mcallester, Doug
Lenat, Gary Marcus, Geoffrey Hinton, Jerry Hobbs, Josh Tenenbaum, Leon
Bottou, Percy Liang, Peter Clark, William Cohen, 会议, 活动
下周在斯坦福的AAAI知识表示与推理研讨会真是高朋满座:Peter Clark, William
Cohen, Geoff Hinton, Doug Lenat, Josh Tenenbaum, Antoine Bordes, Leon Bottou
, Percy Liang, Jerry Hobbs, David McAllester, Gary Marcus... 主题是结合传统
符号AI与统计机器学习AI。会议安排: [1]
[1] https://sites.google.com/site/krr2015/home/schedule
--------
完整版 36条
http://ml.memect.com/archive/2015-03-16/long.html
m***r
发帖数: 359
22
机器学习日报 2015-03-17
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-17/short.html
1) 【深度学习系统cxxnet V2】 by @陈天奇怪
关键词:深度学习, 算法, 代码, 神经网络
发布深度学习系统cxxnet V2,和小伙伴 @李沐M @antinucleon @winsty 完成,文章解
析了简洁高效神经网络的技术细节。代码 [1] [2]
[1] https://github.com/dmlc/cxxnet
[2] http://weibo.com/p/1001603821399843149639
2) 【加密数据高效分类问题】 by @爱可可-爱生活
关键词:算法, 分类
[论文]《Machine learning classification over encrypted data》R Bost, RA Popa
, S Tu, S Goldwasser (2014) [1] 出自MIT,研究加密数据高效分类问题
[1] http://eprint.iacr.org/2014/331
3) 【一个不错的自然语言处理词典】 by @52nlp
关键词:资源, 自然语言处理, Bill Wilson, 教育网站, 课程
一篇老文:一个不错的自然语言处理词典 [1] 作者Bill Wilson是澳大利亚新南威尔士
大学的一名教授,因为开了一门人工智能课程,就为这门课程分别编制了Prolog,人工
智能,机器学习, 自然语言处理的相关术语词典,这几个词典建于1998年,最后更新好
像在2012年 [2]
[1] http://www.52nlp.cn/?p=3019
[2] http://www.cse.unsw.edu.au/~billw/nlpdict.html
4) 【新加坡LV实验室的神经网络并行框架Purine】 by @m1nl1n
关键词:深度学习, 算法, Lin Min, 代码, 论文, 神经网络
@Shuicheng_YAN 新加坡LV实验室的神经网络并行框架Purine [1] 在Github [2] 上开
源了。支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加
速。12块Titan 20小时可以完成Googlenet的训练。
[1] http://arxiv.org/abs/1412.6249
[2] https://github.com/purine/purine2
5) 【机器学习及计算机视觉资源大全】 by @网路冷眼
关键词:视觉, 资源, Zheng Rui, 课程
#干货共享#【机器学习及计算机视觉资源大全】 [1] 囊括了机器学习机计算机视觉的
书籍、论 文、教程和课程多方面资料,收录了国人的资料。转需! @2gua @伯乐头条
@Linux中国 @极客头条
[1] http://zhengrui.github.io/zerryland/ML-CV-Resource.html
长微博图:http://ww4.sinaimg.cn/large/663aa05ajw1eq8g2jtem7j20or1v1e58.jpg
--------
完整版 36条
http://ml.memect.com/archive/2015-03-17/long.html
m***r
发帖数: 359
23
机器学习日报 2015-03-18
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-18/short.html
1) 【WSDM 2015总结】 by @唐杰THU
关键词:会议活动, 资源, 自然语言处理, Michael Franklin, PDF, WSDM, 会议
WSDM 2015结束,推荐大家一个黄老师等人领衔写的总结。 [1] 今年我们做了论文评审
的A/B test (分给不同组评审),录用率仅16%。邀请了加州伯克利的Michael Franklin
,Facebook的Lada,康奈尔的Thorsten等人做keynote。今年还有winter school,很是
卖座,还用了 @刘知远THU 的关键词抽取
[1] http://www.ccf.org.cn/resources/1190201776262/2015/03/12/16.pdf
2) 【WebChild从网页内容构建细粒度三元组知识库】 by @iB37
关键词:会议活动, 算法, 知识工程, 资源, PDF, WSDM, 会议, 知识库
WebChild: Harvesting and Organizing Commonsense Knowledge from the Web [1]
【Tandon et al,WSDM’14】从网页内容构建细粒度三元组知识库,准确率过80%,覆盖
率四百万已消岐断言。算法:半监督标签传播。辅助:WordNet。PS:WebChild,Child
of the Web的意思吗。
[1] http://gerard.demelo.org/papers/webchild.pdf
3) 【深度学习在自然语言处理中的应用(刘树杰 等)】 by @中国计算机学会CCF
关键词:深度学习, 算法, 自然语言处理, 董力, 刘树杰, 神经网络, 张家俊
【CCCF专题】《深度学习在自然语言处理中的应用》作者:刘树杰、董力、张家俊等。
深度学习是近年来机器学习领域发展最为迅速的领域。严格来说,深度学习并不是一种
全新的机器学习方法,而是基于深层神经网络的学习方法的别称。[赞] @董力at北航 @
张家俊MT [1]
[1] http://weibo.com/p/1001603821808741689173
4) 【轨迹数据挖掘综述】 by @郑宇MSRA
关键词:资源, PDF, 异常检测
从事轨迹数据挖掘快十年,近期重新梳理这个领域的各个环节,综述了轨迹预处理、查
找、轨迹聚类、分类、轨迹模式发现和异常检测等方面的关键技术、前沿工作和应用场
景,并整理了现有公开轨迹数据集。方便大家理清轨迹数据挖掘脉络,并快速定位解决
问题的方法。 [1]
[1] http://research.microsoft.com/pubs/241453/TrajectoryDataMining-tist.pdf
5) 【genCNN自然语言生成】 by @鲁东东胖
关键词:深度学习, 自然语言处理, 机器翻译, 论文
#DL4NLP @Noah # 第四弹:我们提出了genCNN, 一种新的用于自然语言生成的
convolutional architecture, 在测试的数据集上取得了优于LSTM的效果(perplexity
以及 n-best re-ranking for MT),arXiv链接( [1] )。 @轩轩_ICT_NLP 的工作
, 来自和 @刘群MT-to-Death 老师的合作
[1] http://arxiv.org/abs/1503.05034
--------
完整版 47条
http://ml.memect.com/archive/2015-03-18/long.html
m***r
发帖数: 359
24
机器学习日报 2015-03-19
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-19/short.html
1) 【机器学习日报搜索】 by @好东西传送门
关键词:深度学习, 视觉, 应用, 资源, 自然语言处理, 幻灯片, 简报, 信息检索
回顾一下过去半年机器学习日报报道了哪些好东西:深度学习676条 [1] 自然语言处理
518条 [2] 视觉398条 [3] 书籍158本 [4] PDF 203个 [5] 幻灯片88张 [6] 您需要的
,都在机器学习日报搜索
[1] http://ml.memect.com/search/?q=tag:%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0
[2] http://ml.memect.com/search/?q=tag:%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86
[3] http://ml.memect.com/search/?q=tag:%E8%A7%86%E8%A7%89
[4] http://ml.memect.com/search/?q=tag:%E4%B9%A6%E7%B1%8D
[5] http://ml.memect.com/search/?q=tag:PDF
[6] http://ml.memect.com/search/?q=tag:%E5%B9%BB%E7%81%AF%E7%89%87
2) 【《文本上的算法》v3.0】 by @yanxionglu
关键词:算法, 资源, 自然语言处理, PDF, 代码
《文本上的算法》v3.0,下载地址: [1]
[1] https://github.com/yanxionglu/text_pdf
3) 【免费电子书《强化学习算法》】 by @爱可可-爱生活
关键词:深度学习, 算法, 资源, 书籍
[书]《Algorithms for Reinforcement Learning》Csaba Szepesvárii(艾伯塔大学)
(2010) [1] 免费电子书《强化学习算法》,对强化学习最新算法(比较简洁)的介绍和
比较。强化学习能否借着DeepMind引领的DNN+RL风潮强势回归? 云: [2]
[1] http://www.ualberta.ca/~szepesva/RLBook.html
[2] http://pan.baidu.com/s/1sjmId8D
4) 【12306 售票网站新版验证码识别对抗】 by @碳基体
关键词:语音, 行业动态
[1] 调用百度识图的接口识别12306验证码,这个思路让我想起了调用google的语音识
别接口识别验证码
[1] http://linux.im/2015/03/17/12306-new-captcha.html
5) 【计算机应用数学课件】 by @浙大张宏鑫
关键词:资源, 教育网站, 课程
说起来《计算机应用数学》已经是第十季了,很高兴授课的内容获得了些认可。每年自
己都许愿要做出内容重大调整,要把授课内容写成教材,我的重度拖延症一直让这些许
愿没有结果,只有些默默的小变化。今年的课件地址在 [1] 欢迎有兴趣的同学来帮我
写课程笔记。
[1] http://www.cad.zju.edu.cn/home/zhx/csmath/doku.php?id=2015
--------
完整版 36条
http://ml.memect.com/archive/2015-03-19/long.html
m***r
发帖数: 359
25
机器学习日报 2015-03-06
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-06/short.html
1) 【踹不倒的谷歌大狗是怎样炼成的】 by @杨静Lillian
关键词:算法, 应用, 行业动态, 机器人, 杨强
【杨强】踹不倒的谷歌大狗是怎样炼成的? [1] 不管马克的谷歌大狗能做出多少动作
,它都并不真正具有智能:它的整个“头脑”,都是在算法控制下,计算如何保持平衡
而已。下面就让我们跟着杨强教授的分析,像拆穿魔术一样,来揭开踹不倒的谷歌大狗
的真面目吧!
[1] http://weibo.com/p/1001603817391019661074
2) 【DeepDive Open Datasets】 by @爱可可-爱生活
关键词:自然语言处理, 教育网站
[数据集] DeepDive Open Datasets [1] 经Stanford CoreNLP标注处理过的大型文本数
据集,包括PubMed、BioMed、PLOS、Google Patents和Wikipedia等,对于NLP研究的价
值不言而喻,强烈推荐
[1] http://deepdive.stanford.edu/doc/opendata/
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1epwa3a211wj20yn4pj1ky.jpg
3) 【NICAR15上的报告,总结文本可视化】 by @爱可可-爱生活
关键词:资源, 自然语言处理, Nick Diakopoulos, 幻灯片, 可视化
[幻灯]《From Words to Pictures: Text Analysis and Visualization》 [1] Nick
Diakopoulos在NICAR15上的报告,总结文本可视化的最新样式和主要技术流程, 非常
棒! 云: [2]
[1] http://www.nickdiakopoulos.com/wp-content/uploads/2015/03/From-words-to-pictures_text-analysis-and-visualization_diakopoulos.pptx
[2] http://pan.baidu.com/s/1jGvdwOI
4) 【张雨石的《卷积神经网络》】 by @爱可可-爱生活
关键词:经验总结, 入门, 深度学习, 算法, Yann Lecun, 博客, 神经网络, 张雨石
张雨石 @zyx_1991 写的《卷积神经网络》 [1] 不错的科普文,推荐给打算入门CNN的
朋友
[1] http://blog.csdn.net/stdcoutzyx/article/details/41596663
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1epvst2h6xgj213jac44qs.jpg
5) 【采用Torch用深度学习网络理解NLP】 by @网路冷眼
关键词:深度学习, 算法, 自然语言处理, 神经网络
【Facebook AI Research on Understanding Natural Language with Deep Neural
Networks Using Torch】 [1] 采用Torch用深度学习网络理解NLP,来自Facebook 人工
智能的文章。转需!
[1] http://devblogs.nvidia.com/parallelforall/understanding-natural-language-deep-neural-networks-using-torch/
--------
完整版 38条
http://ml.memect.com/archive/2015-03-06/long.html
m***r
发帖数: 359
26
机器学习日报 2015-03-07
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-07/short.html
1) 【52nlp上HMM相关文章索引】 by @52nlp
关键词:算法, HMM
HMM系列文章是52nlp上访问量较高的一批文章,这里做个索引,方便大家参考。 [1] [
2]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203765668&idx=1&sn=e0899d1267bf728b2a4b2de1869e0d06#rd
[2] http://www.52nlp.cn/hmm%E7%9B%B8%E5%85%B3%E6%96%87%E7%AB%A0%E7%B4%A2%E5%BC%95
2) 【TKDE: Tweet分割和在NER上的应用】 by @AixinSG
关键词:资源, 自然语言处理, PDF
Our paper "Tweet Segmentation and Its Application to Named Entity
Recognition" is featured on TKDE website [1] from the February 2015 issue.
Free download at [2]
[1] http://www.computer.org/web/tkde
[2] http://www.computer.org/cms/Computer.org/transactions/tkde/pdfs/tkde_featured.pdf
3) 【音乐文件聚类和可视化】 by @爱可可-爱生活
关键词:语音, Python, 可视化
[文章]《Mapping Your Music Collection》 [1] Python下对MP3音乐文件聚类和可视
化,涉及音频特征抽取、特征选择和面向可视化的聚类分析,很好的学习范例
[1] http://www.christianpeccei.com/musicmap/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1epwt4i948wj20ke6swx6q.jpg
4) 【Jürgen Schmidhuber在Reddit上的AMA】 by @爱可可-爱生活
关键词:经验总结, 经验
[Reddit]《I am Jürgen Schmidhuber, AMA!》 [1] Jürgen Schmidhuber在Reddit上
的AMA(Ask Me Anything)主题,有不少RNN和AI、ML的干货内容,关于开源&思想&方法&
建议……耐心阅读,相信你也会受益匪浅
[1] http://www.reddit.com/r/MachineLearning/comments/2xcyrl/i_am_j%C3%BCrgen_schmidhuber_ama/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1epwouq4cjpj20rtrca4r9.jpg
5) 【学术种子网站AcademicTorrents】 by @阳志平1949
关键词:资源, 自然语言处理, 学术搜索
【学术种子网站:AcademicTorrents】成G上T的学术数据,HN近期热议话题,一般人不
告诉TA [偷笑] 主题涉及机器学习、NLP、SNA等。下载最简单的方法,通过BT软件,
RSS订阅各集合即可: [1]
[1] http://academictorrents.com/collections.php
--------
完整版 31条
http://ml.memect.com/archive/2015-03-07/long.html
m***r
发帖数: 359
27
机器学习日报 2015-03-08
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-08/short.html
1) 【机器学习中距离和相似性度量方法】 by @陈晓鸣在硅谷
关键词:相似度量
《漫谈:机器学习中距离和相似性度量方法》 [1] 真不错!通俗易懂,温故知新~ 主
要介绍机器学习和数据挖掘中一些常见的距离公式,包括: 闵可夫斯基距离 欧几里得
距离 曼哈顿距离 切比雪夫距离 马氏距离 余弦相似度 皮尔逊相关系数 汉明距离 杰
卡德相似系数 编辑距离 DTW 距离 KL 散度
[1] http://dataunion.org/11710.html
2) 【机器学习ML简史】 by @数盟社区
关键词:Blaise Pascal, Von Leibniz
【译文:机器学习ML简史】在科学技术刚刚萌芽的时候,科学家Blaise Pascal和Von
Leibniz就想到了有朝一日能够实现人工智能。即让机器拥有像人一样的智能。机器学
习是AI中一条重要的发展线,在工业界和学术界都异常火爆。 [1]
[1] http://dataunion.org/11672.html
3) 【Peter Norvig解决编程问题的机器学习】 by @网路冷眼
关键词:算法, Peter Norvig
【解决编程问题的机器学习】 [1] 这是Peter Norvig在SPLASH上所做的KeyNotes,使
用机器学习技术解决更一般的软件问题,以帮助编程老手和新手。Peter Norvig是
Google研究院院长,曾是Google核心搜索算法组主任,人工智能大牛。干货!用机器学
习解决码农的编程问题,建议大家看看!
[1] http://www.infoq.com/presentations/machine-learning-general-programming
4) 【欧洲人脑计划改变其治理结构】 by @金连文
关键词:神经科学
Nature日前报道:欧洲人脑计划(HBP)解散了三人执委,改变其治理结构 ( [1] 。总金
额10亿欧元的HBP自提出以来争议不断,特别是认知神经科学界的质疑 (Nature去年两
篇相关报道: [2] , [3] 。在未来的HBP中,Neuroscience的声音是否要比ICT的大?
[1] http://www.nature.com/news/human-brain-project-votes-for-leadership-change-1.17060)
[2] http://www.nature.com/news/neuroscience-where-is-the-brain-in-the-human-brain-project-1.15803
[3] http://www.nature.com/news/row-hits-flagship-brain-plan-1.15519)
5) 【Hopfield Neural Networks为什么没有人提了呢?】 by @西瓜大丸子汤
关键词:算法, 简报, 神经网络
Hopfield Neural Networks和SOM这样的好东西,为什么没有人提了呢?机器学习日报5
个月了,没有见到提到一次,真的是前浪死在沙滩上了么?
--------
完整版 24条
http://ml.memect.com/archive/2015-03-08/long.html
m***r
发帖数: 359
28
机器学习日报 2015-03-09
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-09/short.html
1) 【孟凡东CNN用于机器翻译】 by @鲁东东胖
关键词:深度学习, 算法, 资源, PDF, 论文, 神经网络
#DL4NLP @Noah # 第一弹: 介绍下 @孟凡东_ICTNLP 的出色工作 ( [1] ),我们把
来自target的attention signal加入source encoding CNN的输入,得到了比BBN的模型
好的多neural network joint model (一个点的BLEU值提升), 这是和计算所 @刘群MT-
to-Death 老师的合作项目的初期工作的一部分
[1] http://arxiv.org/pdf/1503.01838v1.pdf
2) 【文本挖掘揭开印度菜的美味秘诀】 by @爱可可-爱生活
关键词:自然语言处理, 论文
[论文]《Spices form the basis of food pairing in Indian cuisine》A Jain, G
Bagler (2015) [1] 揭开印度菜的美味秘诀——通过对大量食谱原料关系的挖掘,发现
印度菜美味的原因之一是其中的味道互相冲突,很有趣的文本挖掘研究
[1] http://arxiv.org/abs/1502.03815
3) 【机器学习中导数最优化方法】 by @数盟社区
关键词:经验总结, 博客
【机器学习中导数最优化方法(基础篇)】 @迅猛龙Daniel 这篇博客主要总结一下使用
导数的最优化方法的几个基本方法,梳理梳理相关的数学知识,本人也是一边写一边学
,如有问题,欢迎指正,共同学习,一起进步。 [1]
[1] http://dataunion.org/11752.html
4) 【幂律分布】 by @iB37
关键词:资源, 自然语言处理, PDF, 教育网站, 齐夫, 语言学
#幂律分布# 1)词频与其降序排序的关系,最著名的是语言学家齐夫(Zipf,1902-1950)
1949年提出的Zipf‘s law,即二者成反比关系. 曼德勃罗(Mandelbrot,1924- 2010)引
入参数修正了对甚高频和甚低频词的刻画 2)Heaps' law: 词汇表与语料规模的平方根(
这是一个参数,英语0.4-0.6)成正比 [1]
[1] http://www.ccs.neu.edu/home/ekanou/ISU535.09X2/Handouts/Review_Material/zipfslaw.pdf
5) 【梯度下降算法的交互式演示】 by @网路冷眼
关键词:算法
【梯度下降算法的交互式演示】 [1] 点击功能图添加特性,至少要加入2个特性才能开
始动画。附matlib源代码。转需!
[1] http://lukaszkujawa.github.io/gradient-descent.html
--------
完整版 40条
http://ml.memect.com/archive/2015-03-09/long.html
m***r
发帖数: 359
29
机器学习日报 2015-03-10
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-10/short.html
1) 【如何评价季逸超、Peak Labs 和 Magi 搜索引擎?】 by @熊辰炎
关键词:知识工程, 季逸超, 知识库
我在 @知乎 回答了【如何评价季逸超、Peak Labs 和 Magi 搜索引擎?】:谢邀。 这
应该是在知乎最适合我的一道题目。趁着失眠来答一部分。 利益相关: 我是做知识图
谱和搜索的PhD,我之前一半的funding来自CMU机器学习系的never ending lang… [1]
[1] http://zhi.hu/gsnY
2) 【机器学习交互速查表】 by @爱可可-爱生活
关键词:资源, 课程, 速查卡
[速查] 机器学习交互速查表 [1] Scikit-Learn官网提供,在原有的Cheat Sheet基础
上加上了Scikit-Learn相关文档的链接,方便浏览
[1] http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
3) 【尚利峰:短文本自动回复系统】 by @鲁东东胖
关键词:算法, 自然语言处理, 论文, 神经网络
#DL4NLP @Noah # 第二弹: 介绍下 @尚利峰_FUNG 的工作 Neural Responding
Machine( [1] ), 我们在一个general的neural encoder-decoder 框架下设计了一个
对任意短文本自动生成回复的系统, 效果超越了我们之前的retrieval-based的系统
[1] http://arxiv.org/abs/1503.02364
4) 【深度学习的全面硬件指南】 by @爱可可-爱生活
关键词:深度学习, GPU
[文章]《A Full Hardware Guide to Deep Learning》 [1] 深度学习的全面硬件指南
,从GPU到RAM、CPU、SSD、PCIe
[1] https://timdettmers.wordpress.com/2015/03/09/deep-learning-hardware-
guide/
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1eq0iityr5lj20kta1te83.jpg
5) 【行人检测进展及数据集】 by @RocKof
关键词:视觉
各种行人数据库 [1]
[1] http://www.52ml.net/17004.html
--------
完整版 24条
http://ml.memect.com/archive/2015-03-10/long.html
m***r
发帖数: 359
30
机器学习日报 2015-03-11
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-11/short.html
1) 【如何看待Deepmind将研发能玩《毁灭战士1》的AI】 by @winsty
关键词:深度学习, 资源, Naiyan Wang, 幻灯片
我在 @知乎 回答了【如何看待Deepmind将研发能玩《毁灭战士1》的AI?】:说好的要
来更新,拖延症了下-.- 先来分享下我上周组会的slides: Naiyan Wang -
Miscellaneous 。 几点insight我愿意在这里再重复一遍: 1. 我个… [1]
[1] http://zhi.hu/gY0q
2) 【cxxnet实现深度神经网络】 by @phunter_lau
关键词:深度学习, 算法, 代码, 段子, 神经网络
《皮老师有话说》系列之三《蛋蛋和皮老师新论文》使用了深度学习方法在网页图片上
快速判断众多下载按钮中那个才是真的,附送测试数据集截图一张,请各位人类测试自
己能否在五秒之内判断哪个是真正的下载。该工作用到 @antinucleon 的cxxnet实现深
度神经网络,github传送门在 [1]
[1] https://github.com/antinucleon/cxxnet
3) 【神经网络C++教程】 by @网路冷眼
关键词:经验总结, 算法, 资源, 博客, 课程, 神经网络
【神经网络C++教程】 [1] 神经网络很好玩。本文介绍了用可调节梯度下降和可调节动
量法设计和编码经典BP神经网络,网络经过训练可以做出惊人和美妙的东西出来。要了
解更多的知识,可以访问作者的博客: [2] @2gua @伯乐头条 @Linux中国 @CSDN_CODE
@好东西传送门
[1] https://vimeo.com/19569529
[2] http://millermattson.com/dave/
4) 【神经科学碰撞人工智能】 by @安人心智
关键词:视觉, 论文, 神经科学
【神经科学碰撞人工智能】在脸部识别上你我都是专家,即使细微的差别也能辨认。研
究已证明人类和灵长类动物在面部加工上不同于其他物种,人类使用梭状回面孔区(
FFA)。Khaligh-Razavi等通过计算机模拟出人脸识别的FFA活动,堪称神经科学与人工
智能的完美结合。详情: [1]
[1] http://arxiv.org/abs/1502.01241
5) 【神经网络选择参考表】 by @爱可可-爱生活
关键词:深度学习, 算法, 神经网络
[文章]《How to Choose a Neural Network》 [1] deeplearning4j官网提供的实际应
用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
[1] http://deeplearning4j.org/neuralnetworktable.html
--------
完整版 28条
http://ml.memect.com/archive/2015-03-11/long.html
相关主题
神经网络原理这门课对统计重要么 (转载)机器学习日报2015年2月楼
今年的 ILSVRC 2014 结果大数据日报 2015年2月楼
机器学习周报 2015-03-15有考虑回国发展的同学吗?招大量咨询师、大数据机器学习、算法、神经网络、自然语言工程师...
进入DataSciences版参与讨论
m***r
发帖数: 359
31
机器学习日报 2015-03-12
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-12/short.html
1) 【中英文维基百科语料上的Word2Vec实验】 by @52nlp
关键词:自然语言处理, 主题模型
中英文维基百科语料上的Word2Vec实验: 最近利用gensim word2vec模块在中英文维基
百科语料上分别测试了一下word2vec,记录一下实验的过程,欢迎观摩 [1]
[1] http://www.52nlp.cn/?p=8198
2) 【extreme learning machines】 by @黄广斌-ELM
关键词:算法, 资源, PDF, 教育网站, 神经网络
ELM的主要目的是使机器学习同时达到高准确度,较少的人工干预和实时学习。和过去
几十年传统的神经网络算法和理论信条相反,ELM理论显示隐层节点很重要但许多种神
经网络的隐层节点是不需要调整的, 是和应用无关的,其中一种方法是隐层节点随机
产生。在ELM体系中还有核节点等等。 [1]
[1] http://www.ntu.edu.sg/home/egbhuang/pdf/ELM-Suvey-Huang-Gao.pdf
3) 【黑客之概率编程及贝叶斯方法】 by @网路冷眼
关键词:资源, 代码, 课程, 统计
【黑客之概率编程及贝叶斯方法】 [1] 与其它介绍这两方面知识的教程不同,本文以
计算/理解第一,数学第二的视角介绍贝叶斯方法和概率编程。GitHub托管地址: [2]
转需! @52nlp @统计之都 @数盟社区 @爱可可-爱生活 @好东西传送门 @南非蜘蛛 @丕
子 @老师木
[1] https://camdavidsonpilon.github.io/Probabilistic-Programming-and-
Bayesian-Methods-for-Hackers/
[2] https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-
Bayesian-Methods-for-Hackers
4) 【图像中的卷积概念】 by @视觉机器人
关键词:经验总结, 深度学习, 视觉, 博客
欢迎讨论:信号处理中的卷积是指一个信号与另一个信号反转之后的信号求相关,可参
考维基百科的图。而图像中各种文档有时候卷积是指两个图像求正向的相关,而不是翻
转后求相关。实际上图像中也有相关算子、卷积算子,如博文 [1] 的描述,其相关和
卷积的两张图很形象
[1] http://www.cnblogs.com/pegasus/archive/2011/05/19/2051416.html
5) 【DL4NLP at Noah Deep matching model】 by @鲁东东胖
关键词:会议活动, 自然语言处理, NIPS, 会议, 机器翻译, 论文
#DL4NLP @Noah # 第三弹: 介绍我们在deep matching model上的系列工作以及其在短
文本对话和MT上的应用(包含NIPS14的文章),由 @轩轩_ICT_NLP @户保田 @涂兆鹏
等完成,是和 @刘群MT-to-Death @清才HIT 老师合作的成果, arXiv链接: [1] , [
2] , [3]
[1] http://arxiv.org/abs/1503.02357
[2] http://arxiv.org/abs/1503.02427
[3] http://arxiv.org/abs/1503.03244
--------
完整版 38条
http://ml.memect.com/archive/2015-03-12/long.html
m***r
发帖数: 359
32
机器学习日报 2015-03-13
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-13/short.html
1) 【多智能自然语言处理】 by @刘知远THU
关键词:深度学习, 自然语言处理, 问答系统, 赵东岩, 周明
计算机学会通讯2015年第3期专题是周明老师和赵东岩老师主持的《多智能自然语言处
理》,很多有意思的文章,例如 深度学习在自然语言处理中的应用,基于社会媒体的
预测技术,从问答系统看知识智能,拥抱社会智能,等等。 [1]
[1] http://www.ccf.org.cn/sites/ccf/jsjtbbd.jsp?contentId=2851766225495
2) 【计算机辅助翻译推荐作者】 by @青鸟leo翻译之声
关键词:资源, 自然语言处理, 崔启亮, 机器翻译, 钱多秀, 书籍, 王华树, 王华伟,
徐彬, 闫栗丽, 张霄军, 周兴华
计算机辅助翻译方面的书籍和论文,请搜索作者:崔启亮、徐彬、钱多秀、张霄军、王
华树、王华伟、闫栗丽、周兴华、王正、张政、穆雷等。 @翻译驴 推荐 机器翻译方面
,可以走马观花看《统计机器翻译》《统计自然语言处理》
3) 【FaceNet人脸识别】 by @爱可可-爱生活
关键词:视觉, 算法, 聚类, 论文
[论文]《FaceNet: A Unified Embedding for Face Recognition and Clustering》 [
1] Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in
the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别
和聚类
[1] http://arxiv.org/abs/1503.03832
4) 【霍威教授谈NLP发展趋势】 by @高立琦
关键词:自然语言处理, 霍威
[1] 转:专访卡内基梅隆大学爱德华•霍威教授。霍威教授谈NLP发展趋势。
[1] http://mp.weixin.qq.com/s?__biz=MjM5MTY5ODE4OQ==&mid=203749937&idx=4&sn=ffac1811c05083cf9b99e9bd78efd9bd&scene=1&from=groupmessage&isappinstalled=0#rd
5) 【MLlib中的Random Forests和Boosting】 by @CSDN云计算
关键词:经验总结, 算法, Joseph Bradley, Spark, 博客, 集成学习
【MLlib中的Random Forests和Boosting】本文来自Databricks公司网站的一篇博客文
章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和
Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些
简单的例子并建议该从何处上手。 [1]
[1] http://www.csdn.net/article/2015-03-11/2824178
--------
完整版 32条
http://ml.memect.com/archive/2015-03-13/long.html
m***r
发帖数: 359
33
机器学习日报 2015-03-14
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-14/short.html
1) 【LINE模型大规模网络降维公布论文以及源代码】 by @chuckpku
关键词:应用, 社交网络
我们的论文“LINE: Large-scale Information Network Embedding”被WWW2015接收。
该论文提出的LINE模型能够在单机上把大规模网络降维到低维空间表示,稍后我们将公
布论文以及源代码 @张铭PKUCS
2) 【概率图模型基础总结】 by @数盟社区
关键词:算法
【概率图模型基础总结】在这一过程中,模型往往是必须的,什么样的模型才是相对正
确的?这又是我们需要解决的问题。这些问题出现在很多领域,包括模式识别、差错控
制编码等。概率图模型是解决这些问题的工具之一。 [1]
[1] http://dataunion.org/12187.html
3) 【Sum-Product Networks】 by @爱可可-爱生活
关键词:深度学习, Pedro Domingos, 教育网站
[论文+代码] Sum-Product Networks(SPN) —— 华盛顿大学Pedro Domingos团队的DNN
,提供论文和实现代码 [1]
[1] http://spn.cs.washington.edu/index.shtml
4) 【IJCV 综述:图模型中的离散能量最小化】 by @赵家平USC
关键词:会议活动, 深度学习, 视觉, 自然语言处理, CVPR, 会议, 主题模型
IJCV 综述文章:Discrete energy minimization in graphical model [1] graphical
model 就是10年前的deep learning, 但它的难点是 inference, especially in the
presense of high-order cliques. 目前 inference仍然是CVPR的hot topics.
[1] http://link.springer.com/article/10.1007/s11263-015-0809-x
5) 【Stanford基于神经网络的自然语言依存关系解析器】 by @爱可可-爱生活
关键词:算法, 自然语言处理, 教育网站, 神经网络
[开源] Neural Network Dependency Parser [1] 基于神经网络的自然语言依存关系解
析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于
《A Fast and Accurate Dependency Parser Using Neural Networks》http://weibo.com/1402400261/C5SLzz84Z 思路实现
[1] http://nlp.stanford.edu/software/nndep.shtml
--------
完整版 28条
http://ml.memect.com/archive/2015-03-14/long.html
m***r
发帖数: 359
34
机器学习日报 2015-03-15
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-15/short.html
1) 【NICAR15主题报告Hands-on with machine learning】 by @爱可可-爱生活
关键词:入门, Chase Davis, 代码
[文章]《Hands-on with machine learning》 [1] Chase Davis在NICAR15上的主题报
告材料,用Scikit-Learn做监督学习的入门例子
[1] https://github.com/cjdd3b/nicar2015/tree/master/machine-learning
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eq638t357fj20os317qv5.jpg
2) 【《七周七并发模型》】 by @睡眼惺忪的小叶先森
关键词:架构, 资源, Spark, 书籍
《Seven Concurrency Models in Seven Weeks》感觉还不错啊。看到Concurrency
enables resilient, or fault-tolerant, software through independence and
fault detection.就想起了Spark里的RDD[嘻嘻] [1] [2] @skyline09_ @囧囧有神的小
杜霉女 @armsword
[1] http://download.csdn.net/detail/u011399549/8006943
[2] http://product.china-pub.com/3771014
3) 【两个R语言教程】 by @2gua
关键词:经验总结, 资源, Python, R语言, 博客, 课程, 数据科学
推荐两个R语言Tutorial,官网的: [1] ,还有: [2] 。再来一篇Python数据分析的
: [3] 。最后来看看这篇「Data Science, Data Analysis, R and Python」 [4] 比
较干,超值超量...[喵喵] @网路冷眼 @好东西传送门 @伯乐头条 @Linux中国
[1] http://cran.r-project.org/doc/manuals/R-intro.html
[2] http://cyclismo.org/tutorial/R/
[3] http://www.datacommunitydc.org/blog/2013/07/python-for-data-analysis-the-landscape-of-tutorials/
[4] http://www.r-bloggers.com/data-science-data-analysis-r-and-python/
4) 【经典老文Fast unfolding of communities in large networks】 by @爱可可-爱
生活
关键词:算法, 应用, 论文, 社交网络
[论文]《Fast unfolding of communities in large networks》VD Blondel, JL
Guillaume, R Lambiotte (2008) [1] 经典老文,复杂网络社区发现的高效算法,
Gephi中的Community detection即基于此 主页: [2] 源码: [3]
[1] http://arxiv.org/abs/0803.0476
[2] https://perso.uclouvain.be/vincent.blondel/research/louvain.html
[3] http://pan.baidu.com/s/1dD3vwFf
5) 【用PageRank计算世界杯参赛球队排行榜】 by @爱可可-爱生活
关键词:应用, PageRank, 论文, 信息检索
[论文]《PageRank Approach to Ranking National Football Teams》V Lazova, L
Basnarkov (2015) [1] 通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛
球队排行榜
[1] http://arxiv.org/abs/1503.01331
--------
完整版 28条
http://ml.memect.com/archive/2015-03-15/long.html
m***r
发帖数: 359
35
机器学习日报 2015-03-16
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-16/short.html
1) 【神经网络语言模型】 by @火光摇曳Flickering
关键词:深度学习, 算法, 自然语言处理, Geoffrey Hinton, 神经网络
[我们是这样理解语言的-3]神经网络语言模型 | 火光摇曳 本文根据神经网络的发展历
程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003
]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变
形。 [1]
[1] http://t.jiathis.com/7tzZg
2) 【利用文本和可读性特征分类垃圾邮件】 by @iB37
关键词:会议活动, 算法, 资源, 自然语言处理, ICDM, PDF, SVM, 会议, 集成学习
经典问题的新研究:利用文本和可读性特征分类垃圾邮件。 [1] Classifying Spam
Emails using Text and Readability Features [Shams & Mercer,ICDM'13] 1)三组
特征:传统的(如垃圾词),文本的(如tf-idf),可读性的(如简单词)。2)五个
算法:RF,AdaBoost,Bagging,SVM,NB
[1] http://www.elg.uottawa.ca/~nat/Courses/csi5387_Winter2014/paper13.pdf
3) 【Kaggle脑控计算机交互(BCI)竞赛】 by @爱可可-爱生活
关键词:Kaggle, Python, 代码
[代码] BCI Challenge @ NER 2015 —— Kaggle脑控计算机交互(BCI)竞赛( [1] )优
胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参
赛框架的绝佳实例 [2]
[1] https://www.kaggle.com/c/inria-bci-challenge
[2] https://github.com/alexandrebarachant/bci-challenge-ner-2015
长微博图:http://ww1.sinaimg.cn/large/5396ee05gw1eq7rcizxroj20l48661kz.jpg
4) 【IPOL(在线图像处理)开放的科学和可重复的研究期刊】 by @视觉机器人
关键词:视觉, 算法, 自然语言处理
这个网站不错 [1] 。IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇
文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的
。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术
之间的距离。感谢 @命运规划部长
[1] http://www.ipol.im/
5) 【AAAI知识表示与推理研讨会会议安排】 by @王威廉
关键词:会议活动, 深度学习, AAAI, Antoine Bordes, David Mcallester, Doug
Lenat, Gary Marcus, Geoffrey Hinton, Jerry Hobbs, Josh Tenenbaum, Leon
Bottou, Percy Liang, Peter Clark, William Cohen, 会议, 活动
下周在斯坦福的AAAI知识表示与推理研讨会真是高朋满座:Peter Clark, William
Cohen, Geoff Hinton, Doug Lenat, Josh Tenenbaum, Antoine Bordes, Leon Bottou
, Percy Liang, Jerry Hobbs, David McAllester, Gary Marcus... 主题是结合传统
符号AI与统计机器学习AI。会议安排: [1]
[1] https://sites.google.com/site/krr2015/home/schedule
--------
完整版 36条
http://ml.memect.com/archive/2015-03-16/long.html
m***r
发帖数: 359
36
机器学习日报 2015-03-17
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-17/short.html
1) 【深度学习系统cxxnet V2】 by @陈天奇怪
关键词:深度学习, 算法, 代码, 神经网络
发布深度学习系统cxxnet V2,和小伙伴 @李沐M @antinucleon @winsty 完成,文章解
析了简洁高效神经网络的技术细节。代码 [1] [2]
[1] https://github.com/dmlc/cxxnet
[2] http://weibo.com/p/1001603821399843149639
2) 【加密数据高效分类问题】 by @爱可可-爱生活
关键词:算法, 分类
[论文]《Machine learning classification over encrypted data》R Bost, RA Popa
, S Tu, S Goldwasser (2014) [1] 出自MIT,研究加密数据高效分类问题
[1] http://eprint.iacr.org/2014/331
3) 【一个不错的自然语言处理词典】 by @52nlp
关键词:资源, 自然语言处理, Bill Wilson, 教育网站, 课程
一篇老文:一个不错的自然语言处理词典 [1] 作者Bill Wilson是澳大利亚新南威尔士
大学的一名教授,因为开了一门人工智能课程,就为这门课程分别编制了Prolog,人工
智能,机器学习, 自然语言处理的相关术语词典,这几个词典建于1998年,最后更新好
像在2012年 [2]
[1] http://www.52nlp.cn/?p=3019
[2] http://www.cse.unsw.edu.au/~billw/nlpdict.html
4) 【新加坡LV实验室的神经网络并行框架Purine】 by @m1nl1n
关键词:深度学习, 算法, Lin Min, 代码, 论文, 神经网络
@Shuicheng_YAN 新加坡LV实验室的神经网络并行框架Purine [1] 在Github [2] 上开
源了。支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加
速。12块Titan 20小时可以完成Googlenet的训练。
[1] http://arxiv.org/abs/1412.6249
[2] https://github.com/purine/purine2
5) 【机器学习及计算机视觉资源大全】 by @网路冷眼
关键词:视觉, 资源, Zheng Rui, 课程
#干货共享#【机器学习及计算机视觉资源大全】 [1] 囊括了机器学习机计算机视觉的
书籍、论 文、教程和课程多方面资料,收录了国人的资料。转需! @2gua @伯乐头条
@Linux中国 @极客头条
[1] http://zhengrui.github.io/zerryland/ML-CV-Resource.html
长微博图:http://ww4.sinaimg.cn/large/663aa05ajw1eq8g2jtem7j20or1v1e58.jpg
--------
完整版 36条
http://ml.memect.com/archive/2015-03-17/long.html
m***r
发帖数: 359
37
机器学习日报 2015-03-18
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-18/short.html
1) 【WSDM 2015总结】 by @唐杰THU
关键词:会议活动, 资源, 自然语言处理, Michael Franklin, PDF, WSDM, 会议
WSDM 2015结束,推荐大家一个黄老师等人领衔写的总结。 [1] 今年我们做了论文评审
的A/B test (分给不同组评审),录用率仅16%。邀请了加州伯克利的Michael Franklin
,Facebook的Lada,康奈尔的Thorsten等人做keynote。今年还有winter school,很是
卖座,还用了 @刘知远THU 的关键词抽取
[1] http://www.ccf.org.cn/resources/1190201776262/2015/03/12/16.pdf
2) 【WebChild从网页内容构建细粒度三元组知识库】 by @iB37
关键词:会议活动, 算法, 知识工程, 资源, PDF, WSDM, 会议, 知识库
WebChild: Harvesting and Organizing Commonsense Knowledge from the Web [1]
【Tandon et al,WSDM’14】从网页内容构建细粒度三元组知识库,准确率过80%,覆盖
率四百万已消岐断言。算法:半监督标签传播。辅助:WordNet。PS:WebChild,Child
of the Web的意思吗。
[1] http://gerard.demelo.org/papers/webchild.pdf
3) 【深度学习在自然语言处理中的应用(刘树杰 等)】 by @中国计算机学会CCF
关键词:深度学习, 算法, 自然语言处理, 董力, 刘树杰, 神经网络, 张家俊
【CCCF专题】《深度学习在自然语言处理中的应用》作者:刘树杰、董力、张家俊等。
深度学习是近年来机器学习领域发展最为迅速的领域。严格来说,深度学习并不是一种
全新的机器学习方法,而是基于深层神经网络的学习方法的别称。[赞] @董力at北航 @
张家俊MT [1]
[1] http://weibo.com/p/1001603821808741689173
4) 【轨迹数据挖掘综述】 by @郑宇MSRA
关键词:资源, PDF, 异常检测
从事轨迹数据挖掘快十年,近期重新梳理这个领域的各个环节,综述了轨迹预处理、查
找、轨迹聚类、分类、轨迹模式发现和异常检测等方面的关键技术、前沿工作和应用场
景,并整理了现有公开轨迹数据集。方便大家理清轨迹数据挖掘脉络,并快速定位解决
问题的方法。 [1]
[1] http://research.microsoft.com/pubs/241453/TrajectoryDataMining-tist.pdf
5) 【genCNN自然语言生成】 by @鲁东东胖
关键词:深度学习, 自然语言处理, 机器翻译, 论文
#DL4NLP @Noah # 第四弹:我们提出了genCNN, 一种新的用于自然语言生成的
convolutional architecture, 在测试的数据集上取得了优于LSTM的效果(perplexity
以及 n-best re-ranking for MT),arXiv链接( [1] )。 @轩轩_ICT_NLP 的工作
, 来自和 @刘群MT-to-Death 老师的合作
[1] http://arxiv.org/abs/1503.05034
--------
完整版 47条
http://ml.memect.com/archive/2015-03-18/long.html
m***r
发帖数: 359
38
机器学习日报 2015-03-19
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-19/short.html
1) 【机器学习日报搜索】 by @好东西传送门
关键词:深度学习, 视觉, 应用, 资源, 自然语言处理, 幻灯片, 简报, 信息检索
回顾一下过去半年机器学习日报报道了哪些好东西:深度学习676条 [1] 自然语言处理
518条 [2] 视觉398条 [3] 书籍158本 [4] PDF 203个 [5] 幻灯片88张 [6] 您需要的
,都在机器学习日报搜索
[1] http://ml.memect.com/search/?q=tag:%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0
[2] http://ml.memect.com/search/?q=tag:%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86
[3] http://ml.memect.com/search/?q=tag:%E8%A7%86%E8%A7%89
[4] http://ml.memect.com/search/?q=tag:%E4%B9%A6%E7%B1%8D
[5] http://ml.memect.com/search/?q=tag:PDF
[6] http://ml.memect.com/search/?q=tag:%E5%B9%BB%E7%81%AF%E7%89%87
2) 【《文本上的算法》v3.0】 by @yanxionglu
关键词:算法, 资源, 自然语言处理, PDF, 代码
《文本上的算法》v3.0,下载地址: [1]
[1] https://github.com/yanxionglu/text_pdf
3) 【免费电子书《强化学习算法》】 by @爱可可-爱生活
关键词:深度学习, 算法, 资源, 书籍
[书]《Algorithms for Reinforcement Learning》Csaba Szepesvárii(艾伯塔大学)
(2010) [1] 免费电子书《强化学习算法》,对强化学习最新算法(比较简洁)的介绍和
比较。强化学习能否借着DeepMind引领的DNN+RL风潮强势回归? 云: [2]
[1] http://www.ualberta.ca/~szepesva/RLBook.html
[2] http://pan.baidu.com/s/1sjmId8D
4) 【12306 售票网站新版验证码识别对抗】 by @碳基体
关键词:语音, 行业动态
[1] 调用百度识图的接口识别12306验证码,这个思路让我想起了调用google的语音识
别接口识别验证码
[1] http://linux.im/2015/03/17/12306-new-captcha.html
5) 【计算机应用数学课件】 by @浙大张宏鑫
关键词:资源, 教育网站, 课程
说起来《计算机应用数学》已经是第十季了,很高兴授课的内容获得了些认可。每年自
己都许愿要做出内容重大调整,要把授课内容写成教材,我的重度拖延症一直让这些许
愿没有结果,只有些默默的小变化。今年的课件地址在 [1] 欢迎有兴趣的同学来帮我
写课程笔记。
[1] http://www.cad.zju.edu.cn/home/zhx/csmath/doku.php?id=2015
--------
完整版 36条
http://ml.memect.com/archive/2015-03-19/long.html
T********h
发帖数: 27
39
想用gephi做几个preferential attachment model的动画图以及带timeline的数据集的
图形,请大神们赐予我力量!
1 (共1页)
进入DataSciences版参与讨论
相关主题
求职求内推大数据日报 2015年3月楼
data scientist job openings at Workday[求建议] growth组值得去不, 做sde还是ds (转载)
神经网络原理这门课对统计重要么 (转载)所谓的大数据
今年的 ILSVRC 2014 结果欢迎加入“机器学习实践” 俱乐部
机器学习周报 2015-03-15DS需要会的手艺 真不少
机器学习日报2015年2月楼机器学习需要自己搞算法吗
大数据日报 2015年2月楼公司招DATA SCIENTIST
有考虑回国发展的同学吗?招大量咨询师、大数据机器学习、算法、神经网络、自然语言工程师...请推荐一个NLP的data set (转载)
相关话题的讨论汇总
话题: 关键词话题: 学习话题: 机器话题: 自然语言话题: 日报