由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 请推荐一个NLP的data set (转载)
相关主题
[Data Science Project Case] Parsing URLS求职求内推
恭喜开版,发个刚看到的好玩的machine learning的图data scientist job openings at Workday
机器学习日报2015年2月楼data scientist position
DS需要会的手艺 真不少求Google 的 Data Science 有关的位置内推 (转载)
机器学习需要自己搞算法吗python用起来没有matlab好使,尤其是数据处理
公司招DATA SCIENTIST机器学习日报 2015年3月楼
text mining中的relation extraction机器学习周报 2015-03-15
说说最近的一次面试,兼告诫国人求问一道关于NLP的面试题
相关话题的讨论汇总
话题: nlp话题: set话题: data
进入DataSciences版参与讨论
1 (共1页)
l***o
发帖数: 5337
1
【 以下文字转载自 Statistics 讨论区 】
发信人: letgo (过不沾衣), 信区: Statistics
标 题: 请推荐一个NLP的data set
发信站: BBS 未名空间站 (Tue Feb 25 19:27:25 2014, 美东)
想用一个不太大的data set(英语)看看一个算法的分词能力,能给推荐一个吗?谢谢
d****n
发帖数: 12461
2
试试Enron的Email Corpse?
https://www.cs.cmu.edu/~enron/
l*******s
发帖数: 1258
3
分词算法应该只对某些词之间没有界限的语言有效啊,比如汉语。
可以考虑Bake Off比赛
http://www.sighan.org/bakeoff2005/
上面有dataset,还有各个队伍的paper,都是很好的。大部分基于CRF或者MEMM之类的
1 (共1页)
进入DataSciences版参与讨论
相关主题
求问一道关于NLP的面试题机器学习需要自己搞算法吗
san bruno ds position公司招DATA SCIENTIST
工作机会 data scientist@experian datalab, San Diego (转载)text mining中的relation extraction
几个Data Scientist/NLP/Robotics/Visual Computing相关职位说说最近的一次面试,兼告诫国人
[Data Science Project Case] Parsing URLS求职求内推
恭喜开版,发个刚看到的好玩的machine learning的图data scientist job openings at Workday
机器学习日报2015年2月楼data scientist position
DS需要会的手艺 真不少求Google 的 Data Science 有关的位置内推 (转载)
相关话题的讨论汇总
话题: nlp话题: set话题: data