F****3 发帖数: 1504 | 1 现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。
但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看
文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的?
问题可能很白,请牛人们见谅啊!!!
谢谢! |
e*******o 发帖数: 4654 | |
t****t 发帖数: 6806 | 3 老刑搞完了硬件版又上这儿来挖坑了?
【在 F****3 的大作中提到】 : 现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。 : 但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看 : 文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的? : 问题可能很白,请牛人们见谅啊!!! : 谢谢!
|
F****3 发帖数: 1504 | 4 谢谢你的建议,我就坚持用python。
【在 e*******o 的大作中提到】 : http://stackoverflow.com/questions/501062/whats-the-best-script : 你如果现在python 正在学,就用python。
|
s*******a 发帖数: 8827 | 5 perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。
而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积
木似的。
【在 F****3 的大作中提到】 : 现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。 : 但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看 : 文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的? : 问题可能很白,请牛人们见谅啊!!! : 谢谢!
|
y*******g 发帖数: 6599 | 6 其他语言也有regex库呀 硬写自己的规则的话估计还是c简单
【在 s*******a 的大作中提到】 : perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。 : 而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积 : 木似的。
|
s*******a 发帖数: 8827 | 7 但是perl的特别好用。比如可以表达 negative match
(?!) - Negative look ahead assertion foo(?!bar) matches foo when not
followed by bar
【在 y*******g 的大作中提到】 : 其他语言也有regex库呀 硬写自己的规则的话估计还是c简单
|
p*****2 发帖数: 21240 | |
c*********e 发帖数: 16335 | 9 en,用perl, cpan.org是个非常好的地方,你会发现好多人免费写的插件。perl是文本
处理之王,现在银行还用它,它非常简洁。
【在 s*******a 的大作中提到】 : perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。 : 而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积 : 木似的。
|
e*******o 发帖数: 4654 | 10 https://metacpan.org/favorite/leaderboard
排名前 100 的模块,都是精品。
目前metacpan 好些。不过都是基于PAUSE。
【在 c*********e 的大作中提到】 : en,用perl, cpan.org是个非常好的地方,你会发现好多人免费写的插件。perl是文本 : 处理之王,现在银行还用它,它非常简洁。
|
|
|
e*******o 发帖数: 4654 | 11 ruby 很多地方是借鉴perl,相当与perl的oo版。Larry Wall 本人也觉得ruby 对Perl
的威胁,比 python大。
关于Perl的OO,二爷可以看看 perl 的Moose(Perl 中排名最高的模块)。
【在 p*****2 的大作中提到】 : ruby的表达能力跟perl比怎么样
|
l*******s 发帖数: 1258 | 12 如果搞的东西要上production 建议还得用java之类的语言
perl、python是比较方便 但是速度啊 稳定性啊 兼容性之类的 恐怕离production的要
求还有些距离
比如我们组的一些老project用的perl 现在全部在换成java或者c#
还有个重要原因就是,NLP现在越来越多用到machine learning,这玩意还是java c++
之类的库比较多,perl和python之类的也有,但是用到production上,总是有些这样那
样的问题。
当然了,回到lz的问题,简单的text数据处理任务,python和perl挺好的。 |
F****3 发帖数: 1504 | 13 谢谢楼上给我的建议!!!
菜鸟弱问一下三个相关的问题:
1) Python的re package是不是没有perl的regular expression那么强大?
2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般
要看看cpan之类上面的别人的code才能入门。。。
3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢
谢! |
c*********e 发帖数: 16335 | 14 工作百分之99%是处理文本,那就学regular expression吧,大部份语言里都支持
regular expression的。
。谢
【在 F****3 的大作中提到】 : 谢谢楼上给我的建议!!! : 菜鸟弱问一下三个相关的问题: : 1) Python的re package是不是没有perl的regular expression那么强大? : 2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般 : 要看看cpan之类上面的别人的code才能入门。。。 : 3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢 : 谢!
|
F****3 发帖数: 1504 | 15 谢谢,请问要不要单独学perl呢?问题很弱,不好意思啊。。。
【在 c*********e 的大作中提到】 : 工作百分之99%是处理文本,那就学regular expression吧,大部份语言里都支持 : regular expression的。 : : 。谢
|
c*********e 发帖数: 16335 | 16 perl早就过气了,现在是java的天下,c#也凑合。
【在 F****3 的大作中提到】 : 谢谢,请问要不要单独学perl呢?问题很弱,不好意思啊。。。
|
F****3 发帖数: 1504 | 17 谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。
【在 c*********e 的大作中提到】 : perl早就过气了,现在是java的天下,c#也凑合。
|
e*******o 发帖数: 4654 | 18
Perl 比C# 麻烦。
你主要是先找门语言把基本概念搞清楚,以后用哪个语言再学就好了。
【在 F****3 的大作中提到】 : 谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。
|
z*******3 发帖数: 13709 | 19 ruby
【在 F****3 的大作中提到】 : 谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。
|
F****3 发帖数: 1504 | 20 谢谢你的建议,我先学好python吧。掌握了以后再学其他的,先不同时一起上。现在用
版上推荐的PyCharm学习积极性高,呵呵!
【在 e*******o 的大作中提到】 : : Perl 比C# 麻烦。 : 你主要是先找门语言把基本概念搞清楚,以后用哪个语言再学就好了。
|
|
|
F****3 发帖数: 1504 | 21 谢谢推荐,我google了"what is ruby good for"
http://ubuntuforums.org/archive/index.php/t-416082.html
这个文章是第一个结果,看了看讨论挺有意思的!
【在 z*******3 的大作中提到】 : ruby
|
z*******3 发帖数: 13709 | 22 我认为以你读master的智商,说什么“学”python是很掉价的事
python的学习也就是本科comp102里面四分之一课程搞定的事
我们现在就是这么教的,python+perl+htmlcssjavascript+c一门课
其中c有后续课程,其他三个木有
【在 F****3 的大作中提到】 : 谢谢推荐,我google了"what is ruby good for" : http://ubuntuforums.org/archive/index.php/t-416082.html : 这个文章是第一个结果,看了看讨论挺有意思的!
|
z*******3 发帖数: 13709 | 23 花两个星期“学”python,足够了
这个东西没有所谓的学好不好的问题
学得再好,这个语言的回字都只有一种写法
【在 F****3 的大作中提到】 : 谢谢你的建议,我先学好python吧。掌握了以后再学其他的,先不同时一起上。现在用 : 版上推荐的PyCharm学习积极性高,呵呵!
|
z*******3 发帖数: 13709 | 24 python的哲学是,回字只能有一种写法,而且是最简单的那种
perl和ruby的哲学是,回字应该有很多种写法,而且应该经常华山论回
java的哲学是,回字可以有很多种写法,我们大家一起商量决定标准写法
.net的哲学是,你不需要知道回字怎么写,让微软来帮你写,你知道给钱就行了
php的哲学是,回字这个东西,应该用最节省纸张的方式书写
然后大家都忘记了,最早回字其实是用c写的 |
l*******s 发帖数: 1258 | 25 我还是觉得 决定regex的不是某种编程语言 而是用regex的人
你需要的所有功能 我相信通过python都可以实现 而且好多包都可以用
有时候 没必要写一个老长老长一看就恶心的regex解决问题 分开做 更敏捷 更好维护
另外 python里面的nltk包 相信perl里没有对应的。这玩意可是集rule based、
machine learning、corpus于一体的NB包啊。你要是整天搞text处理,以后肯定用的上。
美国我知道的几个搞NLP的系,都用python做教学语言了
。谢
【在 F****3 的大作中提到】 : 谢谢楼上给我的建议!!! : 菜鸟弱问一下三个相关的问题: : 1) Python的re package是不是没有perl的regular expression那么强大? : 2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般 : 要看看cpan之类上面的别人的code才能入门。。。 : 3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢 : 谢!
|
g*****g 发帖数: 34805 | 26 选择语言的不二法则是看需要的库有没有,已经实现的相似应用都用啥。
regex本身几乎所有语言都有实现。 |
c****e 发帖数: 1453 | 27 能告诉我那个语言的regex不支持"?!"吗?
【在 s*******a 的大作中提到】 : 但是perl的特别好用。比如可以表达 negative match : (?!) - Negative look ahead assertion foo(?!bar) matches foo when not : followed by bar
|
z*******3 发帖数: 13709 | 28 连html都支持
【在 c****e 的大作中提到】 : 能告诉我那个语言的regex不支持"?!"吗?
|
F****3 发帖数: 1504 | 29 真是学了很多,太谢谢你们了!
现在正在看NLTK的书。封面是鲸鱼的那个,写的很通俗易懂:) |