由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - perl的文本处理大部分容易在python里实现吗?
相关主题
Python, Java, Perl, PHP,Ruby请问哪有用python处理文本或者html的code
为什么一说文本处理就提perl如何用Python或者Perl抓取文本?
script language主要是干什么用的?有熟悉php的吗?问个文本处理
请问Python初学者怎么学如何把文字转换成机器可读形式?
现在哪些script最流行?CNN做NLP工程多吗?
python的问题,大拿帮忙看看请推荐 机器翻译 的rest API/open source package
python能检查出space是一个还是两个吗?Python日报 2015年2月楼
写Python 的苦恼之一:有人当c用,有人当bash用,有人当FP用。当然也有人当python用有没有谁做 text mining 的?
相关话题的讨论汇总
话题: perl话题: python话题: 文本处理话题: regex话题: 语言
进入Programming版参与讨论
1 (共1页)
F****3
发帖数: 1504
1
现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。
但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看
文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的?
问题可能很白,请牛人们见谅啊!!!
谢谢!
e*******o
发帖数: 4654
2
http://stackoverflow.com/questions/501062/whats-the-best-script
你如果现在python 正在学,就用python。
t****t
发帖数: 6806
3
老刑搞完了硬件版又上这儿来挖坑了?

【在 F****3 的大作中提到】
: 现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。
: 但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看
: 文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的?
: 问题可能很白,请牛人们见谅啊!!!
: 谢谢!

F****3
发帖数: 1504
4
谢谢你的建议,我就坚持用python。

【在 e*******o 的大作中提到】
: http://stackoverflow.com/questions/501062/whats-the-best-script
: 你如果现在python 正在学,就用python。

s*******a
发帖数: 8827
5
perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。
而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积
木似的。

【在 F****3 的大作中提到】
: 现在在学Python主要来做text processing,感觉很好学(正在学习,还不是很会)。
: 但是听说perl是专门用来处理文档的,历史悠久,有很多package。不知道是不是单看
: 文本处理和NLP这一块,在掌握python的基础上再另外学习perl还是有必要的?
: 问题可能很白,请牛人们见谅啊!!!
: 谢谢!

y*******g
发帖数: 6599
6
其他语言也有regex库呀 硬写自己的规则的话估计还是c简单

【在 s*******a 的大作中提到】
: perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。
: 而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积
: 木似的。

s*******a
发帖数: 8827
7
但是perl的特别好用。比如可以表达 negative match
(?!) - Negative look ahead assertion foo(?!bar) matches foo when not
followed by bar

【在 y*******g 的大作中提到】
: 其他语言也有regex库呀 硬写自己的规则的话估计还是c简单
p*****2
发帖数: 21240
8
ruby的表达能力跟perl比怎么样
c*********e
发帖数: 16335
9
en,用perl, cpan.org是个非常好的地方,你会发现好多人免费写的插件。perl是文本
处理之王,现在银行还用它,它非常简洁。

【在 s*******a 的大作中提到】
: perl的regex超好用的,我一条regex规则用c写的话可能就得上百行code才能做到。
: 而且cpan超强大,基本我所有想到的功能别人都帮我实现好了。用perl写东西就跟搭积
: 木似的。

e*******o
发帖数: 4654
10
https://metacpan.org/favorite/leaderboard
排名前 100 的模块,都是精品。
目前metacpan 好些。不过都是基于PAUSE。

【在 c*********e 的大作中提到】
: en,用perl, cpan.org是个非常好的地方,你会发现好多人免费写的插件。perl是文本
: 处理之王,现在银行还用它,它非常简洁。

相关主题
python的问题,大拿帮忙看看请问哪有用python处理文本或者html的code
python能检查出space是一个还是两个吗?如何用Python或者Perl抓取文本?
写Python 的苦恼之一:有人当c用,有人当bash用,有人当FP用。当然也有人当python用有熟悉php的吗?问个文本处理
进入Programming版参与讨论
e*******o
发帖数: 4654
11
ruby 很多地方是借鉴perl,相当与perl的oo版。Larry Wall 本人也觉得ruby 对Perl
的威胁,比 python大。
关于Perl的OO,二爷可以看看 perl 的Moose(Perl 中排名最高的模块)。

【在 p*****2 的大作中提到】
: ruby的表达能力跟perl比怎么样
l*******s
发帖数: 1258
12
如果搞的东西要上production 建议还得用java之类的语言
perl、python是比较方便 但是速度啊 稳定性啊 兼容性之类的 恐怕离production的要
求还有些距离
比如我们组的一些老project用的perl 现在全部在换成java或者c#
还有个重要原因就是,NLP现在越来越多用到machine learning,这玩意还是java c++
之类的库比较多,perl和python之类的也有,但是用到production上,总是有些这样那
样的问题。
当然了,回到lz的问题,简单的text数据处理任务,python和perl挺好的。
F****3
发帖数: 1504
13
谢谢楼上给我的建议!!!
菜鸟弱问一下三个相关的问题:
1) Python的re package是不是没有perl的regular expression那么强大?
2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般
要看看cpan之类上面的别人的code才能入门。。。
3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢
谢!
c*********e
发帖数: 16335
14
工作百分之99%是处理文本,那就学regular expression吧,大部份语言里都支持
regular expression的。

。谢

【在 F****3 的大作中提到】
: 谢谢楼上给我的建议!!!
: 菜鸟弱问一下三个相关的问题:
: 1) Python的re package是不是没有perl的regular expression那么强大?
: 2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般
: 要看看cpan之类上面的别人的code才能入门。。。
: 3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢
: 谢!

F****3
发帖数: 1504
15
谢谢,请问要不要单独学perl呢?问题很弱,不好意思啊。。。

【在 c*********e 的大作中提到】
: 工作百分之99%是处理文本,那就学regular expression吧,大部份语言里都支持
: regular expression的。
:
: 。谢

c*********e
发帖数: 16335
16
perl早就过气了,现在是java的天下,c#也凑合。

【在 F****3 的大作中提到】
: 谢谢,请问要不要单独学perl呢?问题很弱,不好意思啊。。。
F****3
发帖数: 1504
17
谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。

【在 c*********e 的大作中提到】
: perl早就过气了,现在是java的天下,c#也凑合。
e*******o
发帖数: 4654
18

Perl 比C# 麻烦。
你主要是先找门语言把基本概念搞清楚,以后用哪个语言再学就好了。

【在 F****3 的大作中提到】
: 谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。
z*******3
发帖数: 13709
19
ruby

【在 F****3 的大作中提到】
: 谢谢你的建议啊!主要是我没有cs背景,C#可能会很难掌握。。。
F****3
发帖数: 1504
20
谢谢你的建议,我先学好python吧。掌握了以后再学其他的,先不同时一起上。现在用
版上推荐的PyCharm学习积极性高,呵呵!

【在 e*******o 的大作中提到】
:
: Perl 比C# 麻烦。
: 你主要是先找门语言把基本概念搞清楚,以后用哪个语言再学就好了。

相关主题
如何把文字转换成机器可读形式?Python日报 2015年2月楼
CNN做NLP工程多吗?有没有谁做 text mining 的?
请推荐 机器翻译 的rest API/open source packagedata分类问题请教
进入Programming版参与讨论
F****3
发帖数: 1504
21
谢谢推荐,我google了"what is ruby good for"
http://ubuntuforums.org/archive/index.php/t-416082.html
这个文章是第一个结果,看了看讨论挺有意思的!

【在 z*******3 的大作中提到】
: ruby
z*******3
发帖数: 13709
22
我认为以你读master的智商,说什么“学”python是很掉价的事
python的学习也就是本科comp102里面四分之一课程搞定的事
我们现在就是这么教的,python+perl+htmlcssjavascript+c一门课
其中c有后续课程,其他三个木有

【在 F****3 的大作中提到】
: 谢谢推荐,我google了"what is ruby good for"
: http://ubuntuforums.org/archive/index.php/t-416082.html
: 这个文章是第一个结果,看了看讨论挺有意思的!

z*******3
发帖数: 13709
23
花两个星期“学”python,足够了
这个东西没有所谓的学好不好的问题
学得再好,这个语言的回字都只有一种写法

【在 F****3 的大作中提到】
: 谢谢你的建议,我先学好python吧。掌握了以后再学其他的,先不同时一起上。现在用
: 版上推荐的PyCharm学习积极性高,呵呵!

z*******3
发帖数: 13709
24
python的哲学是,回字只能有一种写法,而且是最简单的那种
perl和ruby的哲学是,回字应该有很多种写法,而且应该经常华山论回
java的哲学是,回字可以有很多种写法,我们大家一起商量决定标准写法
.net的哲学是,你不需要知道回字怎么写,让微软来帮你写,你知道给钱就行了
php的哲学是,回字这个东西,应该用最节省纸张的方式书写
然后大家都忘记了,最早回字其实是用c写的
l*******s
发帖数: 1258
25
我还是觉得 决定regex的不是某种编程语言 而是用regex的人
你需要的所有功能 我相信通过python都可以实现 而且好多包都可以用
有时候 没必要写一个老长老长一看就恶心的regex解决问题 分开做 更敏捷 更好维护
另外 python里面的nltk包 相信perl里没有对应的。这玩意可是集rule based、
machine learning、corpus于一体的NB包啊。你要是整天搞text处理,以后肯定用的上。
美国我知道的几个搞NLP的系,都用python做教学语言了

。谢

【在 F****3 的大作中提到】
: 谢谢楼上给我的建议!!!
: 菜鸟弱问一下三个相关的问题:
: 1) Python的re package是不是没有perl的regular expression那么强大?
: 2) 或者说Python处理文本没有perl那么多"现成的东西多"?我是菜鸟,很多时候一般
: 要看看cpan之类上面的别人的code才能入门。。。
: 3) 我的工作百分之99%是处理文本,请问这种情况是不是还是学一下perl比较好一点。谢
: 谢!

g*****g
发帖数: 34805
26
选择语言的不二法则是看需要的库有没有,已经实现的相似应用都用啥。
regex本身几乎所有语言都有实现。
c****e
发帖数: 1453
27
能告诉我那个语言的regex不支持"?!"吗?

【在 s*******a 的大作中提到】
: 但是perl的特别好用。比如可以表达 negative match
: (?!) - Negative look ahead assertion foo(?!bar) matches foo when not
: followed by bar

z*******3
发帖数: 13709
28
连html都支持

【在 c****e 的大作中提到】
: 能告诉我那个语言的regex不支持"?!"吗?
F****3
发帖数: 1504
29
真是学了很多,太谢谢你们了!
现在正在看NLTK的书。封面是鲸鱼的那个,写的很通俗易懂:)
1 (共1页)
进入Programming版参与讨论
相关主题
有没有谁做 text mining 的?现在哪些script最流行?
data分类问题请教python的问题,大拿帮忙看看
请教一个变态的regular expression 替换python能检查出space是一个还是两个吗?
any perl html parser to recommend?写Python 的苦恼之一:有人当c用,有人当bash用,有人当FP用。当然也有人当python用
Python, Java, Perl, PHP,Ruby请问哪有用python处理文本或者html的code
为什么一说文本处理就提perl如何用Python或者Perl抓取文本?
script language主要是干什么用的?有熟悉php的吗?问个文本处理
请问Python初学者怎么学如何把文字转换成机器可读形式?
相关话题的讨论汇总
话题: perl话题: python话题: 文本处理话题: regex话题: 语言