e****9 发帖数: 316 | 1 【 以下文字转载自 JobHunting 讨论区 】
发信人: e13369 (googoo), 信区: JobHunting
标 题: 正则表达式的问题
发信站: BBS 未名空间站 (Sat Jun 11 22:18:57 2016, 美东)
最近在看正则表达式 ,看到下面这个题目,不知道大家有什么思路吗?
看字符串中的字符是否出现了两次?并且忽略大小写。
比如Aba, abca, bcdB |
|
g*****g 发帖数: 34805 | 2 正则表达式复杂了就还不如写个几十行的程序做parsing。可读性和可维护性并不是跟
行数线性相关的。你这个东西弄个两个的split要比复杂的正则容易多了。 |
|
s****a 发帖数: 794 | 3 正则表达式没法写吧,如果要严格的缩小范围那就是str1和str2两个pattern里选了。
只有这两个满足条件。我觉得要不就是他自己一知半解,被坑了,要不就是有别的条件
没注意到。 |
|
e****9 发帖数: 316 | 4 最近在看正则表达式 ,看到下面这个题目,不知道大家有什么思路吗?
看字符串中的字符是否出现了两次?并且忽略大小写。
比如Aba, abca, bcdB |
|
N**********d 发帖数: 9292 | 5 【 以下文字转载自 Programming 讨论区 】
发信人: NeedForSpeed (working~~~~~), 信区: Programming
标 题: sed里面正则表达式匹配字符越少越好怎么写?
发信站: BBS 未名空间站 (Sun Mar 13 20:56:30 2011, 美东)
例如:其中引号内长度不定
"abc", "def"
".*"
引号里面内容越少越好,我不想是 abc", "def
想要分别是
abc和def
这个该怎么写呢? |
|
m******u 发帖数: 12400 | 6 should be right answer LZ want.
发信人: nickhodge (Nick), 信区: Programming
标 题: Re: 问个关于正则表达式的超弱智问题...
发信站: BBS 未名空间站 (Wed Sep 24 12:11:34 2014, 美东)
嗯,perl里用 =~ /^"id":(\d+)/应该就可以了,好久没用,快忘得差不多了 |
|
L******3 发帖数: 18 | 7 /A1/A2/A3,例如URI,
A1: 含除‘/’的任意字符, 字符数不限
A2: 含除‘/’的任意字符,字符数不限
A3: 任意字符,包括‘/’,字符数不限
如何利用正则表达式提取出“A1/A2”? |
|
d****i 发帖数: 4809 | 8 最标准的正则表达式应该是Perl了吧,最原生的应该是Bourne shell的。 |
|
e********2 发帖数: 495 | 9 要匹配最近的if怎么弄?
比如
if ... if ... else
A B
如果想把第二个if和else之间的B提取出来,正则表达式该怎么写呢?
if(\.*)else
会把A段和B段都提取出来。
谢谢哈。 |
|
h*******c 发帖数: 5 | 10 比如:
HGSSI:MSISDN=msisdn,SS=ss[,BSG=bsg][,FNUM=fnum[,OFA=ofa][,TI
ME=time]]
该如何写成正则表达式,以便替换其中的字符串?
其中[]内的是可能存在的选项。大写的串是变量名,小写的串是变量
值.
谢谢. |
|
r**h 发帖数: 1288 | 11 正则表达式(不是wildcard)的标准解法,是递归还是DP呢
。 |
|
M**********7 发帖数: 378 | 12 这题有点变态了。估计题的细节条件还是要扣细点。
广义来说正则文法是不可学习的。
简单的说就是到底允许不允许扩大结果范围,还是必须严格地只能匹配str1&str2。
如果允许扩大结果范围,那么.*和a*对于aa和a没什么不同,最简定义到底是什么。
如果不允许扩大结果范围,那么就按ksrent这样的思路,不同的时候用个|二选一,注
意不能用.。 |
|
|
i***c 发帖数: 301 | 14 来自主题: Programming版 - 问个表达式 请教去掉double quote的正则表达式
这样好像不好使:
[^"]* |
|
C*********m 发帖数: 213 | 15 向这里的高手请教一个小问题。想用python re 表达式匹配文本
[[xref:12345671|database record]][[wikipedia:AnotherLink]] test line 1
[[xref:12345672]] Test line 2
...
[[xref:12345690|another record]] test line 20
中[[xref:...]]中的内容,但是希望capture返回结果中xref:后面的数字以及|后面的
内容。
用 m = re.compile(r'\[\[xref:(\d+)(.*)\]\]')可以处理后面几行,但是第一行会把
[[wikipedia的内容也抓到一起。 |
|
c**b 发帖数: 2999 | 16 google一下,网上很多已经写好的正则表达式. |
|
w********o 发帖数: 10088 | 17 如果想匹配一个整数或者一个浮点数,都是正的,前面都没有负号,也没有+号,正则
应该怎么写
比如 variable temp=300.5;
这里300.5有时候也会变成300
我想匹配以后,可以统一改成400
试了\d+$|\d+\.\d+不好使,求指教 |
|
s*******h 发帖数: 565 | 18 "id":1234567,"age":12
请问这段话里如何用正则表达是把1234567截取出来?
我尝试用了 "id":\d+,是可以找到"id":1234567,但问题是我不想要前面的,只想要数
字...
请指教 |
|
e*******o 发帖数: 4654 | 19 楼主学一下 regex 的 group and capture
你这个也不一定用正则式,先用 ',' 再用':' 分就出来了。 |
|
n******7 发帖数: 12463 | 20 grep/vim/perl等的正则语法都有些不同
所以没必要不要折腾这个,用一种就好
比如grep 可以用-P
不然会精分 |
|
h**********c 发帖数: 4120 | 21 正则语言的主要实现基本都是blob,context dep, look ahead 基本都能做吧,
实际工程上的实现是经常非常令人失望的,能用就行 |
|
g****g 发帖数: 1828 | 22 AWK是一种优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎
之一。这种编程及数据操作语言(其名称得自于它的创始人 阿尔佛雷德·艾侯 、
Peter Weinberger 和 Brian Kernighan 姓氏的首个字母)的最大功能取决于一个人所
拥有的知识。 AWK 提供了极其强大的功能:可以进行正则表达式的匹配,样式装入、
流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语
言所应具有的几乎所有精美特性。实际上 AWK 的确拥有自己的语言: AWK 程序设计语
言, 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程
序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,
还有无数其他的功能。gawk 是 AWK 的 GNU 版本。
最简单地说,AWK 是一种用于处理文本的编程语言工具。AWK 在很多方面类似于 Unix
shell 编程语言,尽管 AWK 具有完全属于其本身的语法。它的设计思想来源于
SNOBOL4 、sed 、Marc Rochkind设计的有效性语言、语言工具 y... 阅读全帖 |
|
|
h*h 发帖数: 27852 | 24 http://www.yinwang.org/blog-cn/2014/12/31/google-story
我和 Google 的故事(2015 修订版)
2009 和 2010 年,两年的夏天我都在 Google 实习,然而最后毕业的时候我却没有为
Google 工作。虽然我心里很清楚这里面的原因,可总有些人觉得不解,为什么居然有
人不想为 Google 工作?如果你是这些人其中之一,那你可能想知道我在 Google 时的
切身感受。
直到将近 2015 年新年的今天,我发现这篇文章仍然具有普遍的意义。面对 Google 的
员工,我仍然是同样的感觉。他们很多人太拿自己的公司当回事了,自高自大,放弃自
己的尊严来舔这个公司的屁股。这些人总觉得好像所有人都希望为 Google 工作,即使
进不了 Google,都想去 Google “蹭饭”似的。如果一个人说“我很厉害”,我也许
会尊敬他,可是如果他说“我为 Google 工作”,以此来显得厉害,我就会鄙视他。我
只尊敬那些尊敬他们自己的人。以自己的公司名声来抬高自己的人,是最被我瞧不起的
,因为他们跟仗着人势的狗没什么区别。
进 G... 阅读全帖 |
|
k*****7 发帖数: 72 | 25 之前做过的一些项目,个人的贡献。
先介绍了他们组,然后开始问问题。问了很多skip-list的细节,比如根据什么设计层
次,怎样查询,
查询复杂度(这个不知道,我说depend on层数和跳数),怎么判断查询结束,etc
然后编程,查找一个string形式的文章里存不存在一个疑似ISBN号,给了ISBN号可能的
样子。我先开
始划词,然后每词逐符用if判断,大概20行左右读给他,他怕if-else弄错于是让我当
场发他邮箱里,
他看了说貌似OK。聊了几句别的以后突然说这个题你有没有想过用正则表达式,我才恍
然大悟,然后就
跟他说了正则表达式。剩下时间不多了让我问了问些问题就结束了。
后来想想我当时脱口而出的正则表达式貌似不对,于是新写了代码发给他,他回复只有
两个字“nice,
thanks”。希望这是positive的评价吧。
求bless |
|
c*****e 发帖数: 3226 | 26 【 以下文字转载自 CS 讨论区 】
发信人: biochemputer (Pandora Box), 信区: CS
标 题: orz, 王垠骂完了五道口伊萨卡现在开始骂Google了
发信站: BBS 未名空间站 (Fri Aug 10 17:53:39 2012, 美东)
纯转载
---
http://blog.sina.com.cn/s/blog_5d90e82f010191rh.html
---
我和Google的故事 (2012-08-10 02:58:52)转载▼
分类: 杂谈
也许有人看见过我批判 Google 的那篇英文文章。它有一部分片面性,所以被我从英文
博客上拿下来了。我一直在反思自己在 Google 的经历,也许现在用自己的母语,我可
以得出一个准确一点的结论吧。
也许有人觉得作为一个读了这么多年的 PhD 去给别人做实习生(intern)是一种耻辱
,但是我亲眼看到,从一些名校比如 Yale 毕业的 PhD,在 Google 混了好几年,也不
过是过着差不多的生活。只不过做了 intern 之后我长了经验,知道了自己的价值,以
后不至于落到同样的位置。
这里... 阅读全帖 |
|
c*******h 发帖数: 1467 | 27 也许有人看见过我批判 Google 的那篇英文文章。它好像有一部分片面性,所以被我从
英文博客上拿下来了。我一直在反思自己在 Google 的经历,因为在这个公司工作总是
感觉不对劲,但是却总也说不清楚为什么。也许现在用自己的母语,我可以得出一个准
确一点的结论吧。
受命于危难
先说说我的项目是怎么开始的吧。当我加入的时候,我的老板 Steve Yegge 的小组试
图制造一个跨语言的“服务式”编程工具,叫做 Grok。你可以把它想象成 Eclipse 和
Visual Studio, 但是 Grok 的设计目标不只是检索和分析本机的某一种语言的代码,
而是大规模的检索和分析 Google 的所有项目,所有语言,所有代码。这包括 Google
的“四大语言”:C++, Java, JavaScript, Python,一些工具性的语言:Sawzall,
protobuf 等,还有一些“build file”和所有第三方的库。Grok 的初期设计目标是一
个静态的代码索引服务,只要程序员点击任何一个变量或者函数名,就能“准确”的跳
转到它定义的位置。动态的编辑功能稍后也在陆续加入。
这种... 阅读全帖 |
|
W**********i 发帖数: 136 | 28 嗯,就是在linux系统中,有个很大/很多文件,找出其中的电话号码,这是很经典的
正则表达式题,用grep和正则表达式,你google一下就知道了
:)祝好运
正则表达式找电话号码这题是怎么回事?LZ能再解释一下吗?头像是你家宝吗?好可爱
啊。。。 |
|
s*x 发帖数: 3328 | 29 LTL表达式表达的应该都可以用正则表达式表达,考虑LTL的等价FM的等价正则表达式就
可以了,反过来,应该可以有LTL表达不了的正则语言。 |
|
b**********r 发帖数: 91 | 30 纯转载
---
http://blog.sina.com.cn/s/blog_5d90e82f010191rh.html
---
我和Google的故事 (2012-08-10 02:58:52)转载▼
分类: 杂谈
也许有人看见过我批判 Google 的那篇英文文章。它有一部分片面性,所以被我从英文
博客上拿下来了。我一直在反思自己在 Google 的经历,也许现在用自己的母语,我可
以得出一个准确一点的结论吧。
也许有人觉得作为一个读了这么多年的 PhD 去给别人做实习生(intern)是一种耻辱
,但是我亲眼看到,从一些名校比如 Yale 毕业的 PhD,在 Google 混了好几年,也不
过是过着差不多的生活。只不过做了 intern 之后我长了经验,知道了自己的价值,以
后不至于落到同样的位置。
这里我就讲述一下我在 Google 的实习经历吧,也许对人有参考作用。
受命于危难
先说说我的项目是怎么开始的吧。当我加入的时候,我的老板 Steve Yegge 的小组试
图制造一个跨语言的“服务式”的编程工具,叫做 Grok。你可以把它想象成 Eclipse,
但是 Grok 的... 阅读全帖 |
|
b**********r 发帖数: 91 | 31 纯转载
---
http://blog.sina.com.cn/s/blog_5d90e82f010191rh.html
---
我和Google的故事 (2012-08-10 02:58:52)转载▼
分类: 杂谈
也许有人看见过我批判 Google 的那篇英文文章。它有一部分片面性,所以被我从英文
博客上拿下来了。我一直在反思自己在 Google 的经历,也许现在用自己的母语,我可
以得出一个准确一点的结论吧。
也许有人觉得作为一个读了这么多年的 PhD 去给别人做实习生(intern)是一种耻辱
,但是我亲眼看到,从一些名校比如 Yale 毕业的 PhD,在 Google 混了好几年,也不
过是过着差不多的生活。只不过做了 intern 之后我长了经验,知道了自己的价值,以
后不至于落到同样的位置。
这里我就讲述一下我在 Google 的实习经历吧,也许对人有参考作用。
受命于危难
先说说我的项目是怎么开始的吧。当我加入的时候,我的老板 Steve Yegge 的小组试
图制造一个跨语言的“服务式”的编程工具,叫做 Grok。你可以把它想象成 Eclipse,
但是 Grok 的... 阅读全帖 |
|
o********g 发帖数: 14 | 32 已读入html文件,现用正则表达式截取里的内容。如果 里只有一段内容(一
组 ),则可以成功截取。但若 里有大于等于2段内容时,则这一整块
内的内容无法截取。有谁知道怎么搞定这个问题吗?求给点意见
以下是Java的代码:
public static void main(String[] args) throws IOException {
File source_file = new File("./data/page source.txt");
FileReader fr = null;
BufferedReader br = null;
try {
fr = new FileReader(source_file);
br = new BufferedReader(fr);
} catch (FileNotFoundException e2) {
e2.printStackTrace()... 阅读全帖 |
|
|
h*h 发帖数: 27852 | 34 【 以下文字转载自 Military 讨论区 】
发信人: hsh (nidaye), 信区: Military
标 题: 王垠:我和 Google 的故事(2015 修订版)
发信站: BBS 未名空间站 (Mon May 9 18:09:22 2016, 美东)
http://www.yinwang.org/blog-cn/2014/12/31/google-story
我和 Google 的故事(2015 修订版)
2009 和 2010 年,两年的夏天我都在 Google 实习,然而最后毕业的时候我却没有为
Google 工作。虽然我心里很清楚这里面的原因,可总有些人觉得不解,为什么居然有
人不想为 Google 工作?如果你是这些人其中之一,那你可能想知道我在 Google 时的
切身感受。
直到将近 2015 年新年的今天,我发现这篇文章仍然具有普遍的意义。面对 Google 的
员工,我仍然是同样的感觉。他们很多人太拿自己的公司当回事了,自高自大,放弃自
己的尊严来舔这个公司的屁股。这些人总觉得好像所有人都希望为 Google 工作,即使
进不了 Google,都想去... 阅读全帖 |
|
b********e 发帖数: 595 | 35
这是最乱糟糟的一部分,正则的流派,nm变态面试官还喜欢考正则,问题是真
弄起流派来丫也一定晕,不然也不会好多产品都依赖pcre库了。
那本《精通正则表达式》讲的很清楚,另外一本《正则表达式经典实例》是姐妹书,每
个例子都要把各种语言都列一下。 |
|
b********e 发帖数: 595 | 36
这是最乱糟糟的一部分,正则的流派,nm变态面试官还喜欢考正则,问题是真
弄起流派来丫也一定晕,不然也不会好多产品都依赖pcre库了。
那本《精通正则表达式》讲的很清楚,另外一本《正则表达式经典实例》是姐妹书,每
个例子都要把各种语言都列一下。 |
|
j**u 发帖数: 24 | 37 【 以下文字转载自 Computation 讨论区 】
发信人: jiju (Super.Jiju), 信区: Computation
标 题: 请教大牛个问题:工程上实现了个算法,能否发个paper玩玩
发信站: BBS 未名空间站 (Fri Aug 31 20:52:11 2012, 美东)
之前写个东西:
假如有百万级别的正则表达式,对于字符串流,如何加快匹配速度?
如果利用perl等正则,每秒可以匹配25w次,那么整体处理速度就是0.25 q/s;
后来折腾个东西,主要是针对大量的regex ,多建立索引,优化查找策略,可以达到1w
q/s;
不知道这玩意能不能投个不错的会议玩玩;
今天搜了一篇paper,看的是 match regular expressions against a large
corpus
我做的是:一个字符串,匹配海量正则表达式;
求指教:
这个能否折腾个paper玩玩
如果可以,能否给一些related work,以及会议的名字
轻拍 = = |
|
j**u 发帖数: 24 | 38 之前写个东西:
假如有百万级别的正则表达式,对于字符串流,如何加快匹配速度?
如果利用perl等正则,每秒可以匹配25w次,那么整体处理速度就是0.25 q/s;
后来折腾个东西,主要是针对大量的regex ,多建立索引,优化查找策略,可以达到1w
q/s;
不知道这玩意能不能投个不错的会议玩玩;
今天搜了一篇paper,看的是 match regular expressions against a large
corpus
我做的是:一个字符串,匹配海量正则表达式;
求指教:
这个能否折腾个paper玩玩
如果可以,能否给一些related work,以及会议的名字
轻拍 = = |
|
r*****3 发帖数: 143 | 39 中文名: PHP从入门到精通(第二版)
作者: 潘凯华
刘中华.图书分类: 软件
资源格式: PDF
版本: 高清版
出版社: 清华大学出版社
书号: 9787302227472
发行时间: 2010年7月1日
地区: 大陆
语言: 简体中文
简介:
[内容简介]
本书从初学者角度出发,通过通俗易懂的语言,丰富多彩的实例,详细介绍了使用PHP
进行网络开发应该掌握的各方面技术。全书共分24章,包括初识PHP、PHP环境搭建和开
发工具、PHP语言基础、流程控制语句、字符串操作、正则表达式、PHP数组、PHP与Web
页面交互、PHP与JavaScript交互、日期和时间、Cookie与Session、图形图像处理技术
、文件系统、面向对象、PHP加密技术、MySQL数据库基础、phpMyAdmin图形化管理工具
、PHP操作MySQL数据库、ADODB类库、Zend Framework框架、Smarty模板技术、PHP与
XML技术、PHP与Ajax技术、应用Smarty模板开发电子商务网站等。书中所有知识都结合
具体实例进行介绍,涉及的程序代码均附以详细的注释,可以使读者轻松领会PH... 阅读全帖 |
|
r*****n 发帖数: 4844 | 40 前言
你是否觉得自己从学校毕业的时候只做过小玩具一样的程序?走入职场后哪怕没有什么
经验也可以把以下这些课外练习走一遍(朋友的抱怨:学校课程总是从理论出发,作业
项目都看不出有什么实际作用,不如从工作中的需求出发)
建议:
不要乱买书,不要乱追新技术新名词,基础的东西经过很长时间积累而且还会在未来至
少10年通用。
回顾一下历史,看看历史上时间线上技术的发展,你才能明白明天会是什么样。
一定要动手,例子不管多么简单,建议至少自己手敲一遍看看是否理解了里头的细枝末
节。
一定要学会思考,思考为什么要这样,而不是那样。还要举一反三地思考。
注:你也许会很奇怪为什么下面的东西很偏Unix/Linux,这是因为我觉得Windows下的
编程可能会在未来很没有前途,原因如下:
现在的用户界面几乎被两个东西主宰了,1)Web,2)移动设备iOS或Android。Windows
的图形界面不吃香了。
越来越多的企业在用成本低性能高的Linux和各种开源技术来构架其系统,Windows的成
本太高了。
微软的东西变得太快了,很不持久,他们完全是在玩弄程序员。详情参见《Windows编
程革命史》
所以... 阅读全帖 |
|
h*h 发帖数: 27852 | 41 http://www.yinwang.org/blog-cn/2015/03/18/yin-lang-secret
我为什么不再公开开发Yin语言
有些人可能知道我在设计一个程序语言,叫做Yin语言。最开头宣布要做这个语言的时
候,很多人热血沸腾,可是过了不久,我发现自己很不喜欢这样的气氛,越来越厌倦跟
人讨论,所以后来悄悄地丢掉这些人,淡出了。我现在想告诉你我是怎么想的。
我从来没有想让Yin语言流行起来。我对程序语言的认识,其实超乎所有人的想象。我
默默地看着各种新语言扯着各种幌子进行推广,可是它们的设计没有吸取历史教训,所
以继续犯一些古老的错误,或者犯一些我根本不会犯的新错误,或者解决一些根本不需
要解决的问题。其实程序语言已经不缺很多新的功能了,这些语言缺少的不是功能,而
是简单和优雅。要达到简单和优雅,必须要有品位,而品位就像一个艺术家的心,是非
常难得到的。没有经过Indiana式教育的人,是几乎不可能达到这种品位的。就算
Friedman培养出来的那么多学生,也极少有人可以达到我这种地步。
我清楚的知道,其它语言设计者是完全没法达到我的一些精华思想的。我其实很懒,我
希... 阅读全帖 |
|
p**r 发帖数: 5853 | 42 俺说下思路及考官意图,个人看法。
#1 绝对不一次性读入整个文件!!!!
这个是考你处理大文件的方法,
一次性读入,3行还行,如果3百万行,那就是坑爹
所以类似readline的方式,分行读入,但是不是只读1行!
【注意点】
读单项(不是单行!!!)的时候做一个判断,是否读到结尾了,因为不一定一行包括
了所有信息。
是否结尾标志,用regular expression判断,一旦读到第2个时间,结束,进入数据拆
分!
【可能会加分的,但是有点showoff,遇到考官装X的会起反效果。】
你可以在读文件前再做一个判断,文件小于类似10k,直接读文件,不然就分行读。
也就是说你知道如何处理大文件,但是对小文件也不扯淡。。
#2 必须用regular expression<正则>,要求#4里说得很清楚!!!!
正则表达式分离数据,必须学会,以后会用很多。
判断日期格式,有很多种表达式。
如果不懂,就先去研究一把,这个题目只是分离日期以及后面数据,算简单的。
#3 把数据分离成2部分就不说了,这个你肯定会。
#4 第5条要求的意思其实是为了cross platform等后期需要,
所以建议用xm... 阅读全帖 |
|
A******g 发帖数: 612 | 43 大牛,
我们面试时不能以我们认为为准吧?
leetcode认为,几乎所有的programming language都认为比如java,python
这题各种奇怪的边角情况才是难点
比如:
+.33
3.
.3e.3
+.3e10
-3.e.4
这个正则表达式是
Space := ('n'|'t'|' ')
Sign := ('-'|'+')
DOT := '.'
Digit := ('0'|...|'9')
NUMBER := Space* Sign? ((Digit Digit* DOT? Digit*)|(Digit* DOT? Digit Digit*
)) (Space* | (E Sign? ((Digit Digit* DOT? Digit*)|(Digit* DOT? Digit Digit*
Space*))))
不是寥寥几行就能搞定的, 我认为用java的正则表达式靠谱一点 |
|
g**y 发帖数: 46 | 44 正则表达式那题的测试点在什么地方?软件工程师应该熟练掌握正则表达式? |
|
n******r 发帖数: 869 | 45 贡献好文:
http://coolshell.cn/articles/4990.html
月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to
those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉
我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,
于是,我让他把他的一些学习Python和Web编程的一些点滴总结一下。于是他给我发来
了一些他的心得和经历,我在把他的心得做了不多的增改,并根据我的经历增加了“进
阶”一节。这是一篇由新手和我这个老家伙根据我们的经历完成的文章。
我的这个朋友把这篇文章取名叫Build Your Programming Technical Skills,我实在
不知道用中文怎么翻译,但我在写的过程中,我觉得这很像一个打网游做任务升级的一
个过程,所以取名叫“技术练级攻略”,题目有点大,呵呵,这个标题纯粹是为了好玩
。这里仅仅是在分享Mailper和我个人的学习经历。(注:省去了我作为一个初学者曾
经学习过的一些技术(今天明显... 阅读全帖 |
|
l*********b 发帖数: 65 | 46 第三题是正则表达式? 正则表达式不是字符串匹配的么?。。bless lz吧 我也快面了 |
|
t*******r 发帖数: 22634 | 47 另外。。。为毛“pattern”比数手指头容易?您老这是隐形 BSO 您老
能把正则表达式(Regular Expression)写到魂飞魄散的程度么?@@
虽然正则表达式这个比较僵化的东西的确不算难,但是对俺老来说,
比数手指头还是要难一点点的。。。 |
|
p**r 发帖数: 5853 | 48 俺说下思路及考官意图,个人看法。
#1 绝对不一次性读入整个文件!!!!
这个是考你处理大文件的方法,
一次性读入,3行还行,如果3百万行,那就是坑爹
所以类似readline的方式,分行读入,但是不是只读1行!
【注意点】
读单项(不是单行!!!)的时候做一个判断,是否读到结尾了,因为不一定一行包括
了所有信息。
是否结尾标志,用regular expression判断,一旦读到第2个时间,结束,进入数据拆
分!
【可能会加分的,但是有点showoff,遇到考官装X的会起反效果。】
你可以在读文件前再做一个判断,文件小于类似10k,直接读文件,不然就分行读。
也就是说你知道如何处理大文件,但是对小文件也不扯淡。。
#2 必须用regular expression<正则>,要求#4里说得很清楚!!!!
正则表达式分离数据,必须学会,以后会用很多。
判断日期格式,有很多种表达式。
如果不懂,就先去研究一把,这个题目只是分离日期以及后面数据,算简单的。
#3 把数据分离成2部分就不说了,这个你肯定会。
#4 第5项要求的意思其实是为了cross platform等后期需要,
所以建议用xm... 阅读全帖 |
|
C********s 发帖数: 120 | 49 除非你的数据格式有严格控制否则这类问题不适合用正则表达式。找个 html parser
更合适吧。
如果你能确定 tag 全部在一行内,没有换行,tag 内没有比较古怪的字符,没
有 escape 字符,对结果要求不是特别严格,可以试用正则表达式。下面用 perl one
liner:
perl -e "m/ |
|
s****a 发帖数: 238 | 50 比如要把a1,a2替换成b1,b2,用replace-regexp只能在查找时支持正则表达式,替换时
就不行,有没有什么命令能够同时支持正则表达式的? |
|