由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 一个string问题
相关主题
regex 用DP做对不对啊?问个题
正则的题专家们,find the longest common substring of two strings
面到reverse words in string[合集] 微软面试题一道
收到G家拒信,发面经请教一个phone interview 问题
上一道我以前喜欢出的题目吧问道看到的面试题
问道 L家 的题Riverbed 面经
Hot startup coding test 的问题How to find 10 most frequent strings in 10 billion string list?
一道题问个google老题的最佳解法
相关话题的讨论汇总
话题: string话题: regex话题: 句子话题: he话题: 方法
进入JobHunting版参与讨论
1 (共1页)
m******r
发帖数: 42
1
如何把一个英语string分成句子?我直接用separator或者Regex都可以做,
但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子:
He's looking for his host, i.e. the person who'll travel with him.
中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗?
d****o
发帖数: 1055
2
一般就用句号分割。
但是遇到你这种特殊得,就考虑一下特殊情况。

【在 m******r 的大作中提到】
: 如何把一个英语string分成句子?我直接用separator或者Regex都可以做,
: 但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子:
: He's looking for his host, i.e. the person who'll travel with him.
: 中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗?

m******r
发帖数: 42
3
我觉得建立一个特殊词的lookup table好像也不靠谱啊。

【在 d****o 的大作中提到】
: 一般就用句号分割。
: 但是遇到你这种特殊得,就考虑一下特殊情况。

h****e
发帖数: 928
4
再复杂一些就要用到NLP了吧,例如
http://nlp.stanford.edu/software/tokenizer.shtml
g****y
发帖数: 240
5
如果每句话的开始都是capital letter的话,可以用python的lookahead assertion
regex:
\.(?!\s*[a-z])

【在 m******r 的大作中提到】
: 如何把一个英语string分成句子?我直接用separator或者Regex都可以做,
: 但想不出来如何处理i.e. e.g.这类词。比如这句话应该是判断为一个句子:
: He's looking for his host, i.e. the person who'll travel with him.
: 中间那个"i.e."把我的分割方法全破坏了。有什么好的处理方法吗?

1 (共1页)
进入JobHunting版参与讨论
相关主题
问个google老题的最佳解法上一道我以前喜欢出的题目吧
Interleave Strings那个题目有O(n)时间 O(1)空间算法么?问道 L家 的题
一道电面题,分享下, 这个题应该用哪几个data structure?Hot startup coding test 的问题
Permutation leetcode-一道题
regex 用DP做对不对啊?问个题
正则的题专家们,find the longest common substring of two strings
面到reverse words in string[合集] 微软面试题一道
收到G家拒信,发面经请教一个phone interview 问题
相关话题的讨论汇总
话题: string话题: regex话题: 句子话题: he话题: 方法