由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 贡献个设计题
相关主题
请教一个题 string similarityAmazon一面
一道面试题给大家推荐个网站,interviewstreet.com
一个coding题目问一道interview street 上的题
请教一个phone interview 问题Leetcode Scramble String简单解法
F家电面:group Anagrams请教:C++, 忽略大小写的字符串比较
问道面试题算法求助
请教order irrelevant的string hashing常见的string hash function
请教 locality sensitive hashinggoogle phone screen
相关话题的讨论汇总
话题: soundex话题: string话题: fuzzy话题: distance
进入JobHunting版参与讨论
1 (共1页)
g**e
发帖数: 6127
1
Fuzzy/Approximate string matching,实际应用很广泛。
有一堆target string。给定一个新的string,要从target string里面找出拼写/发音
类似的。如何scale?
答每次计算levenshtein distance的不及格
答soundex的及格
答用lucene的直接拖出去
S******n
发帖数: 132
2
那把计算过levenshtein distance的存起来呢?
第一次计算一下,以后要么从内存中直接读要么从disk上读行不行?
我今天被问到spell checking,这样答了,是不是要废掉了?
y*******g
发帖数: 6599
3
soundex 闻所未闻啊,,太专业了
y*******g
发帖数: 6599
4
怎么存啊?
每次查询不同的词啊。

【在 S******n 的大作中提到】
: 那把计算过levenshtein distance的存起来呢?
: 第一次计算一下,以后要么从内存中直接读要么从disk上读行不行?
: 我今天被问到spell checking,这样答了,是不是要废掉了?

S******n
发帖数: 132
5
我觉得常用单词不是很多,由这些单词产生的错误拼写也不会有多少,存起来应该没多
大吧
g**e
发帖数: 6127
6
每次输入的string不同,保存levenshtein distance没意义

【在 S******n 的大作中提到】
: 那把计算过levenshtein distance的存起来呢?
: 第一次计算一下,以后要么从内存中直接读要么从disk上读行不行?
: 我今天被问到spell checking,这样答了,是不是要废掉了?

f*****e
发帖数: 2992
7
soundex怎么比较?怎么用?

【在 g**e 的大作中提到】
: 每次输入的string不同,保存levenshtein distance没意义
x***y
发帖数: 633
8
Locality senstivit hashing
g**e
发帖数: 6127
9
这个我只有n年前在graphics课上听过,用来检查image similarity。还能做fuzzy
string match?

【在 x***y 的大作中提到】
: Locality senstivit hashing
g**e
发帖数: 6127
10
soundex只能比较发音相近的。preprocess/hash soundex呗

【在 f*****e 的大作中提到】
: soundex怎么比较?怎么用?
x*****0
发帖数: 452
11
mark
1 (共1页)
进入JobHunting版参与讨论
相关主题
google phone screenF家电面:group Anagrams
为什么老死在HR的电面上问道面试题
facebook telephone interview from careercup请教order irrelevant的string hashing
问个常见算法题的变形请教 locality sensitive hashing
请教一个题 string similarityAmazon一面
一道面试题给大家推荐个网站,interviewstreet.com
一个coding题目问一道interview street 上的题
请教一个phone interview 问题Leetcode Scramble String简单解法
相关话题的讨论汇总
话题: soundex话题: string话题: fuzzy话题: distance