boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 请教一个ES问题。多谢!
相关主题
f家店面题
google 面试题
为什么升职不如跳槽来钱多?
唉,随便贡献个phone interview面经吧。CS的。
amazon 电面
求c++高手帮忙,有重谢 (转载)
Amazon组选择:EC2还是Elastic MapReduce
amazon电话面试
麻烦好心人能帮忙refer一下Facebook和Amazon吗?
大家给分析一下子吧
相关话题的讨论汇总
话题: 文档话题: 次序话题: 上海话题: 窗口话题: es
进入JobHunting版参与讨论
1 (共1页)
m***3
发帖数: 8
1
请教群里大拿们一个问题。如果方法可行,必有重谢!
给定 n 个词,要求搜索所有含有这 n 个词的文档,并且满足这 n 个词同时出现在长
度为 m 的窗口中,还有就是这 n 个词在文档中出现的次序和搜索时的次序一致。
比如,搜索词是:“明天 北京 上海 火车”,要求文档中匹配的窗口的大小是12个词。
文档1: 大概 明天 有 一辆 从 北京 开往 上海 的 火车 将 提速 10%
1 2 3 4 5 6 7 8 9 10 11 12
13
这个文档满足条件,2 6 8 10 正好次序和 “明天 北京 上海 火车“一致,并且这几
个词的跨度是8,小于要求的12窗口。
文档2: 大概 明天 有 一辆 从 上海 开往 北京 的 火车 将 提速 10%
1 2 3 4 5 6 7 8 9 10 11
12 13
这个不满足,因为“上海 北京”的次序不满足。
文档3: 大概 明天 上午 八点 左右 有 一辆 从 上海 开往 北京 的 混合 动力 的 火
车 将 提速 10%
1 2 3 4 5 6 7 8 9 10 11
12 13 14 15 16 17 18 19
这个不满足,2 9 11 16,这几个词的跨度是14,大于要求的12窗口。
d******b
发帖数: 73
2
对每一组词和每一个句子 进行最长公共子序列。最后的子序列应该是给定词组,最后
再看看首位的index的差。不难啊,还是我想简单了。
m***3
发帖数: 8
3
需要用Elastic Search实现。因为最近在用 Elastic Search 做项目,遇到了这样一个
需求,本以为 SpanNearQuery 能实现,发现不可以,因为 span_near 中定义的 slop
是两个邻近词之间的距离,而不是整个 query 所在的窗口的大小。


: 对每一组词和每一个句子 进行最长公共子序列。最后的子序列应该是给定词组
,最后

: 再看看首位的index的差。不难啊,还是我想简单了。



【在 d******b 的大作中提到】
: 对每一组词和每一个句子 进行最长公共子序列。最后的子序列应该是给定词组,最后
: 再看看首位的index的差。不难啊,还是我想简单了。

1 (共1页)
进入JobHunting版参与讨论
相关主题
大家给分析一下子吧
有没有前辈能帮我refer到facebook的,重谢!
请问OPT期间工作要从事本专业工作吗?
请大家推荐湾区biotech的工作机会(计算或编程方向)
求DOW的校园面试问题,面经,和注意事项。伪币重谢。
面试题目的次序对发挥会有影响?
贡献一次FEA职位技术面试题目 (转载)
今年就业形势是比往年差吧
求推荐或挂靠
要不要和Amazon面
相关话题的讨论汇总
话题: 文档话题: 次序话题: 上海话题: 窗口话题: es