d******p 发帖数: 335 | 1 一共两次电面一次onsite
电面1. 印度人:
1. research相关问题
2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
sort就可以了
3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
电面2. 欧洲人:
1. research相关
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
onsite记得的题目如下:
1. 国人大哥
twitter怎么做fraud detection,怎么根据tweet做clustering,问了一些IR的问题
2. 南美人
自己最满意的项目是什么,又按照简历问了一些问题
怎么找hot的tag(就是#tag这种)
3. 白人
1
1 2 1
1 3 3 1
1 4 6 4 1
给上面这组数列,怎么打印,怎么improve,只给生成一个数组,不难。
4. 和印度人吃饭
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
小抱怨一下,onsite完了hr说要电话讨论一下next step,结果放了我四次鸽子,拖了
一个月,告诉我被拒了,不太厚道。 |
i*******6 发帖数: 107 | 2 慎言啊,我也被这么搞过。
和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说
,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案
不完善的,再想想。然后我就傻眼了...然后就没有然后了... |
S*******w 发帖数: 24236 | 3 肯定不能说做过了啊
说不定人家就准备了这一道题 你说做过了
让人家怎么办。。。。
【在 i*******6 的大作中提到】 : 慎言啊,我也被这么搞过。 : 和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说 : ,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案 : 不完善的,再想想。然后我就傻眼了...然后就没有然后了...
|
H***e 发帖数: 476 | 4 我也发生过类似的
一个面试的问我一个以前我见过的题目,只要知道trick就秒杀的那种,我说我见过,
然后他就换了一个巨难的,然后被搞了
以后不会这样说了
【在 i*******6 的大作中提到】 : 慎言啊,我也被这么搞过。 : 和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说 : ,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案 : 不完善的,再想想。然后我就傻眼了...然后就没有然后了...
|
d****o 发帖数: 1055 | 5 嗯,那样子正常人的反应就是要看看你到底有多NB。
换一道他觉得特别难的题给你。
【在 S*******w 的大作中提到】 : 肯定不能说做过了啊 : 说不定人家就准备了这一道题 你说做过了 : 让人家怎么办。。。。
|
l*****a 发帖数: 14598 | 6
只有 只有一个红球的时候才会有这种可能把。
二个以上红球不能
没有红球也不能
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
d******p 发帖数: 335 | 7 一共两次电面一次onsite
电面1. 印度人:
1. research相关问题
2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
sort就可以了
3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
电面2. 欧洲人:
1. research相关
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
onsite记得的题目如下:
1. 国人大哥
twitter怎么做fraud detection,怎么根据tweet做clustering,问了一些IR的问题
2. 南美人
自己最满意的项目是什么,又按照简历问了一些问题
怎么找hot的tag(就是#tag这种)
3. 白人
1
1 2 1
1 3 3 1
1 4 6 4 1
给上面这组数列,怎么打印,怎么improve,只给生成一个数组,不难。
4. 和印度人吃饭
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
小抱怨一下,onsite完了hr说要电话讨论一下next step,结果放了我四次鸽子,拖了
一个月,告诉我被拒了,不太厚道。 |
g*****e 发帖数: 282 | 8 概率题没看懂。。。
“twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
w****x 发帖数: 2483 | 9
大牛最近在面推特?? 给漏点面经???
【在 g*****e 的大作中提到】 : 概率题没看懂。。。 : “twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了 : 最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写
|
c******t 发帖数: 391 | 10 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢? |
|
|
g*****e 发帖数: 282 | 11 没,刚找了朋友refer而已。。。
【在 w****x 的大作中提到】 : : 大牛最近在面推特?? 给漏点面经???
|
g*****e 发帖数: 282 | 12 C(m,n)啊
【在 g*****e 的大作中提到】 : 没,刚找了朋友refer而已。。。
|
p*****2 发帖数: 21240 | 13
杨辉三角
【在 c******t 的大作中提到】 : 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
|
c********t 发帖数: 5706 | 14 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
入同数组。
然后再过一遍数组打印?
用java写,没法增加数组长度怎么办?
【在 p*****2 的大作中提到】 : : 杨辉三角
|
p*****2 发帖数: 21240 | 15
一个数组应该够了。装得下。
【在 c********t 的大作中提到】 : 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存 : 入同数组。 : 然后再过一遍数组打印? : 用java写,没法增加数组长度怎么办?
|
l*****a 发帖数: 14598 | 16 ArrayList
【在 c********t 的大作中提到】 : 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存 : 入同数组。 : 然后再过一遍数组打印? : 用java写,没法增加数组长度怎么办?
|
w****x 发帖数: 2483 | 17 "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。"
struct EDGE
{
int x;
int y;
EDGE(int a, int b) : x(a), y(b) {}
};
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp);
void _insert_conn(int x, int y, hash_map>& mp);
void GetConnectedComp(vector& edges, vector>& comps)
{
hash_map> mp;
for (vector::iterator it = edges.begin(); it != edges.end(); it++)
{
_insert_conn(it->x, it->y, mp);
_insert_conn(it->y, it->x, mp);
}
set st;
for (hash_map>::iterator it = mp.begin(); it != mp.end();
it++)
{
int x = it->first;
if (st.find(x) == st.end())
{
vector vecTmp;
_inner_find_comp(x, mp, st, vecTmp);
comps.push_back(vecTmp);
}
}
}
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp)
{
if (st.find(x) != st.end() || mp.find(x) == mp.end())
return;
st.insert(x);
vecComp.push_back(x);
set& cons = mp[x];
for (set::iterator it = cons.begin(); it != cons.end(); it++)
_inner_find_comp(*it, mp, st, vecComp);
}
void _insert_conn(int x, int y, hash_map>& mp)
{
if (mp.find(x) == mp.end())
{
set setTmp;
mp[x] = setTmp;
}
mp[x].insert(y);
} |
w****x 发帖数: 2483 | 18 /*
Given tweet's inverted index,how to find phrases combination,e.g
phrase "twitter good tool", "twitter is a good tool" is better than "twitter
is good,
facebook is a better tool"
*/
bool GetClosestPhrase(hash_map>& dic, vector& strs,
int& nStart, int& nEnd)
{
for (vector::iterator it = strs.begin(); it != strs.end(); it++)
{
if (dic.find(*it) == dic.end())
return false;
}
int nNum = strs.size();
vector*> vec;
vector vecIndex;
for (int i = 0; i < nNum; i++)
{
vec.push_back(&dic[strs[i]]);
vecIndex.push_back(0);
}
nStart = -1;
nEnd = -1;
for (int i = 0; i < vec[0]->size(); i++)
{
vecIndex[0] = i;
int nPrev = vec[0]->at(vecIndex[0]);
for (int j = 1; j < nNum; j++)
{
int iter = vecIndex[j];
while (iter < vec[j]->size() && vec[j]->at(iter) <= nPrev)
iter++;
if (iter >= vec[j]->size())
return nStart >= 0;
vecIndex[j] = iter;
nPrev = vec[j]->at(iter);
}
if (nStart < 0 || nEnd - nStart >
vec[nNum-1]->at(vecIndex[nNum-1]) - vec[0]->at(vecIndex[0]))
{
nEnd = vec[nNum-1]->at(vecIndex[nNum-1]);
nStart = vec[0]->at(vecIndex[0]);
}
}
return nStart >= 0;
} |
g*****e 发帖数: 282 | 19 概率题没看懂。。。
“twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
w****x 发帖数: 2483 | 20
大牛最近在面推特?? 给漏点面经???
【在 g*****e 的大作中提到】 : 概率题没看懂。。。 : “twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了 : 最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写
|
|
|
c******t 发帖数: 391 | 21 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢? |
g*****e 发帖数: 282 | 22 没,刚找了朋友refer而已。。。
【在 w****x 的大作中提到】 : : 大牛最近在面推特?? 给漏点面经???
|
g*****e 发帖数: 282 | 23 C(m,n)啊
【在 g*****e 的大作中提到】 : 没,刚找了朋友refer而已。。。
|
p*****2 发帖数: 21240 | 24
杨辉三角
【在 c******t 的大作中提到】 : 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
|
c********t 发帖数: 5706 | 25 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
入同数组。
然后再过一遍数组打印?
用java写,没法增加数组长度怎么办?
【在 p*****2 的大作中提到】 : : 杨辉三角
|
p*****2 发帖数: 21240 | 26
一个数组应该够了。装得下。
【在 c********t 的大作中提到】 : 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存 : 入同数组。 : 然后再过一遍数组打印? : 用java写,没法增加数组长度怎么办?
|
l*****a 发帖数: 14598 | 27 ArrayList
【在 c********t 的大作中提到】 : 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存 : 入同数组。 : 然后再过一遍数组打印? : 用java写,没法增加数组长度怎么办?
|
w****x 发帖数: 2483 | 28 "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。"
struct EDGE
{
int x;
int y;
EDGE(int a, int b) : x(a), y(b) {}
};
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp);
void _insert_conn(int x, int y, hash_map>& mp);
void GetConnectedComp(vector& edges, vector>& comps)
{
hash_map> mp;
for (vector::iterator it = edges.begin(); it != edges.end(); it++)
{
_insert_conn(it->x, it->y, mp);
_insert_conn(it->y, it->x, mp);
}
set st;
for (hash_map>::iterator it = mp.begin(); it != mp.end();
it++)
{
int x = it->first;
if (st.find(x) == st.end())
{
vector vecTmp;
_inner_find_comp(x, mp, st, vecTmp);
comps.push_back(vecTmp);
}
}
}
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp)
{
if (st.find(x) != st.end() || mp.find(x) == mp.end())
return;
st.insert(x);
vecComp.push_back(x);
set& cons = mp[x];
for (set::iterator it = cons.begin(); it != cons.end(); it++)
_inner_find_comp(*it, mp, st, vecComp);
}
void _insert_conn(int x, int y, hash_map>& mp)
{
if (mp.find(x) == mp.end())
{
set setTmp;
mp[x] = setTmp;
}
mp[x].insert(y);
} |
w****x 发帖数: 2483 | 29 /*
Given tweet's inverted index,how to find phrases combination,e.g
phrase "twitter good tool", "twitter is a good tool" is better than "twitter
is good,
facebook is a better tool"
*/
bool GetClosestPhrase(hash_map>& dic, vector& strs,
int& nStart, int& nEnd)
{
for (vector::iterator it = strs.begin(); it != strs.end(); it++)
{
if (dic.find(*it) == dic.end())
return false;
}
int nNum = strs.size();
vector*> vec;
vector vecIndex;
for (int i = 0; i < nNum; i++)
{
vec.push_back(&dic[strs[i]]);
vecIndex.push_back(0);
}
nStart = -1;
nEnd = -1;
for (int i = 0; i < vec[0]->size(); i++)
{
vecIndex[0] = i;
int nPrev = vec[0]->at(vecIndex[0]);
for (int j = 1; j < nNum; j++)
{
int iter = vecIndex[j];
while (iter < vec[j]->size() && vec[j]->at(iter) <= nPrev)
iter++;
if (iter >= vec[j]->size())
return nStart >= 0;
vecIndex[j] = iter;
nPrev = vec[j]->at(iter);
}
if (nStart < 0 || nEnd - nStart >
vec[nNum-1]->at(vecIndex[nNum-1]) - vec[0]->at(vecIndex[0]))
{
nEnd = vec[nNum-1]->at(vecIndex[nNum-1]);
nStart = vec[0]->at(vecIndex[0]);
}
}
return nStart >= 0;
} |
g*****e 发帖数: 282 | 30
【在 w****x 的大作中提到】 : "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所 : 有的connected components。有一个很大的文件,每行存一条follow关系的边。" : struct EDGE : { : int x; : int y; : EDGE(int a, int b) : x(a), y(b) {} : }; : void _inner_find_comp(int x, hash_map>& mp, set& st, : vector& vecComp);
|
|
|
e******o 发帖数: 757 | 31 随能解释一下这个题目么? 什么叫 “找到所有的connected component"? 比较土,没
用过twitter. thanks
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。 |
m*****k 发帖数: 731 | 32 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
找最短的包涵所有单词的句子?
顺序重要么?
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
l**b 发帖数: 457 | |
q****m 发帖数: 177 | 34 请问根据下一个花色来判断是否放回, 具体判断规则是什么? 比如拿到蓝色,下一个
是蓝色,放回吗? 下一个是红色,放回吗? |
f*********m 发帖数: 726 | 35 下面三题的想法:
(1)2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently
找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
想法:
通过follow关系给每个用户建立adjacent list,其中存放其followers。这样我们得到
一个graph.然后用bfs 或dfs找出和一个给定用户连接的节点(用户)。
(2) 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
想法:
计算tweet和candidate phrase的“距离”时考虑candidate phrase的长度。太长则“
距离”大。
(3)3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,
那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
想法:
原题是?
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
f*********m 发帖数: 726 | 36 能说说思路吗?
【在 w****x 的大作中提到】 : "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所 : 有的connected components。有一个很大的文件,每行存一条follow关系的边。" : struct EDGE : { : int x; : int y; : EDGE(int a, int b) : x(a), y(b) {} : }; : void _inner_find_comp(int x, hash_map>& mp, set& st, : vector& vecComp);
|
f*********m 发帖数: 726 | 37 能说说思路吗?
谢谢。
twitter
【在 w****x 的大作中提到】 : /* : Given tweet's inverted index,how to find phrases combination,e.g : phrase "twitter good tool", "twitter is a good tool" is better than "twitter : is good, : facebook is a better tool" : */ : bool GetClosestPhrase(hash_map>& dic, vector& strs, : int& nStart, int& nEnd) : { : for (vector::iterator it = strs.begin(); it != strs.end(); it++)
|
g*****e 发帖数: 282 | 38
【在 w****x 的大作中提到】 : "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所 : 有的connected components。有一个很大的文件,每行存一条follow关系的边。" : struct EDGE : { : int x; : int y; : EDGE(int a, int b) : x(a), y(b) {} : }; : void _inner_find_comp(int x, hash_map>& mp, set& st, : vector& vecComp);
|
e******o 发帖数: 757 | 39 随能解释一下这个题目么? 什么叫 “找到所有的connected component"? 比较土,没
用过twitter. thanks
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。 |
m*****k 发帖数: 731 | 40 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
找最短的包涵所有单词的句子?
顺序重要么?
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
|
|
l**b 发帖数: 457 | |
q****m 发帖数: 177 | 42 请问根据下一个花色来判断是否放回, 具体判断规则是什么? 比如拿到蓝色,下一个
是蓝色,放回吗? 下一个是红色,放回吗? |
f*********m 发帖数: 726 | 43 下面三题的想法:
(1)2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently
找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
想法:
通过follow关系给每个用户建立adjacent list,其中存放其followers。这样我们得到
一个graph.然后用bfs 或dfs找出和一个给定用户连接的节点(用户)。
(2) 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
想法:
计算tweet和candidate phrase的“距离”时考虑candidate phrase的长度。太长则“
距离”大。
(3)3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,
那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
想法:
原题是?
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|
f*********m 发帖数: 726 | 44 能说说思路吗?
【在 w****x 的大作中提到】 : "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所 : 有的connected components。有一个很大的文件,每行存一条follow关系的边。" : struct EDGE : { : int x; : int y; : EDGE(int a, int b) : x(a), y(b) {} : }; : void _inner_find_comp(int x, hash_map>& mp, set& st, : vector& vecComp);
|
f*********m 发帖数: 726 | 45 能说说思路吗?
谢谢。
twitter
【在 w****x 的大作中提到】 : /* : Given tweet's inverted index,how to find phrases combination,e.g : phrase "twitter good tool", "twitter is a good tool" is better than "twitter : is good, : facebook is a better tool" : */ : bool GetClosestPhrase(hash_map>& dic, vector& strs, : int& nStart, int& nEnd) : { : for (vector::iterator it = strs.begin(); it != strs.end(); it++)
|
y***5 发帖数: 21 | |
b****u 发帖数: 37 | 47 connected components是考怎样找Strongly connected components吗?
【在 d******p 的大作中提到】 : 一共两次电面一次onsite : 电面1. 印度人: : 1. research相关问题 : 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external : sort就可以了 : 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么 : 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩 : 最后一个球是红色的概率是多少 : 电面2. 欧洲人: : 1. research相关
|