由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 搞大数据那帮人连个quick sort都写不出来
相关主题
Taobao TFS 架构及开源项目几道面试题:memory, sort, 等
问个面试题请教一个初级算法问题 (转载)
linux 文件大小的问题算法之极弱问
file modification questions in linux using c问一个严肃的实用问题
并口驱动的一个问题 (转载)underlying sort algorithm for SET in STL?
靠。Sedgewick这3w-qsort算法居然还有bug!哪位大侠给说说 何时用 merge sort, 何时用 quick sort, 何时
我写的quick sort嵌入式系统用什么sorting算法比较好?
问一个简单问题的算法 (转载)我也来一个, quick sort 只要一行。
相关话题的讨论汇总
话题: 数据话题: 算法话题: sort话题: 需要话题: 出来
进入Programming版参与讨论
1 (共1页)
H******7
发帖数: 1728
1
接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
★ 发自iPhone App: ChineseWeb 8.7
z****e
发帖数: 54598
2
人家学统计的
你把normal distribution的公式现在默写出来我看看
我估计你也写不出来
N********n
发帖数: 8363
3

LOL, 同感。电面这些号称懂BD的我一般都先问几个入门问题:你做BD最常见数
据结构是啥,这个数构适合干啥不适合干啥?你做BD最常用的算法是啥,算法
复杂度是多少。少数真懂得能对答如流、举一反三。大多数不懂的阿三张嘴要
么磕磕巴巴,要么胡说八道,统统秒FAIL。

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

g*********e
发帖数: 14401
4
搞大数据根本不需要算法
h*******u
发帖数: 15326
5
大数据特别需要算法,但是不需要qs这种算法

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
l*********s
发帖数: 5409
6
re.

【在 z****e 的大作中提到】
: 人家学统计的
: 你把normal distribution的公式现在默写出来我看看
: 我估计你也写不出来

h**********c
发帖数: 4120
7
file system 比大数据还大,可以zB level
那现在说说xfs 比ext4
ET
发帖数: 10701
8
啥是算法你咋理解的?

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
H******7
发帖数: 1728
9
这个区别很好解释
Ext4 最稳定也是不争的
XFS 有一些不错的功能snapshot什么的

★ 发自iPhone App: ChineseWeb 8.7

【在 h**********c 的大作中提到】
: file system 比大数据还大,可以zB level
: 那现在说说xfs 比ext4

h**********c
发帖数: 4120
10
本质还是要对数据的基础存放清晰,最少能找到文献

【在 H******7 的大作中提到】
: 这个区别很好解释
: Ext4 最稳定也是不争的
: XFS 有一些不错的功能snapshot什么的
:
: ★ 发自iPhone App: ChineseWeb 8.7

相关主题
靠。Sedgewick这3w-qsort算法居然还有bug!几道面试题:memory, sort, 等
我写的quick sort请教一个初级算法问题 (转载)
问一个简单问题的算法 (转载)算法之极弱问
进入Programming版参与讨论
H******7
发帖数: 1728
11
Fs结构很简单 无非是几个inode指来指去 加上一些extents的概念。
Tool都很全 ext2fs tools 什么的
xfstool也很好用

★ 发自iPhone App: ChineseWeb 8.7

【在 h**********c 的大作中提到】
: 本质还是要对数据的基础存放清晰,最少能找到文献
g*********e
发帖数: 14401
12
找工板上那些

【在 ET 的大作中提到】
: 啥是算法你咋理解的?
N********n
发帖数: 8363
13

这就好比说做数据库不需要懂SCHEMA DESIGN一样。

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
c******o
发帖数: 1277
14
最近在帮忙,觉得搞大数据要的东西很多啊,倒是quicksort不是必须的。
我觉得对于如何提出一个问题,然后如何设计算法能并行处理需要考考。
还有就是常用的设计pitfall, 什么需要预处理,什么不需要,为什么,各有什么好处
害处。
关键就在于大和快,不需要多精巧,但是你要能设计一个,想快就快(堆资源能有效的
)也不容易啊。
都在细节, 我们一开始用spark的时候,不大的数据也老死。后来看spark的
caculation mode, code.
现在在并行/预处理上下功夫就好多了。
Y**G
发帖数: 1089
15
光大是没有用的。

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

w**z
发帖数: 8232
16
quick sort 很容易写吗?这种算法,只要知道意思,就行了。真当场写出来又如何?

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

h**********c
发帖数: 4120
17
It should allow random access, it a data type

【在 w**z 的大作中提到】
: quick sort 很容易写吗?这种算法,只要知道意思,就行了。真当场写出来又如何?
:
: 太大

l******n
发帖数: 9344
18
大数据不等于码公编程!
码公也不需要写这些,别人写好的library你会用就好了,你天天写这个?
你个我证明个中心极限定理,你写的出来吗?

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

a*********a
发帖数: 3656
19
草, 正态分布就是 exp(-x^2/2s^2) 加个归一因子。搞统计和随即过程的,不可能写
不出来。

【在 z****e 的大作中提到】
: 人家学统计的
: 你把normal distribution的公式现在默写出来我看看
: 我估计你也写不出来

n*****3
发帖数: 1584
20
这个centralimit 证明 从来就不简单吧

【在 l******n 的大作中提到】
: 大数据不等于码公编程!
: 码公也不需要写这些,别人写好的library你会用就好了,你天天写这个?
: 你个我证明个中心极限定理,你写的出来吗?
:
: 太大

相关主题
问一个严肃的实用问题嵌入式系统用什么sorting算法比较好?
underlying sort algorithm for SET in STL?我也来一个, quick sort 只要一行。
哪位大侠给说说 何时用 merge sort, 何时用 quick sort, 何时新手学JAVA,遇到一个难题,有大侠愿意帮忙吗?
进入Programming版参与讨论
H******7
发帖数: 1728
21
接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
★ 发自iPhone App: ChineseWeb 8.7
z****e
发帖数: 54598
22
人家学统计的
你把normal distribution的公式现在默写出来我看看
我估计你也写不出来
N********n
发帖数: 8363
23

LOL, 同感。电面这些号称懂BD的我一般都先问几个入门问题:你做BD最常见数
据结构是啥,这个数构适合干啥不适合干啥?你做BD最常用的算法是啥,算法
复杂度是多少。少数真懂得能对答如流、举一反三。大多数不懂的阿三张嘴要
么磕磕巴巴,要么胡说八道,统统秒FAIL。

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

g*********e
发帖数: 14401
24
搞大数据根本不需要算法
h*******u
发帖数: 15326
25
大数据特别需要算法,但是不需要qs这种算法

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
l*********s
发帖数: 5409
26
re.

【在 z****e 的大作中提到】
: 人家学统计的
: 你把normal distribution的公式现在默写出来我看看
: 我估计你也写不出来

h**********c
发帖数: 4120
27
file system 比大数据还大,可以zB level
那现在说说xfs 比ext4
ET
发帖数: 10701
28
啥是算法你咋理解的?

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
H******7
发帖数: 1728
29
这个区别很好解释
Ext4 最稳定也是不争的
XFS 有一些不错的功能snapshot什么的

★ 发自iPhone App: ChineseWeb 8.7

【在 h**********c 的大作中提到】
: file system 比大数据还大,可以zB level
: 那现在说说xfs 比ext4

h**********c
发帖数: 4120
30
本质还是要对数据的基础存放清晰,最少能找到文献

【在 H******7 的大作中提到】
: 这个区别很好解释
: Ext4 最稳定也是不争的
: XFS 有一些不错的功能snapshot什么的
:
: ★ 发自iPhone App: ChineseWeb 8.7

相关主题
求教:准备转行CS (转载)问个面试题
两行quicksort,不难些吧linux 文件大小的问题
Taobao TFS 架构及开源项目file modification questions in linux using c
进入Programming版参与讨论
H******7
发帖数: 1728
31
Fs结构很简单 无非是几个inode指来指去 加上一些extents的概念。
Tool都很全 ext2fs tools 什么的
xfstool也很好用

★ 发自iPhone App: ChineseWeb 8.7

【在 h**********c 的大作中提到】
: 本质还是要对数据的基础存放清晰,最少能找到文献
g*********e
发帖数: 14401
32
找工板上那些

【在 ET 的大作中提到】
: 啥是算法你咋理解的?
N********n
发帖数: 8363
33

这就好比说做数据库不需要懂SCHEMA DESIGN一样。

【在 g*********e 的大作中提到】
: 搞大数据根本不需要算法
c******o
发帖数: 1277
34
最近在帮忙,觉得搞大数据要的东西很多啊,倒是quicksort不是必须的。
我觉得对于如何提出一个问题,然后如何设计算法能并行处理需要考考。
还有就是常用的设计pitfall, 什么需要预处理,什么不需要,为什么,各有什么好处
害处。
关键就在于大和快,不需要多精巧,但是你要能设计一个,想快就快(堆资源能有效的
)也不容易啊。
都在细节, 我们一开始用spark的时候,不大的数据也老死。后来看spark的
caculation mode, code.
现在在并行/预处理上下功夫就好多了。
Y**G
发帖数: 1089
35
光大是没有用的。

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

w**z
发帖数: 8232
36
quick sort 很容易写吗?这种算法,只要知道意思,就行了。真当场写出来又如何?

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

h**********c
发帖数: 4120
37
It should allow random access, it a data type

【在 w**z 的大作中提到】
: quick sort 很容易写吗?这种算法,只要知道意思,就行了。真当场写出来又如何?
:
: 太大

l******n
发帖数: 9344
38
大数据不等于码公编程!
码公也不需要写这些,别人写好的library你会用就好了,你天天写这个?
你个我证明个中心极限定理,你写的出来吗?

太大

【在 H******7 的大作中提到】
: 接触 面试那些搞大数据的 简单的块排 二叉树都写不利索 这个领域忽悠太多 泡沫太大
: ★ 发自iPhone App: ChineseWeb 8.7

a*********a
发帖数: 3656
39
草, 正态分布就是 exp(-x^2/2s^2) 加个归一因子。搞统计和随即过程的,不可能写
不出来。

【在 z****e 的大作中提到】
: 人家学统计的
: 你把normal distribution的公式现在默写出来我看看
: 我估计你也写不出来

n*****3
发帖数: 1584
40
这个centralimit 证明 从来就不简单吧

【在 l******n 的大作中提到】
: 大数据不等于码公编程!
: 码公也不需要写这些,别人写好的library你会用就好了,你天天写这个?
: 你个我证明个中心极限定理,你写的出来吗?
:
: 太大

相关主题
file modification questions in linux using c我写的quick sort
并口驱动的一个问题 (转载)问一个简单问题的算法 (转载)
靠。Sedgewick这3w-qsort算法居然还有bug!几道面试题:memory, sort, 等
进入Programming版参与讨论
p********e
发帖数: 6030
41
楼主属于找医生开刀要先问问手术刀锻造技术的

【在 z****e 的大作中提到】
: 人家学统计的
: 你把normal distribution的公式现在默写出来我看看
: 我估计你也写不出来

k*******n
发帖数: 190
42
干嘛要会?金字塔越来越往上,只要知道上层的技术就可以了,底层就要抛在脑后。
N********n
发帖数: 8363
43

这个都不会就不要来面试DEV的工作, 也不要在简历上写自己是SR DEV。

【在 k*******n 的大作中提到】
: 干嘛要会?金字塔越来越往上,只要知道上层的技术就可以了,底层就要抛在脑后。
k*******n
发帖数: 190
44
DEV 是什么意思? SR DEV 是什么?
比 quick sort 还难吗?
不写难道就不能找工作了?
h*****y
发帖数: 298
45
能很快放狗搜出答案的知识都不值钱。码农最值钱的知识还是design。

【在 k*******n 的大作中提到】
: DEV 是什么意思? SR DEV 是什么?
: 比 quick sort 还难吗?
: 不写难道就不能找工作了?

w**z
发帖数: 8232
46
你搞笑吧?

【在 N********n 的大作中提到】
:
: 这个都不会就不要来面试DEV的工作, 也不要在简历上写自己是SR DEV。

h**********c
发帖数: 4120
47
java 的quick sort 用的是dual pivot qs,记得怎么有100多行,除非你预先知道考试
题,否则很难没有bug就重复。
而且这次问quick sort,下次问dirkstra
1 (共1页)
进入Programming版参与讨论
相关主题
我也来一个, quick sort 只要一行。并口驱动的一个问题 (转载)
新手学JAVA,遇到一个难题,有大侠愿意帮忙吗?靠。Sedgewick这3w-qsort算法居然还有bug!
求教:准备转行CS (转载)我写的quick sort
两行quicksort,不难些吧问一个简单问题的算法 (转载)
Taobao TFS 架构及开源项目几道面试题:memory, sort, 等
问个面试题请教一个初级算法问题 (转载)
linux 文件大小的问题算法之极弱问
file modification questions in linux using c问一个严肃的实用问题
相关话题的讨论汇总
话题: 数据话题: 算法话题: sort话题: 需要话题: 出来