由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Database版 - 我经常问的几道SQL SERVER DBA的面试题,图省事不问编程
相关主题
到底啥样的人在做contract工作看来不做DATAWAREHOUSE不行了
求助:工科博士背景,年纪较大,还能转DBA方向吗?做DW的,如何估计/衡量一项任务的工作量?
我招的DBA还是很厉害的BI难在哪?我用sql server,visual studio,ssis做,就是扯控件,非常简单自如啊。
好奇大家的数据库都是啥样的ralph kimball 的书要买那一本呢
15万收入怎么样求指教 分布式数据库 对 DBA是透明的吗?
请教database developer职业发展方向生物实验员进数据界做BI
list duplicators in one table我的背景做BI需要准备什么?求高人指点
Multi-Dimensional Databases找duplicate row的最有效的sql statement?
相关话题的讨论汇总
话题: server话题: table话题: dba话题: sql话题: duplicate
进入Database版参与讨论
1 (共1页)
g***l
发帖数: 18555
1
1.你觉得SQL SERVER的内存不够了,你怎么告诉IT MANAGER内存不够了,用什么软件,
什么参数,什么COMMAND
2.MANAGER给你一个SQL SERVER 的TABLE,比如CUSTOMER,2MILLION RECORDS,要你
LOAD到自己的CUSTOMER TABLE里去,你怀疑有DUPLICATE,MANAGER不在,你又必须把
TABLE LOAD进去,你怎么处理呢
3.SQL SERVER DATABASE RECOVERY MODEL有几种,有什么不同,为什么要用某一种,我
有一个20TB每天都要全部REFRESH的DATAWAREHOUSE用哪一种
4.为什么要用CTE而不用TEMP TABLE,CTE和TABLE VARIABLE有什么不同
5.我有200个BACKUP每天都要做,我怎么知道哪个BACKUP没完成HANG了,或者FAIL掉了
g***l
发帖数: 18555
2
最近单位在招人,我每次就选5道问问,上次有个人只答上了一道,还是有10年经验的
DBA,太搞笑了。
i****a
发帖数: 36252
3
what's the salary range?

【在 g***l 的大作中提到】
: 最近单位在招人,我每次就选5道问问,上次有个人只答上了一道,还是有10年经验的
: DBA,太搞笑了。

g***l
发帖数: 18555
4
看水平了,你要是考试考的好,水平高,可以给9万,考不好,就难说了。明天又有人
来考试,老板要我接待,我都成秘书了。

【在 i****a 的大作中提到】
: what's the salary range?
B*****g
发帖数: 34098
5
location?

【在 g***l 的大作中提到】
: 看水平了,你要是考试考的好,水平高,可以给9万,考不好,就难说了。明天又有人
: 来考试,老板要我接待,我都成秘书了。

g***l
发帖数: 18555
6
三地牙割

【在 B*****g 的大作中提到】
: location?
B*****g
发帖数: 34098
7
CA senior DBA 9万?

【在 g***l 的大作中提到】
: 三地牙割
z***y
发帖数: 7151
8
你确定是90k 吗在SD?

【在 g***l 的大作中提到】
: 看水平了,你要是考试考的好,水平高,可以给9万,考不好,就难说了。明天又有人
: 来考试,老板要我接待,我都成秘书了。

B*****g
发帖数: 34098
9
老大亲自代表DC地区来BSO呀。

【在 z***y 的大作中提到】
: 你确定是90k 吗在SD?
z***y
发帖数: 7151
10
表酱子。 我求证一下。

【在 B*****g 的大作中提到】
: 老大亲自代表DC地区来BSO呀。
相关主题
请教database developer职业发展方向看来不做DATAWAREHOUSE不行了
list duplicators in one table做DW的,如何估计/衡量一项任务的工作量?
Multi-Dimensional DatabasesBI难在哪?我用sql server,visual studio,ssis做,就是扯控件,非常简单自如啊。
进入Database版参与讨论
g***l
发帖数: 18555
11
是的,SENIOR不给TITLE,就是个DBA,现在就这样,庙小钱少。

【在 z***y 的大作中提到】
: 你确定是90k 吗在SD?
B*****g
发帖数: 34098
12
跳吧。

【在 g***l 的大作中提到】
: 是的,SENIOR不给TITLE,就是个DBA,现在就这样,庙小钱少。
g***l
发帖数: 18555
13
这好歹是个铁饭碗,公司在增长,你就是去QCOM,也说不定哪天就倒了。我先攒点钱,
保证一年饿不死再跳。现在就业形势还是不行,LOW BALL也有人上的。

【在 B*****g 的大作中提到】
: 跳吧。
B*****g
发帖数: 34098
14
工作清闲也行,像俺这样的。

【在 g***l 的大作中提到】
: 这好歹是个铁饭碗,公司在增长,你就是去QCOM,也说不定哪天就倒了。我先攒点钱,
: 保证一年饿不死再跳。现在就业形势还是不行,LOW BALL也有人上的。

g***l
发帖数: 18555
15
平时忙死啦,今天老板去度假了才有空上来,不过跟他学了不少东西,好多编程思路只
有大家交流过之后才知道哪种是最好的,那些是错误的。

【在 B*****g 的大作中提到】
: 工作清闲也行,像俺这样的。
l***6
发帖数: 167
16
答案 呢?
g***l
发帖数: 18555
17
不是有GOOGLE吗

【在 l***6 的大作中提到】
: 答案 呢?
n*w
发帖数: 3393
18
第二题题意有点不明白。
怀疑有DUPLICATE,MANAGER就写个query查查就是了。
不是每个column都一样的duplicate也没什么办法吧。暂时不load?
5是看看dba会不会用dbmail?

【在 g***l 的大作中提到】
: 1.你觉得SQL SERVER的内存不够了,你怎么告诉IT MANAGER内存不够了,用什么软件,
: 什么参数,什么COMMAND
: 2.MANAGER给你一个SQL SERVER 的TABLE,比如CUSTOMER,2MILLION RECORDS,要你
: LOAD到自己的CUSTOMER TABLE里去,你怀疑有DUPLICATE,MANAGER不在,你又必须把
: TABLE LOAD进去,你怎么处理呢
: 3.SQL SERVER DATABASE RECOVERY MODEL有几种,有什么不同,为什么要用某一种,我
: 有一个20TB每天都要全部REFRESH的DATAWAREHOUSE用哪一种
: 4.为什么要用CTE而不用TEMP TABLE,CTE和TABLE VARIABLE有什么不同
: 5.我有200个BACKUP每天都要做,我怎么知道哪个BACKUP没完成HANG了,或者FAIL掉了
: 。

g***l
发帖数: 18555
19
有的JOB HANG了并不FAIL,只是运行不完还在RUN,发不出EMAIL
DUPLICATE有几种,怎么DE-DUP每个DBA都应该有经历,如果你说不出来,说明不是有经
验的DBA

【在 n*w 的大作中提到】
: 第二题题意有点不明白。
: 怀疑有DUPLICATE,MANAGER就写个query查查就是了。
: 不是每个column都一样的duplicate也没什么办法吧。暂时不load?
: 5是看看dba会不会用dbmail?

n*w
发帖数: 3393
20
写个job定时查是不是有backup job或session超过一定时间?我不是dba没写过。
duplicate两种吧。容易去掉的是所有column都一样的。没法去掉的是pk/ck一样但有别
的column不一样。还有别的情况吗?

【在 g***l 的大作中提到】
: 有的JOB HANG了并不FAIL,只是运行不完还在RUN,发不出EMAIL
: DUPLICATE有几种,怎么DE-DUP每个DBA都应该有经历,如果你说不出来,说明不是有经
: 验的DBA

相关主题
ralph kimball 的书要买那一本呢我的背景做BI需要准备什么?求高人指点
求指教 分布式数据库 对 DBA是透明的吗?找duplicate row的最有效的sql statement?
生物实验员进数据界做BI请问有没有带DBA培训的美国CC
进入Database版参与讨论
g***l
发帖数: 18555
21
不用,去JOBHISTORY QUERY一下就知道了,比如早上8点应该有200个BACKUP HISTORY,
如果缺,就发EMAIL,而且缺哪个也很容易找出来,每天到单位一个EMAIL就知道哪个少
了。
DUP有两种,RECORD DUPLICATE和KEY DUPLICATE,前者用个DISTINCT就可以了,后者
GROUP BY KEY,DUPLICATE KEY的剔除出来放一边做EXCEPTION,其余的LOAD进去

【在 n*w 的大作中提到】
: 写个job定时查是不是有backup job或session超过一定时间?我不是dba没写过。
: duplicate两种吧。容易去掉的是所有column都一样的。没法去掉的是pk/ck一样但有别
: 的column不一样。还有别的情况吗?

k**0
发帖数: 19737
22
SQl DBA才9万, 真不值钱啊。自问对SQL SERVER也算入门了,只能答个2道半。当然做
软件开发多点, 不是光DBA。
B*****g
发帖数: 34098
23
其实只问第一题就够了。

【在 k**0 的大作中提到】
: SQl DBA才9万, 真不值钱啊。自问对SQL SERVER也算入门了,只能答个2道半。当然做
: 软件开发多点, 不是光DBA。

a9
发帖数: 21638
24
taskmgr?哈哈

然做

【在 B*****g 的大作中提到】
: 其实只问第一题就够了。
z***y
发帖数: 7151
25
怎样查Duplicated records? 我很久以前做过一个Siebel 7 db 和其他SQL Server db
merge/replication 的项目。 开始也是这样做, 但是数据流太大,系统资源占用很高

一年以后用户又把我叫回去, 最后改用checksum,快多了。 你不妨试试。

【在 g***l 的大作中提到】
: 不用,去JOBHISTORY QUERY一下就知道了,比如早上8点应该有200个BACKUP HISTORY,
: 如果缺,就发EMAIL,而且缺哪个也很容易找出来,每天到单位一个EMAIL就知道哪个少
: 了。
: DUP有两种,RECORD DUPLICATE和KEY DUPLICATE,前者用个DISTINCT就可以了,后者
: GROUP BY KEY,DUPLICATE KEY的剔除出来放一边做EXCEPTION,其余的LOAD进去

l***6
发帖数: 167
26
答案 呢?
B*****g
发帖数: 34098
27
ding.
有没有直接link将这个checksum方法的。

db

【在 z***y 的大作中提到】
: 怎样查Duplicated records? 我很久以前做过一个Siebel 7 db 和其他SQL Server db
: merge/replication 的项目。 开始也是这样做, 但是数据流太大,系统资源占用很高
: 。
: 一年以后用户又把我叫回去, 最后改用checksum,快多了。 你不妨试试。

B*****g
发帖数: 34098
28
因为我就不会第一个,哈哈。

【在 a9 的大作中提到】
: taskmgr?哈哈
:
: 然做

a9
发帖数: 21638
29
同求。

Server
很高

【在 B*****g 的大作中提到】
: ding.
: 有没有直接link将这个checksum方法的。
:
: db

z***y
发帖数: 7151
30

http://msdn.microsoft.com/en-us/library/aa258245%28v=sql.80%29.

【在 B*****g 的大作中提到】
: ding.
: 有没有直接link将这个checksum方法的。
:
: db

相关主题
best practices for sql developer求助:工科博士背景,年纪较大,还能转DBA方向吗?
也問 Common Table Expression 问题我招的DBA还是很厉害的
到底啥样的人在做contract工作好奇大家的数据库都是啥样的
进入Database版参与讨论
a9
发帖数: 21638
31
哦,等于先算好checksum哈。

【在 z***y 的大作中提到】
:
: http://msdn.microsoft.com/en-us/library/aa258245%28v=sql.80%29.

B*****g
发帖数: 34098
32
要是常年对同一个table check,这个还是有优势的。
NND, lob data not comparable

【在 a9 的大作中提到】
: 哦,等于先算好checksum哈。
a9
发帖数: 21638
33
自己算好了。用md5,重复可能性更小。

【在 B*****g 的大作中提到】
: 要是常年对同一个table check,这个还是有优势的。
: NND, lob data not comparable

g***l
发帖数: 18555
34
我这些问题都是我去面试的时候别人问过多次的,我觉得比较好就保留下来了。
B*****g
发帖数: 34098
35
把问题都发给我吧,准备找工作。

【在 g***l 的大作中提到】
: 我这些问题都是我去面试的时候别人问过多次的,我觉得比较好就保留下来了。
g***l
发帖数: 18555
36
多数都是问一些常识性问题,然后问几个他们遇到的问题,如果当时解决不了,估计就
没戏了。北京大姐这么舒服还找啥工作啊

【在 B*****g 的大作中提到】
: 把问题都发给我吧,准备找工作。
B*****g
发帖数: 34098
37
准备找14W的工作,另外我是90后

【在 g***l 的大作中提到】
: 多数都是问一些常识性问题,然后问几个他们遇到的问题,如果当时解决不了,估计就
: 没戏了。北京大姐这么舒服还找啥工作啊

g***l
发帖数: 18555
38
CHECKSUM不是做HASH INDEX的么,不是真正的DUPLICATE,而是相似的,比如看
CUSTOMER是不是同一个,可以用LAST NAME+FIRST NAME + ZIPCODE,每个公司有不同的
MATCH CODE,一般面试不会问这种问题,还有专门的软件MATCH的,跟本不用自己去写
CODE,而且搞的也不准。
g***l
发帖数: 18555
39
还有,前面一个说的是ETL进去,去DUP,好像不是真正的DUP,不同环境ETL,首先要把
数据原封不动的LOAD进去,然后在一个系统做各种CHECK,DE-DUP,一步一步的走,异源
ETL要保证快,原封不动保证完整性,要不然人家问起来,我的数据怎么少了,你在哪
一步给扔的,你找不出来,人家就对你的DW持怀疑态度,分析出来的东西也没啥意义。
B*****g
发帖数: 34098
40
ETL software可以处理

【在 g***l 的大作中提到】
: 还有,前面一个说的是ETL进去,去DUP,好像不是真正的DUP,不同环境ETL,首先要把
: 数据原封不动的LOAD进去,然后在一个系统做各种CHECK,DE-DUP,一步一步的走,异源
: ETL要保证快,原封不动保证完整性,要不然人家问起来,我的数据怎么少了,你在哪
: 一步给扔的,你找不出来,人家就对你的DW持怀疑态度,分析出来的东西也没啥意义。

相关主题
好奇大家的数据库都是啥样的list duplicators in one table
15万收入怎么样Multi-Dimensional Databases
请教database developer职业发展方向看来不做DATAWAREHOUSE不行了
进入Database版参与讨论
z***y
发帖数: 7151
41
你确定吗?

【在 g***l 的大作中提到】
: CHECKSUM不是做HASH INDEX的么,不是真正的DUPLICATE,而是相似的,比如看
: CUSTOMER是不是同一个,可以用LAST NAME+FIRST NAME + ZIPCODE,每个公司有不同的
: MATCH CODE,一般面试不会问这种问题,还有专门的软件MATCH的,跟本不用自己去写
: CODE,而且搞的也不准。

g***l
发帖数: 18555
42
我干过的几个公司都有自己MATCH CODE,现在的公司是自己买的软件,专门MATCH同一
个人的EMAIL,确定地址都用QAS

【在 z***y 的大作中提到】
: 你确定吗?
k****i
发帖数: 1072
43
hash value不保证unique啊.

【在 z***y 的大作中提到】
: 你确定吗?
B*****g
发帖数: 34098
44
看概率了,如果hash重复概率很低的话,凡是hash以后不一样,可以认为不同,如果一
样,再比一次真实质

【在 k****i 的大作中提到】
: hash value不保证unique啊.
a***y
发帖数: 2803
45
一哥从ohio到san diego了?

【在 g***l 的大作中提到】
: 三地牙割
1 (共1页)
进入Database版参与讨论
相关主题
找duplicate row的最有效的sql statement?15万收入怎么样
请问有没有带DBA培训的美国CC请教database developer职业发展方向
best practices for sql developerlist duplicators in one table
也問 Common Table Expression 问题Multi-Dimensional Databases
到底啥样的人在做contract工作看来不做DATAWAREHOUSE不行了
求助:工科博士背景,年纪较大,还能转DBA方向吗?做DW的,如何估计/衡量一项任务的工作量?
我招的DBA还是很厉害的BI难在哪?我用sql server,visual studio,ssis做,就是扯控件,非常简单自如啊。
好奇大家的数据库都是啥样的ralph kimball 的书要买那一本呢
相关话题的讨论汇总
话题: server话题: table话题: dba话题: sql话题: duplicate