由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 关于merge data的问题!!!
相关主题
问个效率问题 SQL vs data step,大数据量请问SAS大牛一个关于proc sql join
SAS问题请教一个实际应用的SAS问题
问个SAS数据处理的问题请教一个SAS code
请教一个用SAS作DATA MERGE的问题windows下用batch submit 两个SAS code文件
请教一下R的Data Manipulation[合集] 生物统计硕士找工作,药厂SAS Programmer vs非药厂Biostatis
SAS 中match-merge两个data set的问题HOW TO UPDATE DATA BY STRATUM
Dataset merge的一个问题请教个菜鸟r code问题,一晚上也没搞明白,痛苦。。。
求一段SAS codeSAS中如何只保留变量名中含有reading的变量啊
相关话题的讨论汇总
话题: merge话题: data话题: sql话题: 下用话题: proc
进入Statistics版参与讨论
1 (共1页)
l****y
发帖数: 108
1
上次面试被问到
什么情况下用sql merge好
什么情况下用data step好
我没有什么大型数据处理的经验,我觉得两个差不多,不知道哪个快
data merge 要先sort,sql不用sort
所以我就说大的用sql,小的用data merge
好像又不太对,求解答啊!!!
k*******a
发帖数: 772
2
这个两个方法 many to many merge的时候结果是不同的
a******n
发帖数: 11246
3
如果两个表都有变量"ID",都是唯一的。这种情况区别在哪里?
速度方面sql是不是会快一些?

【在 k*******a 的大作中提到】
: 这个两个方法 many to many merge的时候结果是不同的
h******s
发帖数: 3420
4
傻瓜相机和单反相机的区别

【在 l****y 的大作中提到】
: 上次面试被问到
: 什么情况下用sql merge好
: 什么情况下用data step好
: 我没有什么大型数据处理的经验,我觉得两个差不多,不知道哪个快
: data merge 要先sort,sql不用sort
: 所以我就说大的用sql,小的用data merge
: 好像又不太对,求解答啊!!!

l****y
发帖数: 108
5

我记得manyto many的时候,sql得到的是一个更大的结果
比如 2obs merge 2obs,sql结果有4obs,merge好像就
只有2obs
我也不知道对不对

【在 a******n 的大作中提到】
: 如果两个表都有变量"ID",都是唯一的。这种情况区别在哪里?
: 速度方面sql是不是会快一些?

l****y
发帖数: 108
6

merge是傻瓜
sql是单反?
具体上哪个更快呢,除了结果不一样,还有什么别的优劣比较呢

【在 h******s 的大作中提到】
: 傻瓜相机和单反相机的区别
p***r
发帖数: 920
7
1.单就merge功能而言,区别在于many to many match
2.sql merge 相对容易,能理解
3.data step 可以在 merge 的同时做其他许多事情,比如,你要找出那些不 match 的
observation, 或者要进行很多的 format 和计算, data step 比较合适 raw data
processing and QA.
4.速度上,在SAS系统下没有太大区别,如果数据太大超过几个G,估计都干不了(我猜的
)。
记住最重要的一点,sql 是 Cartesian product, data step is PDV.
n**********r
发帖数: 96
8
proc sql结构易懂,merge快,
proc sql只能合并出一个表,merge可合并产生出多个表
一对一,一对多,两者结果一样的,proc sql不用sort,merge要sort
多对多不一样:
当by变量只有相同值时,merge产生与第一个data set相同数量的obs,而proc sql产生
cartesian product.
当by变量有不同值时,merge产生最多的obs,proc sql只输出by的match的obs
1 (共1页)
进入Statistics版参与讨论
相关主题
SAS中如何只保留变量名中含有reading的变量啊请教一下R的Data Manipulation
interview questions about data managementSAS 中match-merge两个data set的问题
问个简单的SAS如何找出某个变量最大之所在的行?Dataset merge的一个问题
请教一个问题,谢谢。求一段SAS code
问个效率问题 SQL vs data step,大数据量请问SAS大牛一个关于proc sql join
SAS问题请教一个实际应用的SAS问题
问个SAS数据处理的问题请教一个SAS code
请教一个用SAS作DATA MERGE的问题windows下用batch submit 两个SAS code文件
相关话题的讨论汇总
话题: merge话题: data话题: sql话题: 下用话题: proc