l****y 发帖数: 108 | 1 上次面试被问到
什么情况下用sql merge好
什么情况下用data step好
我没有什么大型数据处理的经验,我觉得两个差不多,不知道哪个快
data merge 要先sort,sql不用sort
所以我就说大的用sql,小的用data merge
好像又不太对,求解答啊!!! |
k*******a 发帖数: 772 | 2 这个两个方法 many to many merge的时候结果是不同的 |
a******n 发帖数: 11246 | 3 如果两个表都有变量"ID",都是唯一的。这种情况区别在哪里?
速度方面sql是不是会快一些?
【在 k*******a 的大作中提到】 : 这个两个方法 many to many merge的时候结果是不同的
|
h******s 发帖数: 3420 | 4 傻瓜相机和单反相机的区别
【在 l****y 的大作中提到】 : 上次面试被问到 : 什么情况下用sql merge好 : 什么情况下用data step好 : 我没有什么大型数据处理的经验,我觉得两个差不多,不知道哪个快 : data merge 要先sort,sql不用sort : 所以我就说大的用sql,小的用data merge : 好像又不太对,求解答啊!!!
|
l****y 发帖数: 108 | 5
我记得manyto many的时候,sql得到的是一个更大的结果
比如 2obs merge 2obs,sql结果有4obs,merge好像就
只有2obs
我也不知道对不对
【在 a******n 的大作中提到】 : 如果两个表都有变量"ID",都是唯一的。这种情况区别在哪里? : 速度方面sql是不是会快一些?
|
l****y 发帖数: 108 | 6
merge是傻瓜
sql是单反?
具体上哪个更快呢,除了结果不一样,还有什么别的优劣比较呢
【在 h******s 的大作中提到】 : 傻瓜相机和单反相机的区别
|
p***r 发帖数: 920 | 7 1.单就merge功能而言,区别在于many to many match
2.sql merge 相对容易,能理解
3.data step 可以在 merge 的同时做其他许多事情,比如,你要找出那些不 match 的
observation, 或者要进行很多的 format 和计算, data step 比较合适 raw data
processing and QA.
4.速度上,在SAS系统下没有太大区别,如果数据太大超过几个G,估计都干不了(我猜的
)。
记住最重要的一点,sql 是 Cartesian product, data step is PDV. |
n**********r 发帖数: 96 | 8 proc sql结构易懂,merge快,
proc sql只能合并出一个表,merge可合并产生出多个表
一对一,一对多,两者结果一样的,proc sql不用sort,merge要sort
多对多不一样:
当by变量只有相同值时,merge产生与第一个data set相同数量的obs,而proc sql产生
cartesian product.
当by变量有不同值时,merge产生最多的obs,proc sql只输出by的match的obs |