由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请教一下R的Data Manipulation
相关主题
请教一个用SAS作DATA MERGE的问题求助:变态老板不喜欢SAS code里面有SQL
which route in SAS is faster?珍惜生命,远离hsbc。
问个效率问题 SQL vs data step,大数据量How to do "data quality check in a methodical manner" By SAS or Proc SQL ?
为什么合并这两个数据不能用sas merge 而要用SAS SQLHOW TO UPDATE DATA BY STRATUM
求助:data manipulation的一个问题[合集] way to do exclusive outer join by proc sql
关于merge data的问题!!!刚刚面完
SAS SQL 请教interview questions about data management
请教:get next record using BY group (SAS code data manipulation)请问SAS proc中哪些可以算出CI
相关话题的讨论汇总
话题: data话题: sas话题: sql话题: summary
进入Statistics版参与讨论
1 (共1页)
d********n
发帖数: 279
1
我以前一直用SAS,现在在自学R,哪位能推荐一本好的的关于R Data Manipulation的
书或者网上资料啊?我想把手上的一些用SAS写的模型用R重新写一遍,SAS用惯了,不
知道R怎么可以比较efficient的实现SAS里面的data manipulation(比如proc summary,
data step里的merge, etc). 非常感谢。
v*******e
发帖数: 11604
2

summary,
R里有merge()函数,可以实现merge操作。
R里面有summary()函数。
基本上,如果你的模型是标准、常用的,R里都有了,网上找别人的实现。
如果是新的、只有你写过的,可以用R改写。
一个warning是R的Data Manipulation不方便,比python差远了。Trap很多,容易上当
。最好是把数据用python处理好了,然后用R的统计程序直接计算。

【在 d********n 的大作中提到】
: 我以前一直用SAS,现在在自学R,哪位能推荐一本好的的关于R Data Manipulation的
: 书或者网上资料啊?我想把手上的一些用SAS写的模型用R重新写一遍,SAS用惯了,不
: 知道R怎么可以比较efficient的实现SAS里面的data manipulation(比如proc summary,
: data step里的merge, etc). 非常感谢。

n*****3
发帖数: 1584
3
读读 dplyr package, 70%80%的data wranger need 都有了, 速度还狠快。
现在大多R的书不够新 up to date

【在 v*******e 的大作中提到】
:
: summary,
: R里有merge()函数,可以实现merge操作。
: R里面有summary()函数。
: 基本上,如果你的模型是标准、常用的,R里都有了,网上找别人的实现。
: 如果是新的、只有你写过的,可以用R改写。
: 一个warning是R的Data Manipulation不方便,比python差远了。Trap很多,容易上当
: 。最好是把数据用python处理好了,然后用R的统计程序直接计算。

f********n
发帖数: 1647
4
用R调用SQL
d********n
发帖数: 279
5
非常感谢。summary()函数好像不可以有SAS Proc Summary里by/class的功能?

【在 v*******e 的大作中提到】
:
: summary,
: R里有merge()函数,可以实现merge操作。
: R里面有summary()函数。
: 基本上,如果你的模型是标准、常用的,R里都有了,网上找别人的实现。
: 如果是新的、只有你写过的,可以用R改写。
: 一个warning是R的Data Manipulation不方便,比python差远了。Trap很多,容易上当
: 。最好是把数据用python处理好了,然后用R的统计程序直接计算。

d********n
发帖数: 279
6
多谢。我去读读dplyr看。

【在 n*****3 的大作中提到】
: 读读 dplyr package, 70%80%的data wranger need 都有了, 速度还狠快。
: 现在大多R的书不够新 up to date

d********n
发帖数: 279
7
能不用SQL我就尽量不用SQL。就比如SAS里面,基本的数据处理我都用data step和proc
summary。可能是我的SQL技术不太好,我总觉得SAS code里面混了proc sql的话,
code的可读性会变差。

【在 f********n 的大作中提到】
: 用R调用SQL
v*******e
发帖数: 11604
8

容易实现吧。

【在 d********n 的大作中提到】
: 非常感谢。summary()函数好像不可以有SAS Proc Summary里by/class的功能?
l******n
发帖数: 9344
9
sqldf还是不错的,内存够大的话速度很快

proc

【在 d********n 的大作中提到】
: 能不用SQL我就尽量不用SQL。就比如SAS里面,基本的数据处理我都用data step和proc
: summary。可能是我的SQL技术不太好,我总觉得SAS code里面混了proc sql的话,
: code的可读性会变差。

n*****3
发帖数: 1584
10
SQL is good for some task for some
task and bad for others.
btw dplyr borrow a lot of idea from sql too

【在 f********n 的大作中提到】
: 用R调用SQL
1 (共1页)
进入Statistics版参与讨论
相关主题
请问SAS proc中哪些可以算出CI求助:data manipulation的一个问题
请教一个看起来挺简单但我怎么也弄不出来的sas程序关于merge data的问题!!!
[合集] 问个SAS和R的问题SAS SQL 请教
SAS memory management请教:get next record using BY group (SAS code data manipulation)
请教一个用SAS作DATA MERGE的问题求助:变态老板不喜欢SAS code里面有SQL
which route in SAS is faster?珍惜生命,远离hsbc。
问个效率问题 SQL vs data step,大数据量How to do "data quality check in a methodical manner" By SAS or Proc SQL ?
为什么合并这两个数据不能用sas merge 而要用SAS SQLHOW TO UPDATE DATA BY STRATUM
相关话题的讨论汇总
话题: data话题: sas话题: sql话题: summary