由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - R 里边的 sqldf 真是个好东西
相关主题
学会python能找到工作吗C# 和 SQLite 连接的问题
技术问题探讨:数据处理谁给推荐一个好的javascript/jquery table库
data.table谁用过? 有那么神吗?贡献一个很好的模板网站
如何在C++下, 把一个DataColumn 中的值赋给一个_variant_t变量?三哥这次在微软裁人,非常正确。
c++ template中如何判断类型AI 工作16年翻倍了
一个搞统计的对C#的第一印象老生常谈,请教一个转行问题
怎么把一个Map放到queue里? (转载)minitab收购salford systems 你们怎么看?
水平表头怎样在ssh窗口内显示颜色?
相关话题的讨论汇总
话题: sqldf话题: dplyr话题: sql话题: 里边话题: good
进入Programming版参与讨论
1 (共1页)
d******a
发帖数: 32122
1
数据处理,直接SQL就解决了
什么dplyr data.table 根本就不用学
m******r
发帖数: 1033
2
我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周
期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理
由。
类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够
用了, (反正够我用了), 没必要再学新的。
l***k
发帖数: 1153
3
为啥不行,挺好一个package。对熟悉sql的人根本不用学

【在 m******r 的大作中提到】
: 我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周
: 期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理
: 由。
: 类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够
: 用了, (反正够我用了), 没必要再学新的。

d******a
发帖数: 32122
4
sql在几十年里久经考验,是工业标准,同时非常灵活强大
dplyr/data.table属于某个个人拍脑瓜搞出来的,通用性欠佳
https://www.mitbbs.com/article/Programming/31530989_3.html

【在 m******r 的大作中提到】
: 我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周
: 期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理
: 由。
: 类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够
: 用了, (反正够我用了), 没必要再学新的。

m******r
发帖数: 1033
5
sql是generic term, 类似于感冒药,消炎药, 磺胺类药物一样。
sql 66 or 56 是 ieee定的标准。 然后各大厂商, oracle/teradata/mysql...按照
该标准实现自己的产品。 对了还有sas. sas 实现了很少一部分,严格讲根本不能算
sql, 不过大家心知肚明, 一个统计软件,能把sql做成这样, 相当不错了。
后来不知道哪个2货在R里面也号称做了个sql, 我看了一眼,笑笑走开了。 网上对所谓
r/sql评论得都很少。 根本就是玩具里的玩具。 大家普遍用dplyr or data.table.
R里面垃圾我见多了 。 信专家的话吧, 得永生。
另外, 的确dplyr , data.table是一个人拍脑袋拍出来的, 这也恰恰给海老师‘二人
论’ ( 我管它叫二人转)提供了实例。
另外, R 是从S演变来, S的作者公认是三个人, 贝尔实验室的。
SAS的作者,三个人,似乎是两男一女, 其中一个中途退出。
随机森林作者, 一个人, 斯坦福教授,前两年被minitab买了。

【在 d******a 的大作中提到】
: sql在几十年里久经考验,是工业标准,同时非常灵活强大
: dplyr/data.table属于某个个人拍脑瓜搞出来的,通用性欠佳
: https://www.mitbbs.com/article/Programming/31530989_3.html

d******a
发帖数: 32122
6
各大厂商的sql的确有差异,但是主体是一致的。无非就是美国北方口音和南方口音的
区别。
的确大家普遍用dplyr or data.table,这可能跟用R的学统计的居多,而这些人不学
sql有关。
但是那些长期用sql的,用sqldf处理数据就是信手拈来。
dplyr实际也是根据SQL草创的,但是草创的时候想简单了,导致字段名不能加引号,也
就失去了动态灵活。估计学统计的人也不用动态决定字段名。后来打了补丁,但是很不
好看。

【在 m******r 的大作中提到】
: sql是generic term, 类似于感冒药,消炎药, 磺胺类药物一样。
: sql 66 or 56 是 ieee定的标准。 然后各大厂商, oracle/teradata/mysql...按照
: 该标准实现自己的产品。 对了还有sas. sas 实现了很少一部分,严格讲根本不能算
: sql, 不过大家心知肚明, 一个统计软件,能把sql做成这样, 相当不错了。
: 后来不知道哪个2货在R里面也号称做了个sql, 我看了一眼,笑笑走开了。 网上对所谓
: r/sql评论得都很少。 根本就是玩具里的玩具。 大家普遍用dplyr or data.table.
: R里面垃圾我见多了 。 信专家的话吧, 得永生。
: 另外, 的确dplyr , data.table是一个人拍脑袋拍出来的, 这也恰恰给海老师‘二人
: 论’ ( 我管它叫二人转)提供了实例。
: 另外, R 是从S演变来, S的作者公认是三个人, 贝尔实验室的。

h**********9
发帖数: 1
7
DPLYR is good for small datatables, but more native to R environment and so
more flexible.
SQLDF is good for large database, but it is a wrapper so may have issues
difficult to debug.
Both are good in their preferred scenarios. Like python vs java for ds.
1 (共1页)
进入Programming版参与讨论
相关主题
Python的问题c++ template中如何判断类型
有什么软件包可以解这种优化问题?一个搞统计的对C#的第一印象
急求一个能读取BMP每个象素RGB信息的软件 (转载)怎么把一个Map放到queue里? (转载)
问个数值计算软件的问题水平表头
学会python能找到工作吗C# 和 SQLite 连接的问题
技术问题探讨:数据处理谁给推荐一个好的javascript/jquery table库
data.table谁用过? 有那么神吗?贡献一个很好的模板网站
如何在C++下, 把一个DataColumn 中的值赋给一个_variant_t变量?三哥这次在微软裁人,非常正确。
相关话题的讨论汇总
话题: sqldf话题: dplyr话题: sql话题: 里边话题: good