由买买提看人间百态

topics

全部话题 - 话题: rstudio
1 2 3 下页 末页 (共3页)
n******7
发帖数: 12463
1
都有Anaconda这样的python dist了
感觉出个对应的IDE是很自然的事情
matlab的用户已经被R抢了不少了,特别是Rstudio出来之后
这个在R用户群里面一统江湖
matlab/R/numpy+scipy 的重叠区域还是挺大的
参见 http://hyperpolyglot.org/numerical-analysis
考虑到free,性能和通用能力,我感觉在big data时代python挺有戏
R需要提高性能,不然也悬
matlab用户群回越来越小
其实这样一个IDE不需要多傻瓜化,只要4个panel就好了
一个编辑code,一个interactive run,一个visualization,一个misc
p*******t
发帖数: 501
2
我在用Rstudio抓一个中文网站,但是抓下来的老是乱码。根据版上大佬的指点用rvest
package,但是还是没啥变化。我google了下,但是没找到可以用的办法。有人有经验
么?
btw,我用了这个function指定成UTF-8码。
forumpage <- read_html(furl, encoding = "UTF-8"),还是不work.
g****t
发帖数: 31659
3
来自主题: Programming版 - Rstudio 1.0 released
Rstudio looks better. However, it looks to me that the Emacs is still much
better in the exploratory/investigating programming area.
d*******o
发帖数: 493
4
来自主题: Statistics版 - 【R】 RStudio Server
装RStudio Server,要用ubuntu的企业版,还是一般的版本就可以了,多谢 .
d******c
发帖数: 2407
5
rstudio老板还是很有眼光的。他的目标就是做工具做好,一开始就用web技术,最初的
定位rstudio本来是个server端,是发布前临时打包成桌面端程序,所以rstudio
server一直就和桌面端一起发布,两者一回事。
发现需要个展示平台,弄出了shiny,把html js的能力和R的后台结合起来。有了
htmlwidget,随便什么js库都能打包,比如leaflet。
把Hadley招过去
开始搞deep learning的R接口,老板亲自动手写
https://github.com/rstudio/tensorflow/graphs/contributors
S****7
发帖数: 9
6
【 以下文字转载自 DataSciences 讨论区 】
发信人: SQyue7 (SQ), 信区: DataSciences
标 题: database startup の 广告~ (不是骗子)
关键字: database,high performance
发信站: BBS 未名空间站 (Sun Aug 24 05:03:20 2014, 美东)
小弟我所在的公司叫做 LightMiner Systems,是坐落在Palo Alto的一个小小的
startup
我们的产品是类似 Vertica 的 data analytic platform ,简单来说就是包括一个
database,一个 web based workspace 可以运行 SQL 和 Rstudio,一些重新写的
paralleled machine learning R function
相比 Vertica,我们的 database 做 Query 更快,而且便宜一些(公司目前需要
sales 来做 user case 用于第二轮的 fund raising,所以卖良心价)我手上有公司的
white
pape... 阅读全帖
S****7
发帖数: 9
7
【 以下文字转载自 DataSciences 讨论区 】
发信人: SQyue7 (SQ), 信区: DataSciences
标 题: database startup の 广告~ (不是骗子)
关键字: database,high performance
发信站: BBS 未名空间站 (Sun Aug 24 05:03:20 2014, 美东)
小弟我所在的公司叫做 LightMiner Systems,是坐落在Palo Alto的一个小小的
startup
我们的产品是类似 Vertica 的 data analytic platform ,简单来说就是包括一个
database,一个 web based workspace 可以运行 SQL 和 Rstudio,一些重新写的
paralleled machine learning R function
相比 Vertica,我们的 database 做 Query 更快,而且便宜一些(公司目前需要
sales 来做 user case 用于第二轮的 fund raising,所以卖良心价)我手上有公司的
white
pape... 阅读全帖
S****7
发帖数: 9
8
来自主题: DataSciences版 - database startup の 广告~ (不是骗子)
小弟我所在的公司叫做 LightMiner Systems,是坐落在Palo Alto的一个小小的
startup
我们的产品是类似 Vertica 的 data analytic platform ,简单来说就是包括一个
database,一个 web based workspace 可以运行 SQL 和 Rstudio,一些重新写的
paralleled machine learning R function
相比 Vertica,我们的 database 做 Query 更快,而且便宜一些(公司目前需要
sales 来做 user case 用于第二轮的 fund raising,所以卖良心价)我手上有公司的
white
paper,里面有和其他公司产品比较的 test case。就我看到的数
据,我们比 Vertica 有几百倍的 speedup。
公司十几个人就我是中国人。他们多少喜欢吹,而且我们外包的销售团队都是吹嘘派的
。所以我相信老板是找了差距最大的 test case 写进 white paper。虽然我目前很菜,
很多概念都没搞懂,但如果需要,我会相对客观的提供有用... 阅读全帖
c*****i
发帖数: 14
9
可以联系 RStudio's team:
http://www.rstudio.com/training/instructors
上个月在STRATA 会议上听过他们的讲座。看来经验还不错。
d******a
发帖数: 32122
10
来自主题: PhotoGear版 - 硬盘恢复?
Rstudio连这个都能干?


: 建议,先对全盘镜像。然后在尝试恢复。

: 推荐国产工具diskgenius。非常好用。

: 另外一个就是Rstudio。

c*m
发帖数: 1114
11
看你的运行环境:
Ubuntu下如果你的 R 够新 >2.11 (x64 stable里面可能R没这么新), 你可以用RStudio
.
其他通用情况下推荐Eclipse IDE的StatET R插件。如果你已经能熟练使用Emacs或者想
学学Emacs的话,Emacs+ESS是另一种选择。
如果你就想用用没精力折腾的话,RStudio是最快捷方便的选择,Eclipse+StatET其次,
Emacs+ESS排最后。
p**n
发帖数: 1437
12
虽然Rstudio要求2.11,但是我试过2.09一样可以运行,基本运算没有问题。
我还是喜欢Emacs+ESS,毕竟用熟了,快捷键很方便。
vi的话以前学过,后来放弃了,现在就记得 "i", "x" 和 ":wq"了,平时远程登录
server改几个参数足够了
一个编辑器而已,没有好与不好,只有熟与不熟,我平时改点文件还用gedit,把在这
上面纠结的工夫花在别的地方多好。

RStudio
次,
n******7
发帖数: 12463
13
来自主题: Programming版 - 两个我永远都不想碰的语言
断续用了9年的R了,一直不太喜欢
写点简单的东西还好,一旦复杂一点,就麻烦了
首先是debug很头疼
有很多没有documented的东西,需要往往搜来搜去
跑着跑着出错了,看看出错信息也往往不知所谓
R界一统江湖的IDE,Rstudio,直到最近才支持设置断点
之前发过一个帖子,有个分析数据的R脚本本来好好的
加了点功能,就会在有些sample上有问题,但是有些sample又是好的
后来发现,在中间的某一步,如果matrix变成了一行的,会自动转化成vector
纯坑爹
而且各种矢量化操作,比如apply家族,让debug更加困难
其次是performance太差,特别是不得不用loop的情况
基本上比python之类的还要慢一个数量级
数据稍微大点,你就可以先干别的去了
还有就是学习曲线很不友好
我起码算中位数智商吧,用了这么多年R,还是经常要上网搜解决方案
身边的人,除了统计专业的,可能还不如我
加上很多统计的东西在里面,光是一个character <-> factor
估计都困扰了很多初学者
这点最近几年可能好点,因为突然冒出来很多R的书,加上Rstudio的出现
很多R的包也... 阅读全帖
m******2
发帖数: 564
14
来自主题: Programming版 - 两个我永远都不想碰的语言

## 断续用了9年的R了,一直不太喜欢
## 写点简单的东西还好,一旦复杂一点,就麻烦了
同意,括号很烦人
## 首先是debug很头疼
## 有很多没有documented的东西,需要往往搜来搜去
## 跑着跑着出错了,看看出错信息也往往不知所谓
## R界一统江湖的IDE,Rstudio,直到最近才支持设置断点
这点似乎Python也不太好吧?很多的包依靠贡献者的自觉。R的包至少强制规定有pdf的
说明,还有用法,但是Python的包呢?似乎Python自己更甩手不管了
## 之前发过一个帖子,有个分析数据的R脚本本来好好的
## 加了点功能,就会在有些sample上有问题,但是有些sample又是好的
## 后来发现,在中间的某一步,如果matrix变成了一行的,会自动转化成vector
## 纯坑爹
这个是挺讨厌的,横向量还是纵向量的信息被直接忽略了,真是统计学家的模糊思维
## 而且各种矢量化操作,比如apply家族,让debug更加困难
人家给提供了方便功能还有错了?apply底层就是loop,你不服可以自己手工编写loop
来做
## 其次是performance太差,... 阅读全帖
n******7
发帖数: 12463
15
来自主题: Programming版 - [bssd]python, 数值计算,working flow pain
及时贴,谢谢
我前几天摸了一下jupyter notebook
本来以为跟在Rstudio里面用Rmarkdown差不多的
结果还是没摸着头绪,就继续用先用spyder了
spyder最近用了一段时间,死活不知道怎么fold code
后来发现几年前就有人提这个feature了
一直没有实现
所以现在用版上鼓吹的vs code在 (最近是软轮)
R世界就简单多了 Rstudio是标配
x***u
发帖数: 297
16
来自主题: Programming版 - [bssd]python, 数值计算,working flow pain
Redeo 据说和Spyder的界面很像,feature少一些。


: 及时贴,谢谢

: 我前几天摸了一下jupyter notebook

: 本来以为跟在Rstudio里面用Rmarkdown差不多的

: 结果还是没摸着头绪,就继续用先用spyder了

: spyder最近用了一段时间,死活不知道怎么fold code

: 后来发现几年前就有人提这个feature了

: 一直没有实现

: 所以现在用版上鼓吹的vs code在 (最近是软轮)

: R世界就简单多了 Rstudio是标配

d******c
发帖数: 2407
17
不要套大牛的帽子,纯粹是个人喜好
rstudio,r的package管理上手都很容易,rstudio就什么都有了,帮助,画图,
htmlwidget。
你用python做到同样的事情,需要自己东拼西凑,还到处磕磕碰碰。画个图吧,是从
matlab抄过来的,不如ggplot好用。搞网页交互没有shiny类似的东西,更不能像
htmlwidget一样那么随便把js的东西弄过来用。
自从有了htmlwidget,js的东西几天就可以弄过来一个给R用。
rmarkdown本质是markdown,ipython是基于json的,所以你没法对它用版本管理。
rmarkdown一样支持多种语言,一样可以把结果一直交错显示(notebook格式)。因为
是markdown,你可以在代码中间加各种文档或者笔记,我一般写R都是在rmarkdown里写
,直到最后必须的时候才转成.R
d******c
发帖数: 2407
18
来自主题: Programming版 - python画图是不是还是matplotlib?
看了下,这个bokeh还是交互图,类似D3.js。交互图很好,不过和静态图区别还是挺大
的。
背景很有趣,DARPA的项目,anaconda的公司做的。RStudio的目的其实和这个公司一模
一样,趁着big data火的时候提供工具,只不过RStudio围绕R做,anaconda围绕python
做。
v***a
发帖数: 826
19
偶然发现这个,写得真不错
"Leaving the academic canyon"
http://johnstantongeddes.org/personal/2014/10/16/leaving-academ
Leaving the academic canyon
I’m leaving my career in academia as an evolutionary biologist to take a
position as a data scientist. Yes, the hype is true: businesses do want
people with analytical and computational skills. I’m excited about this
move because it allows me to continue applying my analytical skills even
bigger data, and learn new skills along the way (hello Hadoop!). Equally
im... 阅读全帖
t****a
发帖数: 1212
20
来自主题: Statistics版 - 请给推荐一个linux下面R的IDE.
R在linux下有很多好的IDE。
首推emacs,当然,众所周知,learning curve比较长。
其次是最近两年很火的RStudio,那个连Hadley wickham把rice assistant professor
都扔了不做跑去这个公司做developer的RStudio。
其他的,比如KDE的RKWard(http://en.wikipedia.org/wiki/RKWard
我以前还用过Komodo edit+sciview插件,是个很不错的GUI IDE,比RKWard强
Eclipse配合StatET插件据我的朋友说很好,甚至还支持Sweave,我没有认真使用过
如果都不想用的话,装个RCmdr package凑合用它那个tcltk的GUI也勉强

给个
f***8
发帖数: 571
21
来自主题: DataSciences版 - 推荐一下Shiny Dashboard
刚刚在Github上看到RStudio的一个新项目:Shinydashboard
http://rstudio.github.io/shinydashboard/
大概试了试,发现用来做Dashboard prototype真心好用!因为网上介绍还不多,特来
推荐一下。
m*****n
发帖数: 3575
22
来自主题: DataSciences版 - R Shiny 如何发布客户端?
都干不了
多个客户端还要向RStudio交钱
敢情这玩意是RStudio的摇钱树
真不懂为什么那么多人还上杆子学习并维护Shiny

发帖数: 1
23
中国别说操作系统了
就是连语言都没有,连鬼子都能写个主流语言
别说语言了,连个编辑器都没有
不管是vim,emacs,visual studio, sublime, Rstudio, pycharm, eclipse
中国撑死了就是应用不错,scalability做的不错
如果哪一天美国的code不再开源,中国的互联网公司大部分要死。
B*Q
发帖数: 25729
24
问题不大吧
难道忘记下载存盘了么
[在 Frankfurt1 (Frankfort) 的大作中提到:]
:中国别说操作系统了
:就是连语言都没有,连鬼子都能写个主流语言
:别说语言了,连个编辑器都没有
:不管是vim,emacs,visual studio, sublime, Rstudio, pycharm, eclipse
:中国撑死了就是应用不错,scalability做的不错
:如果哪一天美国的code不再开源,中国的互联网公司大部分要死。
d******a
发帖数: 32122
25
来自主题: Military版 - notepad++已经过气了
现在编程用的editor, 除了rstudio spyder 之类专用的, 剩下的就是sublime atom
vscode之类了
l******9
发帖数: 579
26
【 以下文字转载自 Statistics 讨论区 】
发信人: light009 (light009), 信区: Statistics
标 题: a hash embedded with another hash in R
发信站: BBS 未名空间站 (Fri Apr 11 15:56:40 2014, 美东)
This question is related to my previous question.
I need to design a hash that is embedded with another hash in R in Rstudio
on Win 7.
library(hash)
myf <- function()
{
h1 <- hash()
if (!has.key("first", h1))
{
list1 <- list()
h1.son<- hash()
h1.son["first_son"] <- list1
h1["first"] <- h1.son
}
# second check
if(!has.key("first_son... 阅读全帖
o********n
发帖数: 15
27
来自主题: JobHunting版 - Looking for strong R programming candidates
A medium size biotech company is active looking for R programmers with shiny
application development experience to join in the statistical programming
team. If you are interested in it, please send your resume to [email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=doc... 阅读全帖
Z**0
发帖数: 1119
28
来自主题: PhotoGear版 - 硬盘恢复?
建议,先对全盘镜像。然后在尝试恢复。
推荐国产工具diskgenius。非常好用。
另外一个就是Rstudio。
Z**0
发帖数: 1119
29
来自主题: PhotoGear版 - 硬盘恢复?
建议,先对全盘镜像。然后在尝试恢复。
推荐国产工具diskgenius。非常好用。
另外一个就是Rstudio。
d**********r
发帖数: 24123
30
r studio, 花钱的软件。能够扫描raw,分析文件的格式特征。试试这个吧。即使不行
,rstudio 也可以保存一个raw iso 以便以后恢复

easyrecovery
G**Y
发帖数: 33224
31
来自主题: Joke版 - 问码工一个问题
这么复杂呀。我再去看看。要跨平台。
我写的程序是R
http://www.r-project.org/
我知道肯定是可以的。因为有很多软件都给R加了IDE。就相当于把R欠到一个窗口里,
然后给他发命令。比如:
http://www.sciviews.org/Tinn-R/
https://www.rstudio.com/ide/
等等。
当然我要做的比上面简单多了。第二个是开源的似乎是用cpp+gwt写的。
n******7
发帖数: 12463
32
RT 有没有R都还是问题吧?
更不说Rstudio了
n******7
发帖数: 12463
33
来自主题: Hardware版 - 女生一般什么笔记本比较适合?
lz说了要屏幕好点的
mba11别的还不错
偏偏屏幕是最大短板
11.6寸屏幕,面积小边框超大
xps 13.3寸屏幕也就比mba11大了一点
你一统计PHD,不觉得这小屏幕用Rstudio是自虐吗?
另外这块屏幕有低端PC屏幕的通病
色彩视角都不行 (TN屏,虽然不是最差的TN屏)
带鱼屏 (mac笔记本唯一的16:9)
低分 (1366*768,基本notebook最低分辨率了)
O*O
发帖数: 2284
34
不用rstudio呢?
d******a
发帖数: 32122
35
刚在老笔记本上装了Lubuntu,运行latex和rstudio。728p的显示屏,嫌台巴子的界面
太原始,改配xfce桌面,速度嗖嗖的。
太酷了,为什么微软的三哥就不能让Windows界面像xfce那么典雅呢,非要一股子咖喱
味。
p**n
发帖数: 1437
36
Run R?最简单的去下个RStudio。
虽然我习惯用emacs+ess
G*F
发帖数: 427
37
来自主题: Linux版 - Xubuntu 12.10 is really nice
好处就是不用折腾就满好用的,我就换了张墙纸而已。中文字体是自带的,我忘了那个
查字体的命令了。我常用的软件Rstudio, wxMaxima, eclipse,oracle java啥的也是
一装就可以用,什么都不用改。默认memory usage有点高,boot完就350M了,但多少个
1,200M内存也无所谓了。
G**Y
发帖数: 33224
38
来自主题: Programming版 - Markdown不错
不知道呀。
用Rstudio可以直接转html
pandoc肯定可以,
emacs肯定有插件。
n******7
发帖数: 12463
39
我刚学matlab,本来是开源轮,想用octave的
好的ide确实很重要
用R的人应该标配Rstudio了
不过我觉得应该有给numpy优化的IDE的,毕竟是个主流工具
n******7
发帖数: 12463
40
用了段时间java,觉得用来写应用还行,用来做数据分析实在不给力
interactive data exploration 和 visualization 都不方便
因为R 做性能优化太麻烦
考虑重点用python toolchain: numpy scipy matlibplot pandas sympy etc
现在的问题是,好像主流python IDE,pydev,pycharm之类的
对plotting的支持都不怎么样?
有没有侧重于数据分析的python IDE?
z****e
发帖数: 54598
41
没有
程序员的世界没有绝对傻瓜化的工具
否则matlab早被淘汰了
当然你可以做一个
现在连web开发的可视化东西都少
l*******m
发帖数: 1096
42
ipython notebook 虽然不是ide, 但十分方便
n******7
发帖数: 12463
43
不错
R有类似的RMarkdown,不过不是基于web的
Makrdown语法确实方便
n******7
发帖数: 12463
n*****3
发帖数: 1584
45
Anaconda + ipython is good, web based interface;
ipython is NOT IDE, more like REPL.
d****i
发帖数: 4809
46
PyDev里面可以直接launch matplotlib的绘图
x***u
发帖数: 297
47
1> Spyder
Also called spyderlib. I started to use it from 2009. It mimics Matlab
interface. Some early versions have stability issue.
2> ipython notebook
My current favourite. It keeps outputs, graphs in one html page. Great for
reproducible work.
IPython parallel computing clusters is an interesting feature of the
notebook. Potentially, it may boost productivity. I have not tried yet.
3> Enthought / Canopy
Didn't use much. It has free version. If you are .edu user, you can use
professional v... 阅读全帖
w*x
发帖数: 518
48
Spyder啊!基本就是标准的matlab替代品啊
装anaconda就有了
个人意见,ipynb还不是特别等同,参见前两天mailing list里面的讨论:
http://scipy-user.10969.n7.nabble.com/SciPy-User-Is-it-good-pra
s*****t
发帖数: 89
49
pycharm + ipython notebook
或直接后者
1 2 3 下页 末页 (共3页)