n*****t 发帖数: 41 | 1 我现在整理基因型的数据,大约上百万行,都是矩阵类型的数据。我比较熟悉R. 但是R
处理不了这么大的数据。想用linux 来处理。想请问linux 有没有命令象R 那样的来处
理数据。比如提取某几列或某几行数据出来,把两个数据库按行或者按列合并等等。谢
谢 |
j******4 发帖数: 6090 | 2 可以的,不过你说的太笼统了,你具体想实现什么?
可以上google上多查查,先确定你用的是bash还是c-shell什么的,不同的shell有不同
的flavor。
% finger user 可以输出你用的是bash还是c-shell
% cat a.txt b.txt 可以把a接到b的后面,类似R里的 c(a,b)
其他的一时还想不出来。
如果有些东西在Unix里不好实现,你可以写个R script,里面你从读文件,
manipulation,然后write.table都写好,存成一个.r的file (e.g. tmp.r,用下面的
命令可以直接在unix里调用R:
% R CMD BATCH tmp.r
就可以得到你在R里自己定义好的输出文件。
刚学unix,抛砖引玉 |
s******e 发帖数: 343 | 3 grep awk cut paste这些命令可能有用
是R
【在 n*****t 的大作中提到】 : 我现在整理基因型的数据,大约上百万行,都是矩阵类型的数据。我比较熟悉R. 但是R : 处理不了这么大的数据。想用linux 来处理。想请问linux 有没有命令象R 那样的来处 : 理数据。比如提取某几列或某几行数据出来,把两个数据库按行或者按列合并等等。谢 : 谢
|
s*****t 发帖数: 987 | 4 awk grep sed 等等
perl可以用来处理很复杂的pattern match的问题,good luck |
s*****t 发帖数: 987 | |
n*****t 发帖数: 41 | 6 谢谢各位,这些命令和我google到的差不多,正在学习中。主要问题是数据太大了,不
能象 R那样直观,就担心出现问题不能发现。 |