n*****t 发帖数: 41 | 1 如果文件是规则的,比如data.frame, 用read.table命令就可以读取。现在如果文件是
普通的,没有规律(是一个程序的输出结果),而且我只需要提取其中的一个数字。听
说 perl 可以,但是那个还要学。有什么简单方法吗?谢谢 | B******5 发帖数: 4676 | 2 R也有regular expression matching的package
不过还是需要学,跟Perl一个道理的。。。
【在 n*****t 的大作中提到】 : 如果文件是规则的,比如data.frame, 用read.table命令就可以读取。现在如果文件是 : 普通的,没有规律(是一个程序的输出结果),而且我只需要提取其中的一个数字。听 : 说 perl 可以,但是那个还要学。有什么简单方法吗?谢谢
| g**********t 发帖数: 475 | | n*****t 发帖数: 41 | 4 谢谢,文件如下。我只要读取最后一个数,就是那个likelihood的数值。
MERLIN 1.1.2 - (c) 2000-2007 Goncalo Abecasis
References for this version of Merlin:
Abecasis et al (2002) Nat Gen 30:97-101 [original citation]
Fingerlin et al (2004) AJHG 74:432-43 [case selection for
association studies]
Abecasis and Wigginton (2005) AJHG 77:754-67 [ld modeling, parametric
analyses]
Fingerlin et al (2006) Gen Epidemiol 30:384-96 [sex-specific maps]
Chen and Abecasis (2007) AJHG 81:913-26 [qtl association analysis,
qtl simulation]
The following parameters are in effect:
Data File : asp.dat (-dname)
Pedigree File : asp.ped (-pname)
Missing Value Code : -99.999 (-xname)
Map File : asp.map (-mname)
Allele Frequencies : ALL INDIVIDUALS (-f[a|e|f|m|file])
Random Seed : 123456 (-r9999)
Data Analysis Options
General : --error, --information, --likelihood [ON],
--model [param.tbl]
IBD States : --ibd, --kinship, --matrices, --extended, --select
NPL Linkage : --npl, --pairs, --qtl, --deviates, --exp
VC Linkage : --vc, --useCovariates, --ascertainment, --unlinked [0.00]
Association : --infer, --assoc, --fastAssoc, --filter, --custom [cov.
tbl]
Haplotyping : --best, --sample, --all, --founders, --horizontal
Recombination : --zero, --one, --two, --three, --singlepoint
Positions : --steps, --maxStep, --minStep, --grid, --start, --stop
LD Clusters : --clusters [], --distance, --rsq, --cfreq
Limits : --bits [24], --megabytes, --minutes
Performance : --trim, --noCoupleBits, --swap, --smallSwap
Output : --quiet, --markerNames, --frequencies, --perFamily, --pdf,
--tabulate, --prefix [merlin]
Simulation : --simulate, --reruns, --save, --trait []
Estimating allele frequencies... [using all genotypes]
MRK1 MRK2 MRK3 MRK4 MRK5 MRK6 MRK7 MRK8 MRK9 MRK10 MRK11 MRK12 MRK13
MRK14
MRK15 MRK16 MRK17 MRK18 MRK19 MRK20
lnLikelihood for 200 families (0 skipped) = -15536.129
【在 g**********t 的大作中提到】 : 你把文件贴出来,我写个perl程序帮你弄弄。
| w********m 发帖数: 1137 | 5 readMERLIN <- function(infile) {
x <- file(infile, "r")
repeat {
rl <- readLines(x, n=1)
if (length(rl) == 0) break
if (length(grep("lnLikelihood", rl)) > 0) {
return( as.double(strsplit(rl, split= "=")[[1]][2]) )
}
}
}
y <- readMERLIN("test.txt")
analysis,
【在 n*****t 的大作中提到】 : 谢谢,文件如下。我只要读取最后一个数,就是那个likelihood的数值。 : : MERLIN 1.1.2 - (c) 2000-2007 Goncalo Abecasis : References for this version of Merlin: : Abecasis et al (2002) Nat Gen 30:97-101 [original citation] : Fingerlin et al (2004) AJHG 74:432-43 [case selection for : association studies] : Abecasis and Wigginton (2005) AJHG 77:754-67 [ld modeling, parametric : analyses] : Fingerlin et al (2006) Gen Epidemiol 30:384-96 [sex-specific maps]
| D******n 发帖数: 2836 | 6 hehe linux
grep Likelihood _your_file | cut -d"=" -f2
analysis,
【在 n*****t 的大作中提到】 : 谢谢,文件如下。我只要读取最后一个数,就是那个likelihood的数值。 : : MERLIN 1.1.2 - (c) 2000-2007 Goncalo Abecasis : References for this version of Merlin: : Abecasis et al (2002) Nat Gen 30:97-101 [original citation] : Fingerlin et al (2004) AJHG 74:432-43 [case selection for : association studies] : Abecasis and Wigginton (2005) AJHG 77:754-67 [ld modeling, parametric : analyses] : Fingerlin et al (2006) Gen Epidemiol 30:384-96 [sex-specific maps]
| n*****t 发帖数: 41 | 7 最喜欢这个答案,虽然复杂,不过都是R codde,是我能掌握的。多谢。
【在 w********m 的大作中提到】 : readMERLIN <- function(infile) { : x <- file(infile, "r") : repeat { : rl <- readLines(x, n=1) : if (length(rl) == 0) break : if (length(grep("lnLikelihood", rl)) > 0) { : return( as.double(strsplit(rl, split= "=")[[1]][2]) ) : } : } : }
|
|