t*********u 发帖数: 26311 | 1 data3 = FOREACH data2 GENERATE group, SUM(data1.cpc) as cost:int;
data4 = ORDER data3 BY cost ASC;
如果
DESCRIBE data4;
不会报错
但是换成 DUMP data4;
就报错
2014-06-11 17:22:26,525 ERROR org.apache.pig.tools.pigstats.SimplePigStats:
ERROR: java.lang.RuntimeException: java.lang.ClassCastException: java.lang.L
ong cannot be cast to java.lang.Integer
2014-06-11 17:22:26,525 ERROR org.apache.pig.tools.pigstats.PigStatsUtil: 1
map reduce job(s) failed!
2014-06-11 17:22:26,573 ERROR org.apache.pig.tools.grunt.Gru... 阅读全帖 |
|
|
y****2 发帖数: 34 | 3 data <- matrix(c(1 ,1 ,2, 2, 1, 3, 4, 2,1, 5, 6, 3,2, 7, 8, 3,2, 9, 10, 4),
ncol=4, byrow=T)
colnames(data) <- c("id", "x1", "x2", "e")
### step1:
data[,2:3] <- data[,2:3]*data[,4]
data1 <- data[,1:3]
### step2:
data2 <- aggregate(data1[,2:3], list(id=data1[,1]), sum)
### step3:
data3 <- split(data2[,2:3], f=list(data2[,1]))
data3 <- lapply(data3, as.vector, "numeric")
mprod <- function(x){x %*% t(x)}
data4 <- lapply(data3, mprod)
### step4:
data5 <- 0
for(i in 1:length(data4)){
data5 <- data5 + |
|
|
|
h**u 发帖数: 304 | 6 【 以下文字转载自 ChinaNews 讨论区 】
【 原文由 zhouzhzh 所发表 】
都是大学排名惹的祸——从北大官方网站一则假新闻谈起
最近有一则假新闻“美国学界眼中的中国10所杰出大学排行榜”甚嚣尘土,这则假新闻首
先由浙江大学的网友发在网大论坛上,然后浙大学生又拿去四处转贴,以至于北大官方网
站“北大招生网”都上当受骗,还拿出这则假新闻刊登在自己的网站上,成为贻笑大方的
大笑话。回想起北大在线BBS还曾经把满篇诽谤造谣的“青蛙大学丑闻录”标为精华并且
列为头版“推荐文章”,所以对于北大官方网站再次出丑,我算是早有心理准备,总算没
有笑死。大概他们认为只有那种Surprising的新闻,才是真的。
以下是刊登假新闻的“北大招生网”网址:
http://edu.beida-online.com/data/data4.jsp?db=bdzs&id=02kexuepai
美国学界眼中的中国10所杰出大学排行榜
最近的一期美国权威杂志《科学》刊登了美国情报研究所的研究资料,对亚洲学术和科研
的现状与发展作出了专题报告,报告中对中国的大学的综合实力和趋势展望给予了较大关
注。根据科学 |
|
w********5 发帖数: 72 | 7 This is my answer. My codes are alway very long and not efficient. Please
help simlify.
data data1;
input var1;
cards;
5
6
;
run;
data data2;
input var2;
cards;
5
6
;
run;
data new;
infile datalines dlm=" ";
input name $ var $ ;
datalines;
data1 var1
data2 var2
data2 var2
data4 var4
;
run;
proc sql;
select name into:name1-:name&SYSMAXLONG
from new;
select var into:col1-:col&&SYSMAXLONG
from new;
quit;
%put _user_;
option mprint mlogic;
%macro mutiple;
%do i=1 %to &sqlobs;
proc so |
|
p***r 发帖数: 920 | 8 or you can do it in another brutal way
*WIDE TO LONG;
PROC TRANSPOSE DATA=data1 OUT=data2;
BY var_id;
VAR _ALL_;
RUN;
data data3;
set data2;
log_var=log(col1);
run;
*LONG TO WIDE;
PROC TRANSPOSE DATA=data3 OUT=data4
BY var_ID;
ID variable;
VAR log_var;
RUN; |
|
d********t 发帖数: 837 | 9 Reduce(rbind, list(data1,data2,data3,data4))
example:
Reduce(rbind, list(data.frame(x1=c(1,2,3),x2=c(2,3,4)),data.frame(x1=c(5,6,7
),x2=c(7,5,4)),data.frame(x1=c(5,4,3),x2=c(7,6,5)))) |
|
k****o 发帖数: 76 | 10 Before doing DUMP data4, mapreduce is not actually running.. "Describe"
works without mapreduce runs..
check the table for pig SUM :
http://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#SUM:
SUM returns long when input is int, but you assign it to cost: int..
This is where the runtime error comes from, I believe. change to "cost: long
", or simply "cost" without type specification..
.L |
|