我的目的是想找到某个变量在某个时间内的异常情况。
1,2,3,5,3,5,“0“,2,5,6
1,3,5,6,6,7,“100“,10,21
100,200,301,203,“0“,120,121
第一行的“0”就正常,后两行引号内的书就不正常,我的数据是面板数据;
place time var1 ... variables i am interested
1,如何找到这些异常呢?试图计算%change everyperiod发现不好用啊,因为1 到 2变化百分百,
但正常阿。
2。发现异常后,(when 当前的观测值满足某一条件时,比如说0 or missing,)然后如何保存前
后5个observations,进一步判断是否真的异常。
S******y 发帖数: 1123
2
#Try this in Python.. (you need to define -abnormal- better)
#Print location and value of first abnormal if found
import math
def mean(l):
return sum(l)/len(l)
def stdv(l):
m=mean(l)
sumx = sum([(lx - m) * (lx - m) for lx in l])
return math.sqrt(sumx / len(l))
#function to find first abnormal
def find_abnormal(my_list):
index_item = [-1,-1]
origin = mean(my_list)
std_dev= stdv(my_list)
max_val = max(my_li