g*****a 发帖数: 29 | 1 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
.
有学计算机的人建议应该将数据存在ACCESS的几个表中(如把学生相关信息放在一个表中,
老师相关信息放在一个表中),说这样可以减少REDUNDANCY,BLAH,BLAH.
我现在做分析时用这个DATASET觉得很舒服,若用他说的,可能我还要编程序做关系数据库
的连接,我感觉反而增加工作量.
哪位比较明白的,给说说用这样的DATA STRUCTURE到底有什么好处,若用处不大,我怎样反
驳呢? | aw 发帖数: 127 | 2 找本DATABASE基础的书看看,你就不会想反驳了。
简单点说,你现在这样做,存储和查询都会麻烦,而且数据量这个东西将来都会变,你现
在数据量不大,用ACCESS正好。
举个简单例子(一般书上都会有更好的):
比如你有学生,课程2种数据。
1)学生现在有100个,每个学生有10项个人信息(DOB,GENDER,。。。);
3)课程现在有20门,课程信息有10项。
你怎么存储?每个学生只要每选一门课,你的每条记录就得重复学生信息,课程信息,而
这全是多余的。
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
中,
库
反
【在 g*****a 的大作中提到】 : 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M) : . : 有学计算机的人建议应该将数据存在ACCESS的几个表中(如把学生相关信息放在一个表中, : 老师相关信息放在一个表中),说这样可以减少REDUNDANCY,BLAH,BLAH. : 我现在做分析时用这个DATASET觉得很舒服,若用他说的,可能我还要编程序做关系数据库 : 的连接,我感觉反而增加工作量. : 哪位比较明白的,给说说用这样的DATA STRUCTURE到底有什么好处,若用处不大,我怎样反 : 驳呢?
| g*****a 发帖数: 29 | 3 是不是可以这样理解,这是DATA STRUCTURE的问题,和用什么软件无关,只要DATA
STRUCTURE建好,无所谓用什么软件,因为SAS也可以有DATASET存储数据信息?
现
而
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
表
据
样
【在 aw 的大作中提到】 : 找本DATABASE基础的书看看,你就不会想反驳了。 : 简单点说,你现在这样做,存储和查询都会麻烦,而且数据量这个东西将来都会变,你现 : 在数据量不大,用ACCESS正好。 : 举个简单例子(一般书上都会有更好的): : 比如你有学生,课程2种数据。 : 1)学生现在有100个,每个学生有10项个人信息(DOB,GENDER,。。。); : 3)课程现在有20门,课程信息有10项。 : 你怎么存储?每个学生只要每选一门课,你的每条记录就得重复学生信息,课程信息,而 : 这全是多余的。 :
| aw 发帖数: 127 | 4 这是关系数据库设计的问题,你用什么数据库软件来具体实现是另一码事。
不了解SAS,但你的DATASET里的数据从哪来的,举个例?
你
,
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
个
数
怎
【在 g*****a 的大作中提到】 : 是不是可以这样理解,这是DATA STRUCTURE的问题,和用什么软件无关,只要DATA : STRUCTURE建好,无所谓用什么软件,因为SAS也可以有DATASET存储数据信息? : : 现 : 而 : 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M) : 表 : 据 : 样
| g*****a 发帖数: 29 | 5 SURVEY扫描后的文本文件,IMPORT到SAS DATASET 中. 有AGENCY, SCHOOL. STUDETN.简单
的DEMOGRAPHIC的信息,然后就是几十个QUESTION的RESPOND (1-5, 类似STRONGLY AGREE,
AGREE, DISAGREE, STRONGLY DISAGRE, DO NOT KNOW之类的)
,
息
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
一
系
我
【在 aw 的大作中提到】 : 这是关系数据库设计的问题,你用什么数据库软件来具体实现是另一码事。 : 不了解SAS,但你的DATASET里的数据从哪来的,举个例? : : 你 : , : 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M) : 个 : 数 : 怎
| k****h 发帖数: 27 | 6 Actually I think you can keep your data as the sas dataset. It's too much
trouble to do ETL if you keep it in the database, as you rarely need to do
query of your data if you are conentrating on statistics. And generate a few
dummy variables would be helpful for filtering or extraction if you really
need to. It might be sluggish to handle the data if your dataset is prettly
large, say 1G. But it might take a long time to get this point.
单
AGREE,
变
信
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2
【在 g*****a 的大作中提到】 : SURVEY扫描后的文本文件,IMPORT到SAS DATASET 中. 有AGENCY, SCHOOL. STUDETN.简单 : 的DEMOGRAPHIC的信息,然后就是几十个QUESTION的RESPOND (1-5, 类似STRONGLY AGREE, : AGREE, DISAGREE, STRONGLY DISAGRE, DO NOT KNOW之类的) : : , : 息 : 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M) : 一 : 系 : 我
|
|