由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Database版 - 问个初级问题.不要笑话
相关主题
问一下SAS SQL在大数据方面的处理[转载] 紧急求助:FRONTPAGE和ACCESS做调查网站的问题
SSRS 牛人请进请教一个数据库设计的问题
ACCESS的数据量求教WOrst Case Overhead!!!!!
INSERT or UPDATE, which is faster?A sql question
sql server问题, 不同数据库之间表拷贝,大数据量翻译问题,急救啊!
ETL解决方案(讨论)请问那个normal form在production最popular?
怎样处理normalization和performance的关系数据库面试题
问专家们多数据库之间的实时通信的一问题这里有用sql server replication的吗?
相关话题的讨论汇总
话题: dataset话题: sas话题: 数据量话题: 存储话题: data
进入Database版参与讨论
1 (共1页)
g*****a
发帖数: 29
1
我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
.
有学计算机的人建议应该将数据存在ACCESS的几个表中(如把学生相关信息放在一个表中,
老师相关信息放在一个表中),说这样可以减少REDUNDANCY,BLAH,BLAH.
我现在做分析时用这个DATASET觉得很舒服,若用他说的,可能我还要编程序做关系数据库
的连接,我感觉反而增加工作量.
哪位比较明白的,给说说用这样的DATA STRUCTURE到底有什么好处,若用处不大,我怎样反
驳呢?
aw
发帖数: 127
2
找本DATABASE基础的书看看,你就不会想反驳了。
简单点说,你现在这样做,存储和查询都会麻烦,而且数据量这个东西将来都会变,你现
在数据量不大,用ACCESS正好。
举个简单例子(一般书上都会有更好的):
比如你有学生,课程2种数据。
1)学生现在有100个,每个学生有10项个人信息(DOB,GENDER,。。。);
3)课程现在有20门,课程信息有10项。
你怎么存储?每个学生只要每选一门课,你的每条记录就得重复学生信息,课程信息,而
这全是多余的。

我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
中,



【在 g*****a 的大作中提到】
: 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
: .
: 有学计算机的人建议应该将数据存在ACCESS的几个表中(如把学生相关信息放在一个表中,
: 老师相关信息放在一个表中),说这样可以减少REDUNDANCY,BLAH,BLAH.
: 我现在做分析时用这个DATASET觉得很舒服,若用他说的,可能我还要编程序做关系数据库
: 的连接,我感觉反而增加工作量.
: 哪位比较明白的,给说说用这样的DATA STRUCTURE到底有什么好处,若用处不大,我怎样反
: 驳呢?

g*****a
发帖数: 29
3
是不是可以这样理解,这是DATA STRUCTURE的问题,和用什么软件无关,只要DATA
STRUCTURE建好,无所谓用什么软件,因为SAS也可以有DATASET存储数据信息?



我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)




【在 aw 的大作中提到】
: 找本DATABASE基础的书看看,你就不会想反驳了。
: 简单点说,你现在这样做,存储和查询都会麻烦,而且数据量这个东西将来都会变,你现
: 在数据量不大,用ACCESS正好。
: 举个简单例子(一般书上都会有更好的):
: 比如你有学生,课程2种数据。
: 1)学生现在有100个,每个学生有10项个人信息(DOB,GENDER,。。。);
: 3)课程现在有20门,课程信息有10项。
: 你怎么存储?每个学生只要每选一门课,你的每条记录就得重复学生信息,课程信息,而
: 这全是多余的。
:

aw
发帖数: 127
4
这是关系数据库设计的问题,你用什么数据库软件来具体实现是另一码事。
不了解SAS,但你的DATASET里的数据从哪来的,举个例?



我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)




【在 g*****a 的大作中提到】
: 是不是可以这样理解,这是DATA STRUCTURE的问题,和用什么软件无关,只要DATA
: STRUCTURE建好,无所谓用什么软件,因为SAS也可以有DATASET存储数据信息?
:
: 现
: 而
: 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
: 表
: 据
: 样

g*****a
发帖数: 29
5
SURVEY扫描后的文本文件,IMPORT到SAS DATASET 中. 有AGENCY, SCHOOL. STUDETN.简单
的DEMOGRAPHIC的信息,然后就是几十个QUESTION的RESPOND (1-5, 类似STRONGLY AGREE,
AGREE, DISAGREE, STRONGLY DISAGRE, DO NOT KNOW之类的)



我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)




【在 aw 的大作中提到】
: 这是关系数据库设计的问题,你用什么数据库软件来具体实现是另一码事。
: 不了解SAS,但你的DATASET里的数据从哪来的,举个例?
:
: 你
: ,
: 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
: 个
: 数
: 怎

k****h
发帖数: 27
6
Actually I think you can keep your data as the sas dataset. It's too much
trouble to do ETL if you keep it in the database, as you rarely need to do
query of your data if you are conentrating on statistics. And generate a few
dummy variables would be helpful for filtering or extraction if you really
need to. It might be sluggish to handle the data if your dataset is prettly
large, say 1G. But it might take a long time to get this point.


AGREE,


我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2

【在 g*****a 的大作中提到】
: SURVEY扫描后的文本文件,IMPORT到SAS DATASET 中. 有AGENCY, SCHOOL. STUDETN.简单
: 的DEMOGRAPHIC的信息,然后就是几十个QUESTION的RESPOND (1-5, 类似STRONGLY AGREE,
: AGREE, DISAGREE, STRONGLY DISAGRE, DO NOT KNOW之类的)
:
: ,
: 息
: 我是学统计的,现在用SAS将数据存储在一个大的DATASET中.(每年的数据量不到1万(2-3M)
: 一
: 系
: 我

1 (共1页)
进入Database版参与讨论
相关主题
这里有用sql server replication的吗?sql server问题, 不同数据库之间表拷贝,大数据量
问个sql问题ETL解决方案(讨论)
有朋友做过100+TB的Data Warehouse吗?在Deployment上要注意些什么呢?怎样处理normalization和performance的关系
一道SQL题: N代单传,请按辈份排序问专家们多数据库之间的实时通信的一问题
问一下SAS SQL在大数据方面的处理[转载] 紧急求助:FRONTPAGE和ACCESS做调查网站的问题
SSRS 牛人请进请教一个数据库设计的问题
ACCESS的数据量求教WOrst Case Overhead!!!!!
INSERT or UPDATE, which is faster?A sql question
相关话题的讨论汇总
话题: dataset话题: sas话题: 数据量话题: 存储话题: data