由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Computation版 - 对很大的数据库做data ming,用什么软件比较好呢?
相关主题
国内一线互联公司搜索研发部技术经理职位 北京谁知道Eric Baldeschwieler (Hadoop) 的联系方式?
这里有人做数据挖掘吗?当信息系统变成累赘
阿里巴巴智能机器人团队2017校招开始喽!大家还是bilingual吧
求助sentiment analysisAnybody use PETSc?
面试问题求救:关于 Quartz, text-ming, Pdf有人用 NumPy 来计算吗
SHIPPING CONNECT APP请问matlab里有办法查询webpage上的data并record下来嘛?
问个数据库的入门问题关于Python的矩阵包
hadoop能否替代high performance computing?Octave还是SciLab
相关话题的讨论汇总
话题: 数据库话题: 软件话题: data话题: ming话题: 很大
进入Computation版参与讨论
1 (共1页)
f*******8
发帖数: 149
1
我刚刚接到一个项目,对我们公司的数据库做data mining。
数据库很大,有billions records,存在数据库中。
请问我应该选择什么样的软件呢?
万分感谢!
u*****u
发帖数: 2651
s******a
发帖数: 472
3
自己回编程是不是也可以?

【在 f*******8 的大作中提到】
: 我刚刚接到一个项目,对我们公司的数据库做data mining。
: 数据库很大,有billions records,存在数据库中。
: 请问我应该选择什么样的软件呢?
: 万分感谢!

f*******8
发帖数: 149
4
我刚刚接到一个项目,对我们公司的数据库做data mining。
数据库很大,有billions records,存在数据库中。
请问我应该选择什么样的软件呢?
万分感谢!
u*****u
发帖数: 2651
s******a
发帖数: 472
6
自己回编程是不是也可以?

【在 f*******8 的大作中提到】
: 我刚刚接到一个项目,对我们公司的数据库做data mining。
: 数据库很大,有billions records,存在数据库中。
: 请问我应该选择什么样的软件呢?
: 万分感谢!

S******y
发帖数: 1123
7
您问的问题很好, 回答起来沒有那么简单 :-)
最短平快的方法 sampling,把选的数据拿出来在R或Python里来分析(但有局限性)
Mahout 可以直接在hadoop上做数据挖掘,in batch jobs
尽量不要自己写,用现成open source
m*********[email protected]
实战速成Python/R/Hadoop课程-
http://plus.google.com/+statsGuyMITBBS/about

【在 f*******8 的大作中提到】
: 我刚刚接到一个项目,对我们公司的数据库做data mining。
: 数据库很大,有billions records,存在数据库中。
: 请问我应该选择什么样的软件呢?
: 万分感谢!

1 (共1页)
进入Computation版参与讨论
相关主题
Octave还是SciLab面试问题求救:关于 Quartz, text-ming, Pdf
跪求,用python上传一个文件到服务器的例子SHIPPING CONNECT APP
很痛苦,python, matlab, c++问个数据库的入门问题
Python下面如何进行numeric analysis and statistical analysis (转载)hadoop能否替代high performance computing?
国内一线互联公司搜索研发部技术经理职位 北京谁知道Eric Baldeschwieler (Hadoop) 的联系方式?
这里有人做数据挖掘吗?当信息系统变成累赘
阿里巴巴智能机器人团队2017校招开始喽!大家还是bilingual吧
求助sentiment analysisAnybody use PETSc?
相关话题的讨论汇总
话题: 数据库话题: 软件话题: data话题: ming话题: 很大