由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 我有大概80000~100000个左右的时间序列,希望对他们进行分类。
相关主题
聚类问题请教[Data Science Project Case] Fuzzy matching on names
有关clustering有没有人想报Cloudera的Data Scientist Certificate的
最近觉得分类算法很多时候还是不靠谱啊[Data Science Project Case] Generate Categories for Product
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?only average statistics
Science杂志一篇关于clustering的新文章 (转载)找DS的工作 帮忙分析下
有没有谁自己买服务器组建几个clusters跑hadoop大数据的?我觉得关于datascience最近看到的几个有价值的贴
spark上一两个million的时间序列数据Science上新clustering算法的分析测试
一道面试题,向本版求教一下。请推荐生物界认可的Clustering Analysis的免费软件
相关话题的讨论汇总
话题: clustering话题: 序列话题: fft话题: 分类话题: 80000
进入DataSciences版参与讨论
1 (共1页)
s******a
发帖数: 184
1
我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
。 特别是如何处理这么大量的时间序列。
c********h
发帖数: 330
2
你是想clustering吧?有没有label?
s******a
发帖数: 184
3
是clustering, 没有label.

【在 c********h 的大作中提到】
: 你是想clustering吧?有没有label?
i**********8
发帖数: 27
4
学数学,物理的人能想到的是 FFT
学经济的用 DTW
可以试试拿 FFT 出来的各频率对应的振幅,或加上相移作 FEATURE, 来作 CLUSTER
相信高手们会有更好的办法

【在 s******a 的大作中提到】
: 是clustering, 没有label.
d*****r
发帖数: 2583
5
你要对随机过程作排序?
paths是没有pdf的。

【在 s******a 的大作中提到】
: 我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
: 。 特别是如何处理这么大量的时间序列。

g******e
发帖数: 3472
6
try dynamic time warping find distance, then do clustering

【在 s******a 的大作中提到】
: 我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
: 。 特别是如何处理这么大量的时间序列。

h*****7
发帖数: 6781
7
我不是数学和物理的,第一反应也是FFT提特征再聚类

【在 i**********8 的大作中提到】
: 学数学,物理的人能想到的是 FFT
: 学经济的用 DTW
: 可以试试拿 FFT 出来的各频率对应的振幅,或加上相移作 FEATURE, 来作 CLUSTER
: 相信高手们会有更好的办法

f*********2
发帖数: 48
8
我是扫地的……
建议用小波,然后上各种聚类方法。
j*******g
发帖数: 331
9
如果时间序列很短 维度小 就不用上Fft wavelet啥的了吧

【在 f*********2 的大作中提到】
: 我是扫地的……
: 建议用小波,然后上各种聚类方法。

T*****u
发帖数: 7103
10
我以前做过类似的用的是dwt,但是不是给时间点的值分类,而是给不同时间段的mode
分类。你讲讲背后的原理吧。
相关主题
有没有谁自己买服务器组建几个clusters跑hadoop大数据的?[Data Science Project Case] Fuzzy matching on names
spark上一两个million的时间序列数据有没有人想报Cloudera的Data Scientist Certificate的
一道面试题,向本版求教一下。[Data Science Project Case] Generate Categories for Product
进入DataSciences版参与讨论
l*******m
发帖数: 1096
11
see if stationary or not first
s******a
发帖数: 184
12
我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
。 特别是如何处理这么大量的时间序列。
c********h
发帖数: 330
13
你是想clustering吧?有没有label?
s******a
发帖数: 184
14
是clustering, 没有label.

【在 c********h 的大作中提到】
: 你是想clustering吧?有没有label?
i**********8
发帖数: 27
15
学数学,物理的人能想到的是 FFT
学经济的用 DTW
可以试试拿 FFT 出来的各频率对应的振幅,或加上相移作 FEATURE, 来作 CLUSTER
相信高手们会有更好的办法

【在 s******a 的大作中提到】
: 是clustering, 没有label.
d*****r
发帖数: 2583
16
你要对随机过程作排序?
paths是没有pdf的。

【在 s******a 的大作中提到】
: 我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
: 。 特别是如何处理这么大量的时间序列。

g******e
发帖数: 3472
17
try dynamic time warping find distance, then do clustering

【在 s******a 的大作中提到】
: 我有大概80000~100000个左右的时间序列,希望对他们进行分类。一般都有哪些方法
: 。 特别是如何处理这么大量的时间序列。

h*****7
发帖数: 6781
18
我不是数学和物理的,第一反应也是FFT提特征再聚类

【在 i**********8 的大作中提到】
: 学数学,物理的人能想到的是 FFT
: 学经济的用 DTW
: 可以试试拿 FFT 出来的各频率对应的振幅,或加上相移作 FEATURE, 来作 CLUSTER
: 相信高手们会有更好的办法

f*********2
发帖数: 48
19
我是扫地的……
建议用小波,然后上各种聚类方法。
j*******g
发帖数: 331
20
如果时间序列很短 维度小 就不用上Fft wavelet啥的了吧

【在 f*********2 的大作中提到】
: 我是扫地的……
: 建议用小波,然后上各种聚类方法。

相关主题
only average statisticsScience上新clustering算法的分析测试
找DS的工作 帮忙分析下请推荐生物界认可的Clustering Analysis的免费软件
我觉得关于datascience最近看到的几个有价值的贴data scientist的五个方面
进入DataSciences版参与讨论
T*****u
发帖数: 7103
21
我以前做过类似的用的是dwt,但是不是给时间点的值分类,而是给不同时间段的mode
分类。你讲讲背后的原理吧。
l*******m
发帖数: 1096
22
see if stationary or not first
b********h
发帖数: 2451
23
这个不错,但比较耗时间

【在 g******e 的大作中提到】
: try dynamic time warping find distance, then do clustering
y**3
发帖数: 267
24
can you share if you found strong patterns/trends/clusters using dwt?

mode

【在 T*****u 的大作中提到】
: 我以前做过类似的用的是dwt,但是不是给时间点的值分类,而是给不同时间段的mode
: 分类。你讲讲背后的原理吧。

1 (共1页)
进入DataSciences版参与讨论
相关主题
请推荐生物界认可的Clustering Analysis的免费软件Science杂志一篇关于clustering的新文章 (转载)
data scientist的五个方面有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
都用了spark了吗?spark上一两个million的时间序列数据
Mac or Windows?一道面试题,向本版求教一下。
聚类问题请教[Data Science Project Case] Fuzzy matching on names
有关clustering有没有人想报Cloudera的Data Scientist Certificate的
最近觉得分类算法很多时候还是不靠谱啊[Data Science Project Case] Generate Categories for Product
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?only average statistics
相关话题的讨论汇总
话题: clustering话题: 序列话题: fft话题: 分类话题: 80000