由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - sort a matrix (1M rows x 100 columns) for each row in GPU
相关主题
什么叫做大数据?kaggle上这个restaurant-revenue-prediction的题目有人考虑过么?
请教各位DS大拿【求助】计算机转Data Analytics/ Data Scientist方面
ask for help for R programming (转载)Re: 请问大数据问题和以前的数据挖掘有什么区别? (转载)
leetcode 里的在两个sorted array里找median 得问题,是不是有什么trick?问一个R的问题
怎样利用AMS在R里面做一个大数据的分析?[Data Science Project Case] Topic Learning
Memory Error in pandas.concat with Python这个cassandra paging的解决方案怎么样?
请问EXCEL大拿,R 问题请教
PYTHON学起来不难,怎么做LEETCODE上的题这么难啊。问怎么搜SORT,SEARCH的题做?计算 confidence interval 和 prediction interval的一般方法
相关话题的讨论汇总
话题: gpu话题: 1m话题: columns话题: sort话题: rows
进入DataSciences版参与讨论
1 (共1页)
c*****l
发帖数: 297
1
Do someone think it is feasible to sort a matrix (1M rows x 100 columns) for
each row in GPU? We keeping the repeating sorting every day and want to
know whether the performance could be improved to 10X or 20X faster (
Currently we just bought a server with 8 GPU K40).
l*******m
发帖数: 1096
2
please refer https://solarianprogrammer.com/2013/02/04/sorting-data-in-
parallel-cpu-gpu/
In my opinion, cpu should be fast enough for the size if the sort alg and
implementation is correct. CPU-GPU data copy is a big overhead for such a
task

for

【在 c*****l 的大作中提到】
: Do someone think it is feasible to sort a matrix (1M rows x 100 columns) for
: each row in GPU? We keeping the repeating sorting every day and want to
: know whether the performance could be improved to 10X or 20X faster (
: Currently we just bought a server with 8 GPU K40).

y*****0
发帖数: 1189
3
没试过,大概想法是这样的。
因为你的columns比较少,所以log2 100才是7都不到,所以复杂度是7*matrix_size。
太小,不适合传到gpu上面。
cpu的cache用好了,直接每行走cache,直接在cpu上并行,应该是最佳选择。

for

【在 c*****l 的大作中提到】
: Do someone think it is feasible to sort a matrix (1M rows x 100 columns) for
: each row in GPU? We keeping the repeating sorting every day and want to
: know whether the performance could be improved to 10X or 20X faster (
: Currently we just bought a server with 8 GPU K40).

1 (共1页)
进入DataSciences版参与讨论
相关主题
计算 confidence interval 和 prediction interval的一般方法怎样利用AMS在R里面做一个大数据的分析?
板上R高手多,包子求R数据输出到CSV方法Memory Error in pandas.concat with Python
R问题请教请问EXCEL大拿,
求助:关于2个python的题目PYTHON学起来不难,怎么做LEETCODE上的题这么难啊。问怎么搜SORT,SEARCH的题做?
什么叫做大数据?kaggle上这个restaurant-revenue-prediction的题目有人考虑过么?
请教各位DS大拿【求助】计算机转Data Analytics/ Data Scientist方面
ask for help for R programming (转载)Re: 请问大数据问题和以前的数据挖掘有什么区别? (转载)
leetcode 里的在两个sorted array里找median 得问题,是不是有什么trick?问一个R的问题
相关话题的讨论汇总
话题: gpu话题: 1m话题: columns话题: sort话题: rows