由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - GPU的本质
相关主题
谈谈想学好底层必不可少的东西服务器测试结果
有大牛可以说说scikit-learn哪些方面不如tf么?10G网络到了
大坑看晕了求推荐一个真心交流技术的地方
Goodbug,是不是单机大于1 million/s的I/O你就输了?為什麼golang algernon比C nginx慢幾十倍?golang行嗎
high performance computer architecture 这课有啥大意义吗说说我以前做的ultra low latency架构吧
什么是OS Memory management and heap structure?转: 为什么Web App的运行速度慢
老魏问你个问题embedded is for losers.
代码开源了什么都别说了,刷题是王道,我要加入拳皇帮了
相关话题的讨论汇总
话题: 计算话题: gpu话题: 其实话题: cpu话题: 架构
进入Programming版参与讨论
1 (共1页)
w***g
发帖数: 5958
1
其实是一个NUMA架构vector processor。
这其实是“计算”机的经典架构,早就有了。
之所以之前这种架构没火起来,是因为人类前几十年
对电脑的应用,比如办公和上网,其实都是“处理”
而不是“计算”。现在只不过是风水轮流转了。
Intel之所以能在挤这么多年牙膏,就是因为
“处理”这方面的快的需求其实已经到顶了。
(从“省”的角度看Intel其实一直在进步。)
老黄的兴起,其时代背景是“计算”需求将要被
大众化了。CS能发明的原理其实都已经被发明了,
只是短板轮流转而已。所以完全有可能能从
故纸堆里挖掘出牛逼东西来。
资本主义其实效率很高的。一方面就体现在一个
市场,如果只是同质性技术竞争,龙头企业
往往几十年都不会倒,直到颠覆性技术
出现。比如INTC, MSFT。反例是柯达和雅虎。
我自己觉得NVDA就是这样的龙头企业。
买股票另说。我长期持有的是AMD。
T*******x
发帖数: 8565
2
处理和计算,确实是两大模式。

:其实是一个NUMA架构vector processor。
:这其实是“计算”机的经典架构,早就有了。
W***o
发帖数: 6519
3
AMD 和INTC比起来就是under dog,董老板觉得有啥值得做股东的原因?
w*****r
发帖数: 197
4
无论是处理还是计算,都没咱们散户什么事。
如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline,
开源并被人接受,也许能出名。。。

【在 w***g 的大作中提到】
: 其实是一个NUMA架构vector processor。
: 这其实是“计算”机的经典架构,早就有了。
: 之所以之前这种架构没火起来,是因为人类前几十年
: 对电脑的应用,比如办公和上网,其实都是“处理”
: 而不是“计算”。现在只不过是风水轮流转了。
: Intel之所以能在挤这么多年牙膏,就是因为
: “处理”这方面的快的需求其实已经到顶了。
: (从“省”的角度看Intel其实一直在进步。)
: 老黄的兴起,其时代背景是“计算”需求将要被
: 大众化了。CS能发明的原理其实都已经被发明了,

c*********e
发帖数: 16335
5
intel 会出来一个core 9, core 11 吗?

【在 w***g 的大作中提到】
: 其实是一个NUMA架构vector processor。
: 这其实是“计算”机的经典架构,早就有了。
: 之所以之前这种架构没火起来,是因为人类前几十年
: 对电脑的应用,比如办公和上网,其实都是“处理”
: 而不是“计算”。现在只不过是风水轮流转了。
: Intel之所以能在挤这么多年牙膏,就是因为
: “处理”这方面的快的需求其实已经到顶了。
: (从“省”的角度看Intel其实一直在进步。)
: 老黄的兴起,其时代背景是“计算”需求将要被
: 大众化了。CS能发明的原理其实都已经被发明了,

x****u
发帖数: 44466
6
我看过去gpu不火是因为摩尔定律
与其花时间写并行程序,不如等几年主频也就涨了10倍

【在 w***g 的大作中提到】
: 其实是一个NUMA架构vector processor。
: 这其实是“计算”机的经典架构,早就有了。
: 之所以之前这种架构没火起来,是因为人类前几十年
: 对电脑的应用,比如办公和上网,其实都是“处理”
: 而不是“计算”。现在只不过是风水轮流转了。
: Intel之所以能在挤这么多年牙膏,就是因为
: “处理”这方面的快的需求其实已经到顶了。
: (从“省”的角度看Intel其实一直在进步。)
: 老黄的兴起,其时代背景是“计算”需求将要被
: 大众化了。CS能发明的原理其实都已经被发明了,

L****8
发帖数: 3938
7
要有人搞基础设施建设 例如 cuDNN 否则没人用

【在 x****u 的大作中提到】
: 我看过去gpu不火是因为摩尔定律
: 与其花时间写并行程序,不如等几年主频也就涨了10倍

g****t
发帖数: 31659
8
更可能的是抄你的人出名


: 无论是处理还是计算,都没咱们散户什么事。

: 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的
pipeline,

: 开源并被人接受,也许能出名。。。



【在 w*****r 的大作中提到】
: 无论是处理还是计算,都没咱们散户什么事。
: 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline,
: 开源并被人接受,也许能出名。。。

w***g
发帖数: 5958
9
说对啦!没有靠山,做出来牛逼的东西也是被人抄的命。

【在 g****t 的大作中提到】
: 更可能的是抄你的人出名
:
:
: 无论是处理还是计算,都没咱们散户什么事。
:
: 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的
: pipeline,
:
: 开源并被人接受,也许能出名。。。
:

t***s
发帖数: 4666
10
主要是拥抱非主流用户写了CUDA。然后非主流变成主流了。

【在 w***g 的大作中提到】
: 其实是一个NUMA架构vector processor。
: 这其实是“计算”机的经典架构,早就有了。
: 之所以之前这种架构没火起来,是因为人类前几十年
: 对电脑的应用,比如办公和上网,其实都是“处理”
: 而不是“计算”。现在只不过是风水轮流转了。
: Intel之所以能在挤这么多年牙膏,就是因为
: “处理”这方面的快的需求其实已经到顶了。
: (从“省”的角度看Intel其实一直在进步。)
: 老黄的兴起,其时代背景是“计算”需求将要被
: 大众化了。CS能发明的原理其实都已经被发明了,

相关主题
什么是OS Memory management and heap structure?服务器测试结果
老魏问你个问题10G网络到了
代码开源了求推荐一个真心交流技术的地方
进入Programming版参与讨论
m*****n
发帖数: 3575
11
这就是洞察力

【在 t***s 的大作中提到】
: 主要是拥抱非主流用户写了CUDA。然后非主流变成主流了。
g****t
发帖数: 31659
12
最近这个某手机CPU变慢的新闻。
最早相关的algorithm是我写的,也是我卖给客户的。
我很想出名,没人让我出...
2010年(?)我在EE板讲过这个想法,好多EE的人追着我骂。
说我不知道CPU 电源的基本知识。
可能ET等还存在的老ID,还有印象。帖子应该也还在。

【在 w***g 的大作中提到】
: 说对啦!没有靠山,做出来牛逼的东西也是被人抄的命。
a*****g
发帖数: 19398
13
我在特定场合写过类似的程序,但普通场合不会写,太违背常理了

【在 g****t 的大作中提到】
: 最近这个某手机CPU变慢的新闻。
: 最早相关的algorithm是我写的,也是我卖给客户的。
: 我很想出名,没人让我出...
: 2010年(?)我在EE板讲过这个想法,好多EE的人追着我骂。
: 说我不知道CPU 电源的基本知识。
: 可能ET等还存在的老ID,还有印象。帖子应该也还在。

g****t
发帖数: 31659
14
一般人不具备从头做 新的, 跑在几千万上亿设备的系统 的能力。
因为强壮性要求高,所以最常见的是用已经存在多年的工具和
系统做延伸。

【在 a*****g 的大作中提到】
: 我在特定场合写过类似的程序,但普通场合不会写,太违背常理了
w********e
发帖数: 275
15
For IIoT or I2oT, cloud is not needed.

【在 w*****r 的大作中提到】
: 无论是处理还是计算,都没咱们散户什么事。
: 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline,
: 开源并被人接受,也许能出名。。。

x****u
发帖数: 44466
16
没有cuDNN的时候也有直接调用编译器加速的啊

【在 L****8 的大作中提到】
: 要有人搞基础设施建设 例如 cuDNN 否则没人用
l***p
发帖数: 358
17
计算和处理的差别,没懂,shed more light?
h**********c
发帖数: 4120
18
一个CPU 电路三大块,有点忘了,运算器,指令集,cache
当代CPU还要考虑安全,可靠性,大量的校验,
你看各种编译器的单元测试,有很多8X7 不等于56的问题,
现在的软件和系统设计根本不从低层角度考虑这些问题,GPU就是一个80%裁掉的CPU。
只能说DUI。
x****u
发帖数: 44466
19
CPU里面的很多高成本组件只是针对非充分并行优化的串行程序才有意义的
比如流水线,分支预测,乱序执行,各种重命名,微指令,cache等等
如果计算任务高度适合并行化,那设计思路要推倒重来
归根结底还是因为目前主频撞到南墙了,只能加大并行度了

【在 h**********c 的大作中提到】
: 一个CPU 电路三大块,有点忘了,运算器,指令集,cache
: 当代CPU还要考虑安全,可靠性,大量的校验,
: 你看各种编译器的单元测试,有很多8X7 不等于56的问题,
: 现在的软件和系统设计根本不从低层角度考虑这些问题,GPU就是一个80%裁掉的CPU。
: 只能说DUI。

m*****n
发帖数: 3575
20
现在GPU主频也要升到2G
这也太牛了吧?

【在 x****u 的大作中提到】
: CPU里面的很多高成本组件只是针对非充分并行优化的串行程序才有意义的
: 比如流水线,分支预测,乱序执行,各种重命名,微指令,cache等等
: 如果计算任务高度适合并行化,那设计思路要推倒重来
: 归根结底还是因为目前主频撞到南墙了,只能加大并行度了

相关主题
為什麼golang algernon比C nginx慢幾十倍?golang行嗎embedded is for losers.
说说我以前做的ultra low latency架构吧什么都别说了,刷题是王道,我要加入拳皇帮了
转: 为什么Web App的运行速度慢有没有玩CUDA的?
进入Programming版参与讨论
x****u
发帖数: 44466
21
因为结构简单,提升主频反而容易

【在 m*****n 的大作中提到】
: 现在GPU主频也要升到2G
: 这也太牛了吧?

m*****n
发帖数: 3575
22
3G是极限了吧?
难以想象,16nm这么个提升主频法,还不热爆了?

【在 x****u 的大作中提到】
: 因为结构简单,提升主频反而容易
x****u
发帖数: 44466
23
取决于你的数字电路多复杂啊

【在 m*****n 的大作中提到】
: 3G是极限了吧?
: 难以想象,16nm这么个提升主频法,还不热爆了?

1 (共1页)
进入Programming版参与讨论
相关主题
什么都别说了,刷题是王道,我要加入拳皇帮了high performance computer architecture 这课有啥大意义吗
有没有玩CUDA的?什么是OS Memory management and heap structure?
Matlab开多线程真爽啊 (转载)老魏问你个问题
按说java也够快了代码开源了
谈谈想学好底层必不可少的东西服务器测试结果
有大牛可以说说scikit-learn哪些方面不如tf么?10G网络到了
大坑看晕了求推荐一个真心交流技术的地方
Goodbug,是不是单机大于1 million/s的I/O你就输了?為什麼golang algernon比C nginx慢幾十倍?golang行嗎
相关话题的讨论汇总
话题: 计算话题: gpu话题: 其实话题: cpu话题: 架构