由买买提看人间百态

topics

全部话题 - 话题: 单精度
1 2 下页 末页 (共2页)
g******s
发帖数: 733
1
在fortran语言中,单精度实数是4-byte(字节?),为什么整型也是4-byte呢?从byte位数到
数据范围有什么计算公式吗?
先谢了!
S******n
发帖数: 5022
2
来自主题: Hardware版 - 求个建议装机计算用
用单精度的话,上两块GTX 780吧。现在降价了,性价比不错。
GTX 7系列,双精度是单精度的 1/24 (理论值是1/3,阉割了)
其实如果不上titan,GTX 580的双精度在NV民用卡中是最强的。只是现在我不知道哪里
有廉价GTX 580卖。
NV 费米 双精度理论上是单精度的 1/2;
NV 开普勒 双精度理论上是单精度的 1/3;
NV 麦克斯韦 双精度理论上是单精度的 1/4;(麦克斯韦要集成ARM处理器,ARM参与调
度)
AMD R9 290X/290也阉割了双精度了,只有单精度的1/8 (理论值应该是1/2,阉割了)。
倒是7990、7970的双精度是完全的,是单精度的1/4(理论值也是1/4)。
用游戏卡搞计算,单精度AMD和NV其实都差不多。
双精度目前是NV阵营 Titan > 580 > 780; AMD阵营 7970 > 290X
y*z
发帖数: 3244
3
来自主题: Hardware版 - 4k 有游戏是不是没有什么意义?
gtx 980 Ti真心是好卡,跟titan X相比。
NV最近发布了新的计算卡,Tesla M60和Tesla M40.
Tesla M60的规格就是gtx 980x2, 4096 CUDAs,但是配16GB显存;
Tesla M40的规格则跟titan X一样,都是3072 CUDAs,12GB显存。
性能么,和GTX的游戏卡一样,单精度很NB,双精度挫了。不过现在讲究混合计算,
CUDA 7.5就支持这个。(所谓混合计算了,例如迭代法,中间都用单精度计算,最后几
步用双精度提高计算精度。因为单精度FP32向来都比双精度FP64快,能节省时间。现在
流行FP16,比单精度更快。)
有趣的是,都不带硬件ECC。ECC以软件的形式提供。感情原来是卖驱动程序和固件。
l*****6
发帖数: 752
4
来自主题: Military版 - 转:1991年留美学生卢刚事件
1991年的万圣节对于美国依阿华大学的师生来说,是噩梦般的一天:中国留学生卢刚在
获得该大学太空物理学博士学位之后,竟开枪射杀了该校3位教授和副校长安·柯莱瑞
,以及和他同时获得博士学位的同胞林华。枪杀5人之后,卢刚饮弹自尽。此事当时震
惊中美两国。15年之后,以“卢刚事件”为蓝本的电影《暗物质》于日前关机。这部由
中美两国影星合作出演的影片无疑将再次唤起人们对这一悲剧的反思与警醒。
卢刚事件,是指1991年11月1日就读于美国爱荷华大学的中国博士留学生卢刚在校园中
射杀数人的枪击事件,当时曾震惊中美两国。 卢刚生于北京市,18岁考入北京大学物
理系,1985年本科毕业后进入爱荷华大学物理与天文学系攻读研究生。他的导师是克里
斯托弗·戈尔咨(Christoph K. Goertz) 1991年11月1日,卢刚进入了正在进行
专题研讨会的爱荷华大学凡艾·伦物理系大楼(Van Allen Hall)三楼的309室,在旁
听约五分钟后,他突然拔出左轮手枪开枪射击,他首先击中他的博士研究生导师,47岁
的戈尔咨教授,并在戈尔咨教授倒下之后,又在教授脑后补了一枪;然后,他又朝他的
博士研... 阅读全帖
l*****7
发帖数: 8463
5
来自主题: Stock版 - 物理WSN vs 弯弯WSN
物理WSN vs 弯弯WSN
物理WSN:
http://www.mitbbs.com/article_t/Military/40363053.html
http://www.youku.com/show_page/id_zcc059788962411de83b1.html#an
弯弯WSN:
http://www.huffingtonpost.com/2013/09/30/bikers-assault-suv-dri
http://www.dailymail.co.uk/news/article-2438620/Shocking-video-
1. 物理WSN
http://www.mitbbs.com/article_t/Military/40363053.html
1991年的万圣节对于美国依阿华大学的师生来说,是噩梦般的一天:中国留学生卢刚在
获得该大学太空物理学博士学位之后,竟开枪射杀了该校3位教授和副校长安·柯莱瑞
,以及和他同时获得博士学位的同胞林华。枪杀5人之后,卢刚饮弹自尽。此事当时震
惊中美两国。15年之后,以“卢刚事件”为蓝本的电影《暗物质》于日前关机。这部由
... 阅读全帖
G****e
发帖数: 11198
6
【 以下文字转载自 WaterWorld 讨论区 】
发信人: linghuchongg (linghuchongg), 信区: WaterWorld
标 题: 真相:1991年留美学生卢刚事件(转载)
发信站: BBS 未名空间站 (Mon Jul 28 23:05:11 2014, 美东)
真相:1991年留美学生卢刚事件(转载)
作者: 陈帆Kenneth
1991年的万圣节对于美国依阿华大学的师生来说,是噩梦般的一天:中国留学生卢
刚在获得该大学太空物理学博士学位之后,竟开枪射杀了该校3位教授和副校长安·柯
莱瑞,以及和他同时获得博士学位的同胞林华。枪杀5人之后,卢刚饮弹自尽。此事当
时震惊中美两国。15年之后,以“卢刚事件”为蓝本的电影《暗物质》于日前关机。这
部由中美两国影星合作出演的影片无疑将再次唤起人们对这一悲剧的反思与警醒。
卢刚事件,是指1991年11月1日就读于美国爱荷华大学的中国博士留学生卢刚在校
园中射杀数人的枪击事件,当时曾震惊中美两国。 卢刚生于北京市,18岁考入北京大
学物理系,1985年本科毕业后进入爱荷华大学物理与天文学系攻读研究... 阅读全帖
G****e
发帖数: 11198
7
【 以下文字转载自 WaterWorld 讨论区 】
发信人: linghuchongg (linghuchongg), 信区: WaterWorld
标 题: 真相:1991年留美学生卢刚事件(转载)
发信站: BBS 未名空间站 (Mon Jul 28 23:05:11 2014, 美东)
真相:1991年留美学生卢刚事件(转载)
作者: 陈帆Kenneth
1991年的万圣节对于美国依阿华大学的师生来说,是噩梦般的一天:中国留学生卢
刚在获得该大学太空物理学博士学位之后,竟开枪射杀了该校3位教授和副校长安·柯
莱瑞,以及和他同时获得博士学位的同胞林华。枪杀5人之后,卢刚饮弹自尽。此事当
时震惊中美两国。15年之后,以“卢刚事件”为蓝本的电影《暗物质》于日前关机。这
部由中美两国影星合作出演的影片无疑将再次唤起人们对这一悲剧的反思与警醒。
卢刚事件,是指1991年11月1日就读于美国爱荷华大学的中国博士留学生卢刚在校
园中射杀数人的枪击事件,当时曾震惊中美两国。 卢刚生于北京市,18岁考入北京大
学物理系,1985年本科毕业后进入爱荷华大学物理与天文学系攻读研究... 阅读全帖
l**********g
发帖数: 426
8
真相:1991年留美学生卢刚事件(转载)
作者: 陈帆Kenneth
1991年的万圣节对于美国依阿华大学的师生来说,是噩梦般的一天:中国留学生卢
刚在获得该大学太空物理学博士学位之后,竟开枪射杀了该校3位教授和副校长安·柯
莱瑞,以及和他同时获得博士学位的同胞林华。枪杀5人之后,卢刚饮弹自尽。此事当
时震惊中美两国。15年之后,以“卢刚事件”为蓝本的电影《暗物质》于日前关机。这
部由中美两国影星合作出演的影片无疑将再次唤起人们对这一悲剧的反思与警醒。
卢刚事件,是指1991年11月1日就读于美国爱荷华大学的中国博士留学生卢刚在校
园中射杀数人的枪击事件,当时曾震惊中美两国。 卢刚生于北京市,18岁考入北京大
学物理系,1985年本科毕业后进入爱荷华大学物理与天文学系攻读研究生。他的导师是
克里斯托弗·戈尔咨(Christoph K. Goertz) 1991年11月1日,卢刚进入了正在
进行专题研讨会的爱荷华大学凡艾·伦物理系大楼(Van Allen Hall)三楼的309室,
在旁听约五分钟后,他突然拔出左轮手枪开枪射击,他首先击中他的博士研究生导师,
4... 阅读全帖
z******i
发帖数: 1292
9
来自主题: Hardware版 - 求个建议装机计算用
其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的
卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。)
跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000
以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。)
跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者
性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美
元。差别主要是ECC校验和驱动程序。
http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。
T****O
发帖数: 407
10
来自主题: Hardware版 - 求教科学计算的软硬配置
主要打算利用动力学模拟来试验有关蛋白分子结构的一些想法。先依靠GROMACS,因为
它完整且免费。但以后也可能用Amber,CHARMM或其他商业包。
首先就有一个软件问题,GROMAS主页上好像不待见双精度浮点数的必要性,认为单精度
足够。但想当年我用单精度算一个系统,三个月后被一句“你为什么不用双精度”打回
来,那个惨哪。哪位同学仔细验证过GROMACS单精度、长时间运行结果的可靠性没有?
初步目标是,以2fs步长跑到一微秒左右的时候,已知结构的小蛋白分子不会炸开。
操作系统用CentOS应该没问题吧?我可能先装Windows,用Prime95烤机,因为熟悉。
接下来是硬件问题。GROMACS v5 的CUDA实现看上去不错。Amber那帮人干脆就开卖自己
背书的CUDA硬件。所以作为起步,我打算入一块GTX 760 或 680,哪个更好?再推荐一
个品牌?
以上面说的计算为目的,显存多大比较合适?有没有更合适的推荐?预算上限$500左右
,所以Titan不考虑了。Amber评测C2050/C2070远不如GTX 680,也暂不考虑,除非捡到
$100的。
要是哪个同学成功编译验证... 阅读全帖
T****O
发帖数: 407
11
来自主题: Hardware版 - 求教科学计算的软硬配置
这配置得超过一万块吧。
我现在想的是拿块单精度不错且可执行双精度的GTX卡,先做一个完整的软硬配置,跑
一跑,看看单精度结果怎样。
依据的是下面这个,Amber14在不同CUDA硬件上做的评测
一块GTX 680, 23K个原子的系统,2fs步长一天可跑完90纳秒,三天后结果就比较有代
表性了。我考虑的系统原子数量比这还小,照这效率,估计每周至少能试验一个想法。
现在旧货680和760,新960都差不多两百块,单精度却强不少,估计就它了。不过EVGA
,华硕、技嘉这几个牌子哪个好点?
q*p
发帖数: 963
12
来自主题: Hardware版 - AMD Fury X 功耗 275W
Fiji的双精度浮点性能为单精度的1/32.
Fury X 8.6 TFLPS的单精度浮点能力,双精度就只有269 GFLPS了。这也就是性能上升
能耗下降的主要原因(跟GTX Titan X学的,GTX Titan X从上一代的1/3降到1/24)。
忽然感觉四朝元老7970(马甲280X)双精度真的很强啊(单精度的1/4),廉颇宝刀未
老。
f****b
发帖数: 2410
13
来自主题: Biology版 - 1991年的美国万圣节
2011年的美国万圣节,刚给来门前讨吃的穿戴鬼神样子的孩子们发完了糖,写下今天的
导告,20年前的今天,在美国发生了一件和我们中国大陆人密切相关的大事件,那就
是卢刚事件,这是向往来美国的中国人心中的疼,不多说了,"你懂的",自己看把。
剧场开始
===============================================================
万 圣 悲 魂
刘予建

对美国中部平静、宁和的小镇衣阿华市来说,一九九一年万圣节(Halloween)不
啻一个
“凶日”,一个名符其实的“鬼节”。
似乎老天恶作剧,这一天风云突变,天气骤寒,第一场暴风雪异乎往年早早地降临
了…

这是一个周末下午。在衣阿华大学《衣阿华人日报》编辑部办公室内,仅剩下学生
记者
凯勒一人在电话上采访该校万圣节庆祝活动的新闻。这时,另一张桌子上的电话响了。
他没
去理它,继续采访。不料,其它七、八部电话机紧接着也不约而同地纷纷响了起来。他
觉得
奇怪,不耐烦地走过去,抓起其中一只。只见他刚听了几句话,脸色陡然大变,“叭”
地摔
下话筒,顺手操起小收录机和笔记本... 阅读全帖
f****b
发帖数: 2410
14
来自主题: Biology版 - 1991年的美国万圣节
2011年的美国万圣节,刚给来门前讨吃的穿戴鬼神样子的孩子们发完了糖,写下今天的
导告,20年前的今天,在美国发生了一件和我们中国大陆人密切相关的大事件,那就
是卢刚事件,这是向往来美国的中国人心中的疼,不多说了,"你懂的",自己看把。
剧场开始
===============================================================
万 圣 悲 魂
刘予建

对美国中部平静、宁和的小镇衣阿华市来说,一九九一年万圣节(Halloween)不
啻一个
“凶日”,一个名符其实的“鬼节”。
似乎老天恶作剧,这一天风云突变,天气骤寒,第一场暴风雪异乎往年早早地降临
了…

这是一个周末下午。在衣阿华大学《衣阿华人日报》编辑部办公室内,仅剩下学生
记者
凯勒一人在电话上采访该校万圣节庆祝活动的新闻。这时,另一张桌子上的电话响了。
他没
去理它,继续采访。不料,其它七、八部电话机紧接着也不约而同地纷纷响了起来。他
觉得
奇怪,不耐烦地走过去,抓起其中一只。只见他刚听了几句话,脸色陡然大变,“叭”
地摔
下话筒,顺手操起小收录机和笔记本... 阅读全帖
k******1
发帖数: 2883
15
来自主题: Military版 - 芦刚杀人案20年
中国臭老九在米国的血泪萎缩憋屈史的一朵浪花啊:
万 圣 悲 魂 (上)
刘予建

对美国中部平静、宁和的小镇衣阿华市来说,一九九
一年万圣节(Halloween
)不啻一个“凶日”,一个名符其实的“鬼节”。
似乎老天恶作剧,这一天风云突变,天气骤寒,第一
场暴风雪异乎往年早早地
降临了……
这是一个周末下午。在衣阿华大学《衣阿华人日报》
编辑部办公室内,仅剩下
学生记者凯勒一人在电话上采访该校万圣节庆祝活动的新
闻。这时,另一张桌子上
的电话响了。他没去理它,继续采访。不料,其它七、八
部电话机紧接着也不约而
同地纷纷响了起来。他觉得奇怪,不耐烦地走过去,抓起
其中一只。只见他刚听了
几句话,脸色陡然大变,“叭”地摔下话筒,顺手操起小
收录机和笔记本,飞也似
地跑出办公室,朝物理系大楼奔去……
而在宿舍里,女学生哈里斯四十分钟前刚从物理系大
楼做完实验回来。她太累
了,正躺在床上休息。突然,一个朋友从加利福尼亚州打
来电话,紧张地问:“你
没事吧?”
她莫名其妙:“我很好啊,怎么回事?”
“刚才电台广播说,你们学校校园里发生了持枪滥射
事件,我耽心你会不会…
…”
“什么?有人持枪滥... 阅读全帖
f***y
发帖数: 4447
16
本项目研发的 JM9231、JM9271 产品系面向不同应用领域的两款中、高档系列产品,
采用国际同类公司通用做法,采用业界主流的统一渲染架构,支持 OpenGL4.5,在同一
个架构下,通过减少运算单元数量、渲染通道、显存带宽等手段,降低产品成本。
主要 技术指标如下: 产品名称 主要技术指标 主要面向市场 高性能通用 图形处理器
-JM9231 型芯 片 (1)视频解码:支持 H.265 高清视频编解码功能,支持 [email protected]
; (2)2D 图形生成功能:支持 DirectFB 1.4;支持 OpenVG 1.1 矢 量图形加速;
(3)3D 图形生成功能:支持 OpenGL4.5 规范;支持 OpenCL1.2; 像素填充率≥32 G
Pixels/s;单精度浮点性能≥2TFlops; (4)内核性能:内核时钟频率≥1500MHz;
(5)总线接口:PCIE 3.0 X16; (6)显存带宽:256GB/s; (7)显存容量:8GB;
(8)显示接口:支持 HDMI2.0、Display port 1.3; (9)支持平台:支持 X86、ARM
... 阅读全帖
j*******2
发帖数: 386
17
来自主题: Military2版 - 龙芯3B流片成功[zz]
哈哈,
对的对对,并行计算都是--矩阵向量运算,没有分支的,全部是矩阵乘法,内存访问都
是很规整的,而且都是单精度浮点的。小菊,你OK的。
再给你补补课吧,GPU的并行单元一般是128位或者256位,单精度浮点(因为图像计算不需
要dobule floating point)。从单个SIMD单元来看,目前的CPU完全和GPU一样,甚至还
好。
GPU的比CPU强的地方在于它有很多个核,这也是由现有的图形加速算法来决定这种设计
方式的。
h*********n
发帖数: 11319
18
来自主题: Military2版 - 前一篇帖子小数点错了一位,汗
flops没特别提的话都是双精吧,除了图形学还没有啥科学计算程序用单精度的,只有
gpu会鼓吹单精度的速度(现在也重点提升双精度性能了)
b*****e
发帖数: 2511
19
我发现你什么都懂。。。
单精度的精确度是小数点后6,7位吧,我最后数据的精度估计也就 小数点后5,6位。我
是不是直接单精度就可以了?
h*********n
发帖数: 11319
20
天河一号A荣登超级计算机全球排行榜首位让多少国人感到自豪,但也有不少人质疑它是
否真的有用,特别是CPU+GPU的异构计算架构能否真正发挥作用。事实证明,天河一号A
不仅能用来跑分,更能参与实际科学运算。中国科学院过程工程研究所(CAS-IPE)的科研
人员们近日就利用天河一号A的GPU计算能力创造了一项新的分子模拟计算世界记录。
他 们在全部7168颗NVIDIA Tesla GPU上运行了一个非常复杂的分子动力学(MD)模拟项目
,模拟太阳能面板、半导体行业中常用的晶体硅的分子结构,最终只用了大约2000行CU
DA代 码,就取得了1.87PFlops(每秒1.87千万亿次浮点运算)的峰值单精度性能,大约相
当于13万台普通笔记本。这次模拟的系统内有1101亿个原子,而为了模拟0.116纳秒物理
时间内的系统演化,整套模拟系统运行了大约50万世间步长,每一步计算时间25微妙,
总共用了大概3个小时。通过反复验证,科研人员确认模拟结果与真实材料是完全相符的
,而且单精度计算已经足够解决问题。
在此之前,同类模拟计算的最高纪录是490亿个原子、369万亿次浮点运算每秒。
值得一提的是,... 阅读全帖
s****r
发帖数: 37
21
来自主题: Hardware版 - 大家说说 cuda 和 opencl 吧
谁说差别不大?AMD的HD 6970的单精度峰值2.7TFlops,Nvida的针对HPC的GPU-Telsa(
C2050)只有1.03Tflops。AMD即将推出的基于Southern Island的
79XX单精度更是达到惊人的12TFlops, 双精度也达到3Tflops.
http://forum.beyond3d.com/archive/index.php/t-59176.html
Nvidia Cuda开发环境相对成熟,目前数学库也多一些。AMD正在基于Opencl
开发BLAS和FFT。
E***e
发帖数: 3430
22
来自主题: Hardware版 - 求个建议装机计算用
大概七八年前,连计算流体都是单精度
因为内存不够
现在的应用我完全不介意由于硬件限制回到单精度上
m****s
发帖数: 1481
23
来自主题: Hardware版 - 用于科学计算的单机该怎么配
如果算法可以并行的话,我推荐用gpu,相对于cpu搞并行用多线程比如mpi这些,gpu跑
并行的上手难度小多了。而且速度提升还是很大的,特别是不需要非常高精度的。
我之前把组里的通信仿真从c转成opencl,速度提升有10-40倍,当然是跑的单精度,因
为通信的最终硬件实现只有6-7位,所以单精度,甚至半精度都是绰绰有余的。其他的
科学计算我就不确定了,不过即使都是跑双精度,gpu一般也能比cpu快5-10倍,我是说
同价位的一个cpu和一个gpu比。
当然最快的还是fpga,不过那个开发起来费时间一些,design重复利用率也不高,不像
code
t*****z
发帖数: 1598
24
来自主题: Hardware版 - 用于科学计算的单机该怎么配
谢谢指点!从我所读到的消息看,游戏卡比起专业卡,故意阉割了双精度性能。N卡(
除泰坦)双精度运算速度只有单精度的24分之一。但是A卡阉割得不那么厉害,其中
Tahiti架构的几款显卡都有单精度的四分之一,算是相对比例最高的。所以我才想买那
些卡,而不是看中他们的挖矿速度。
我似乎读到,Intel的核心显卡没有阉割双精度,说不定用那种鸡肋的集显跑需要双精
度的OpenCL程序反而比两三百的N卡更快。
P****S
发帖数: 2286
25
来自主题: Hardware版 - 用于科学计算的单机该怎么配
科学计算机器最重要的指标是内存的大小。你需要估计一下你的数据量然后决定内存大
小。至于几个通道比起内存不够用硬盘充数都是小问题。
如果有条件上ECC比较好。ECC真正的好处是内存出错之后能让你立刻知道。非ECC内存
一般都是系统频繁死机之后,才会去测内存是否有问题。从内存出问题,到你知道内存
出问题这段时间里出的结果就都浪费了。另外你也很难知道内存到底啥时候出的问题。
你需要搞清楚你的运算是整数,单精度还是双精度。用户级的N卡GTX5xx系列双精度强
,GTX6xx系列单精度强。GTX7xx情况不太清楚,有知道的欢迎补充一下。
如果code能用Matlab写,还是上Matlab,编程和调试都很方便。如果你的数据内部比较
独立的话,Matlab里很容易实现并行,而且效率非常高。
现在一两万美金就能买到4-way服务器。最好是组里出钱买个机器,你在家里能远程登
录上去用就行了。如果数据量比较大,multiple copy之间的同步其实挺麻烦的。
z******i
发帖数: 1292
26
来自主题: Hardware版 - NV记 Titan Z 显卡真疯狂啊
双精度浮点性能2.3 TFlops,这个很牛。科学计算很有用。
AMD的R9 295x2牛的是单精度,双精度是单精度的1/8。
E***e
发帖数: 3430
27
单精度计算数据看了没用
一旦双精度被锁
单精度也受影响
不知道为什么
好像和cuda library有关。
j*y
发帖数: 320
28
来自主题: Hardware版 - 自己配机器之我见
如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用,
一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一
些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。
如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon
Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统,
无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校
验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游
戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散
热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX
titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
需求,那么你只能搞个大型机或者去买超算中心的服务了。
如果计算任务不重,特别是没什么双精度类型的那些科学计算,一般而言,4核... 阅读全帖
a***e
发帖数: 27968
29
来自主题: Hardware版 - 美国网购显卡TOP5
是啊,俺现在还是一个7870xt
双精度秒GTX9xx全家
关键是单精度差太多,游戏也就单精度算算,估计优化也不够

家?
t****t
发帖数: 6806
30
来自主题: Programming版 - fortran 中数值精度怎么保证的?
双精度尾数是52位, 单精度是23位. intel的80位浮点数, 尾数是63位.
我看LZ这结果, 好象中间变成单精度过.

)
P******0
发帖数: 9787
31
新华网北京4月24日电(记者吴晶晶)我国首套分布式GPU超级计算系统24日在
中国科学院建成并正式启用,这标志着我国运用高性能计算解决实际科研与工程问题的
能力达到了国际先进水平,在软硬件协同和能效方面进入了国际领先行列。
据介绍,当今世界高性能计算对科技进步、经济社会发展等的作用与日俱增。但在
超级计算机的峰值突飞猛进的同时,其投资大、运行维护成本高、使用效率低等问题也
日渐突出。中国科学院在财政部专项资金的支持下,成功建立了基于GPU的双精度峰
值超过千万亿次、单精度峰值超过三千万亿次的高效能超级计算系统,并与联想和曙光
两家公司合作在中科院内不同领域的研究所推广了十套百万亿次系统,从而构建了聚合
计算能力近六千万亿次的分布式GPU超级计算系统。该系统满足了广大科技人员对超
级计算的实际需求,以低廉的成本和现成的网络设施实现高效的超级计算,形成了一条
应用导向、效率优先的富有中国特色的超级计算模式。
目前,中科院过程所和高能物理研究所、国家天文台等十家用户单位已经利用相关
系统开展了高能物理模拟与实验数据分析、天体物理与空间科学研究、石油物探数据分
析与油藏开采过程模拟、工业和医学
y****e
发帖数: 23939
32
来自主题: Military版 - 天河-1A 排名世界第一了
FT,叫单精度,哪有低精度这个说法
k******1
发帖数: 2883
33
来自主题: Military版 - 芦刚杀人案20年
这时,戈尔咨走过来对卢刚训话。作为“导师”,他
开始对卢刚的论文大加指
责,并说他必须对自己答辩失败负完全责任云云。卢刚愤
怒不已。他明明记得,自
俩人上次在学术上的不同发现后,正是眼前这位“导师”
耿耿于怀,一再用种种借
口拖延或拒绝让自己毕业。他对自己的论文从未象对山林
华的那样加以指导。相反
,直到今天,这些人仍在处处使绊子,甚至有意让他当众
丢丑。
但他仍然忍耐着,一言不发。他深信自己的论文的质
量和独创性。毕竟它已获
得系里许多教授的称赞,而戈尔咨、尼柯森等人不过是在
吹毛求疵,存心同他过意
不去罢了。他不愿同他们争吵。好在还有最后一次机会:
四月二十九日,物理系毕
业论文截止日期。这个日期对所有九一年毕业的博士候选
人具有双重意义:第一,
他们必须在此之前通过论问的笔试、口试,第二,凡在该
日期已前完成的博士论文
,都有可能获得系里对学校一项DC学术奖的提名。
目前,在物理系十五名论文作者中,已有两人被提名
为候选人,两人都是中国
人。
这就是他和山林华!
十四
他开始把全部希望和努力都押在这个日期上。他日夜
加班苦干,把论文反复修
改,并且按照系主任的要求,用“双精度”法... 阅读全帖
y*z
发帖数: 3244
34
来自主题: Military版 - 美国超算的未来
一张Tesla P100的计算能力是双精度 5.3 TFLOP/s (单精度是10.6 TTFLOP/s)。
4500张Tesla P100的峰值能力将达到 23,850 TFLOP/s。
如果不出意外,明年春季Piz Daint将从目前的第8升到第4.
如果要超越目前的超算第一太湖之光,需要24000块Tesla P100. 一张Tesla P100的TDP
是300瓦。
24000张Tesla P100的功耗将是7200 kw。到时是绝对的鸡血。
h*********n
发帖数: 11319
35
来自主题: Military2版 - 龙芯3B流片成功[zz]
向量协处理器,批阅了这么半天感情都不看关键字啊
3B总共8个核心,每个核心有2个256位向量协同处理器。每个协处理器一个周期跑一条向
量指令:8*2*256/32*1G=128G单精度浮点运算/秒
修订:一个周期跑一个256位fmad算16个浮点操作。所以是128G双精度
a***e
发帖数: 27968
36
来自主题: Military2版 - 龙芯3B流片成功[zz]
搞了半天是单精度?
好我输了
i7得六核,每核3个128bitFPU,跑3.33G
6*3*128*3.33/64=120Gflops的双精度,
不过好象一般说108Gflops

条向
m******r
发帖数: 1033
37
来自主题: Faculty版 - 电影“暗物质”和卢刚
如果你是卢,你做得未必有卢好。 哦你情商好高,和老板谈,谈什么呢 就是不让你毕
业, 同样的东西,正这算一遍,反着算一遍,单精度算一遍,双精度再算一遍. 两边
结果都对上了 勉强让你滚蛋,推荐信是别想了。 和同学谈,有什么可谈呢? 没工作
,没女人,老大不小了, 在个鬼城呆四年,这人不死也得疯。
卢把他和老板的矛盾曾经通过书面形式往学院反映过,也往当地报社反映过。 结果如
何,意料之中。 我猜这就是他拿着枪杀学院一位秘书的原因 (具体原因谁也不知道)
。因为这些书信至今不曾公布。
公布出来的是卢给他姐姐的一封家书。这是他行动前给他姐姐写的,外加一万美元。
有兴趣的可以找来读读。 当时可是刊登在《中国青年报》的 轰动一时。
当然midwest群众素质也是非常之高。那位受害人(可能至今还在医院躺着)一大家子
人开个会议,决定主动联系卢在北京的亲人,表示愿意原谅卢。
m*****o
发帖数: 11
38
来自主题: Faculty版 - GPU怎么搞? 买个卡多少钱?
你需要买个台式机,需要有PCIex16的插槽。电源最好在800W以上。
如果你只需要用单精度(single-precision floating-point),到nvidia的网上要一个
GeForce Titan X Pascal. https://developer.nvidia.com/academic_gpu_seeding
如果你需要双精度(double-precision floating-point),买一个Nvidia Tesla P100或
Nvidia Telsa K80.
p**f
发帖数: 3549
39
老黄称这个RTX(光追)是“自2006年CUDA GPU发布以来的最大进步”,不是没有道理。
CUDA 2006搞出来,第一版release都到2008年了,被发现潜能是在2012年DL论文粗来后
,真正大火是在2016前后,前后至少有个7/8年技术积累和市场缓冲。
NV这几年把重心转向big data computing,老本行图形方面就是专攻光追效果,单看这
一代显卡参数,显存,单精度计算力,CUDA core比1080TI都没有实际提升。就相当于
宣布,老子攻克了世界难题,但是无法应用,没屁用。因为当前没有游戏支持光追。等
游戏商纷纷加RTX渲染怎么也得个几年。再等到gamer看到电影画质般的游戏场景,才愿
意掏钱买账。到时一入RTX,就回不去了。体验差别太大了!
反正现在NV手握两条线,一是强调计算力,就是伏特安培这条线。二是强调图形性能,
图灵这条线。备用线是无人驾驶,游戏机上用的CPU+GPU方案,Xavier,目前看来备用
这条线快走不通了。。。
可以确定是NV接下来股价能保本就不错了,肯定没啥大突破了。至于以后RTX发威,我
看也不会高到哪里去,因为现在显卡份额已经差不... 阅读全帖
J******t
发帖数: 1945
40
昨天无意间在电视上看到一部叫 Dark Matter 的电影,瞅了一眼,怎么里面有个亚裔
演员很面熟,好像是刘烨。看了一下简介,果然是他。于是开始看剧情,讲的是一个中
国留学生在美国校园的故事。感觉他演的很像,第一次见导师时紧张的表情,带着口音
的蹩脚的英语......还有贯穿整个影片的国内父母劳碌的身影,背景是他给父母写信的
独白,深深地打动了我。
看到中间他导师开始赏识手下另一个学生,我就怀疑是卢刚事件。再看到论文答辩时,
导师问他是用的单精度计算还是双精度,就确信无疑了。真是悲剧啊!电影中是说由于
导师刁难,他没有博士毕业。但是从网上的资料看,他在短时间内用双精度计算重新算
了,并且得出了同样的结论,所以博士毕业了,但是没有得奖。由于导师不写推荐信,
找不到工作。他又不肯回国,所以走上了绝路。唉,真是太极端了。
听说片子本该于07年正式上映,可是由于发生了美国弗吉尼亚理工大学的校园枪杀案,
这部“敏感”的片子被暂时雪藏了。我感觉片子有美化卢刚的嫌疑,好象是站在卢刚的
角度在叙述整个事件。不管怎样,希望不要再发生类似的悲剧了。
q****o
发帖数: 9
41
来自主题: Seattle版 - 10w的税前,每年能剩下4w吗?
单精度。exactly.
d********f
发帖数: 43471
42
正常的,今年连都单精度双精度都搞不清的油公司都200k请来做马宫了,我看你要把预
算*2

5
w***g
发帖数: 5958
43
G搞围棋,其实是找个软柿子捏。用那么几千个CPU+GPU,我觉得有没有神经网络都能
干掉人类的。光computing power都不知道超过deep blue多少倍了。
wikipedia上查得的deepblue性能为11.38GFLOPS。现在的Titan X显卡的一块的计算能
力是6600 GFLOPS单精度或者206GFLOPS双精度。G用的GPU只能更强。
围棋自然还涉及大量的整数运算。但是我估计G的机群整体的GFLOPS应该在deepblue
的10万倍到100万倍的样子。(这个数字我算出来吓了一跳,有同学能指正吗?)
我觉得上面有同学说得很对,应该读焦耳。围棋再难,要超过人类无非是个计算量
的问题。注意是要超过人类,而不是要找最优解。之所以只前一直没搞过人类,是因为
没人能聚集起这么大的计算量。我觉得这次李世石被setup了。
如果G事先声明用了deepblue 10万到100万倍的计算量,我觉得李世石未必会应战。
简直就是百万大军群殴一人。
当然这是事后诸葛亮了。
s*******y
发帖数: 18
44
G没有公布机器的spec不过搞CNN流行的配置是Nvidia Tesla K40/K80, 5-8TFLOPS。单
机版插8个GPU,单精度运算是deepblue的几十倍了吧。他们论文里写运算只是深蓝的几
千分之一,不知道他们是怎么评估的。如果运算量那么小,没必要用这么多运算资源。
这个比赛其实不是很公平,调动了这么大的计算资源来和一个人下。人遵守了围棋比赛
的规矩,机器却没有。(至少应该给李九段另外备个棋盘让他推演一下)。机器一直在
用MCST在推演。
我多说几句废话 -
CNN的特点是既能提取图形的局部特征(类似手筋的东西),又可以总结相对宏观的东
西(大局观)。加上reinforcement learning的训练,系统也总结了围棋的动态变化(
dynamics). Reinforcement learning 就像DP一样在某的状态下帮助系统学习这么找最
优解。这个系统/算法设计包括训练都挺NB的,是一个彰显工程能力成功案例。
y*j
发帖数: 3139
45
The training of CNN costs a lot of computation. Once done with the training,
the running time computation is not so high, so it is possible that alphago
needs much less computation than deep blue.


: G没有公布机器的spec不过搞CNN流行的配置是Nvidia Tesla K40/K80, 5-
8TFLOPS。单

: 机版插8个GPU,单精度运算是deepblue的几十倍了吧。他们论文里写运算只是深
蓝的几

: 千分之一,不知道他们是怎么评估的。如果运算量那么小,没必要用这么多运算
资源。

: 这个比赛其实不是很公平,调动了这么大的计算资源来和一个人下。人遵守了围
棋比赛

: 的规矩,机器却没有。(至少应该给李九段另外备个棋盘让他推演一下)。机器
一直在

: 用MCST在推演。

: 我多说几句废话 -

: CNN的特点是既能... 阅读全帖
a****a
发帖数: 5763
46
来自主题: TVGame版 - 游戏主机性能谎言zz
http://baike.baidu.com/view/6735801.html?fromTaglist
游戏主机性能谎言
目录
引言
正文
写在最后
展开
编辑本段
引言
优化极好的COD系列也难逃图像缩水我们通常认为像XBOX360,PS3这种次世代主
机是专业的游戏机拥有着卓越的游戏性能和PC平台难以比拟的游戏种类支持。在此谎言
被彻底戳穿之前,真相屡次浮出水面,先是Crytek公司在其他游戏产商试图讨好游戏主
机时反对其性能嗤之以鼻,然后是跨平台游戏生化危机5先行试玩DEMO爆出后,在PC上
测试成绩的令人瞠目结舌(在原生1080P,全特效,DX10主流PC的为全程近120帧,而
PS3成绩在DX9,不到720P,特效严重缩水的情况也只有26FPS的平均帧数),许多人不
禁惊愕道,“微软和索尼对我们撒了谎!”
主机与08年主流PC参数对比
09年主流PC与家用机对比 游戏机间参数对比
编辑本段
正文
一款游戏的画面效果其实是由游戏引擎和显卡共同决定的,二者之间的分工与协同
非常重要.在PC于家用游戏机”不相往来”的时代,游戏引擎与显卡的关系比较简单,加
上Direct... 阅读全帖
q*z
发帖数: 13362
47
来自主题: PhotoGear版 - N+的优点revisit
这个是胡说了.f2.8对焦点的精度大于f5.6对焦点的精度.光圈更大不会再增加精度.十字
f5.6对焦点只能增强对场景的适应能力,不能增加精度
只要不是照单一横线条的场景(这种情况转一下相机竖拍),十字5.6和一字5.6精度是一样
的.
从对焦精度上来说,双精度十字比单精度十字是先进的.
a*****s
发帖数: 2663
48
单精度差不多少,但是游戏卡双精度差很多,不是一个量级。
a*w
发帖数: 4495
49
单精度还是双精度?当年卢刚因为导师让他改成双精度算一遍就发狂了。
1 2 下页 末页 (共2页)