由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 只比马斯克矮一点,特斯拉人形机器人震撼宣布!
进入Military版参与讨论
1 (共1页)
l**********y
发帖数: 330
1
全球最快的 AI 训练速度王座,刚刚易主了。
不是英伟达 GPU,也不是谷歌 TPU……
马斯克治下的特斯拉,自研 AI 训练芯片D1,自研 AI 超级计算机Dojo ExaPod,首秀
即巅峰,登场就是全球第一。
此外,马斯克还带来了另一个特斯拉新品:
汽车机器人,搭载了特斯拉包含芯片在内的软硬件系统,但跟百度的不同,不像汽车更
像人。
这就是特斯拉年度 AI 开放日上,马斯克再次带来的一系列激动人心的大进展。
特斯拉自研 AI 训练芯片 D1 发布
马斯克说:要有一个超快的计算机来训练 Autopilot 在内的整个自动驾驶系统。
于是 DOJO 诞生了。
DOJO,取名源自日语里 " 练武 " 专用的道场,顾名思义,DOJO 就是特斯拉 AI 不断
精益功夫的道场。
DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽
和低延迟,以及分区和映射的大型网络。
实际上,在 CVPR 2021 现场,特斯拉就已经剧透过 DOJO 的相关性能。
当时总算力达1.8EFLOPS,读写速度高达 1.6TBps,一度被认为超越全球排名第一的超
级计算机富岳,创造超算新纪录。
但那时 DOJO 用的是英伟达的 A100 GPU,单卡算力 321TFLOPS,共计5760张,节点数
高达 720 个。
而现在,DOJO 更进一步,自研了 " 心脏 "芯片。
特斯拉首款 AI 训练芯片D1,正式发布。
7nm工艺,单片 FP32 达到算力 22.6TOPs,BF16 算力 362TOPs。
特斯拉发布会现场,还用图展示性能,拳打英伟达 GPU,脚踢谷歌 TPU。
一句话概括,比现在市面上任何芯片都强。
特斯拉也用 "Pure Learning Machine",纯学习机器,来称呼 D1 芯片。
此外,D1 芯片强的不只是单兵作战能力,还有集团军作战能力,它们可以无缝融合,
变成超大规模计算阵列。
能有多大,接下来,特斯拉就揭晓了之前预热海报上的 " 神秘物种 ":
集合了 25 块 D1 芯片的训练模块!
这也是特斯拉首个训练模块,而把多个模块集合,就能形成更大算力的训练阵列:
至此,特斯拉自研超算 DOJO完整真身亮相!
超过 50 万个训练节点。每个模块算力为 9 petaflops,带宽为 36TB/s。
DOJO 的可怕之处在于,不同于世界其他超算需要承担多种不同任务,DOJO 的唯一使命
就是 AI 训练,或者可以说聚焦到自动驾驶算法的训练。
因为专注,所以首秀即巅峰。
AutoPilot、FSD,特斯拉的其他 AI 训练任务,都能在 DOJO 里更高效练就。
另外,特斯拉官方还继续剧透:这不是终点,下一代 DOJO 还会有 10 倍性能的提升!
所以到这里就完了?拿衣服。
最后也是最强,特斯拉 D1 支持下的终极大杀器登场:
ExaPOD,集成 120 个训练模块,包含 3000 个 D1 芯片,超过 1 百万个训练节点。算
力达到1.1EFLOP。
而且每单位能耗下的性能比当今最强超算高 1.3 倍,但碳排放仅为 1/5。
速度和性能,冠绝业内。
于是特斯拉明确:这就是全球最快的 AI 训练计算机。
有意思的是,2019 年美国能源部曾放言要花 6 亿美元建 E 级算力的超算,2023 年问
世 ……
万万没想到,这个目标被 " 车企 " 特斯拉率先实现了。
最强 " 炼丹炉 " 为谁而建?
所以问题来了,自研 D1 芯片有了,最强 AI 训练超算 DOJO ready 了,接下来特斯拉
会有怎样的改变?
特斯拉 AI 技术主管 Andrej Karpathy(李飞飞高徒)登场,介绍了 D1 芯片和 DOJO
,主要服务的对象——特斯拉的在自动驾驶方面领先所有对手的 " 灵丹妙药 ":
纯视觉方案。
事故频出,争议四起,甚至中国绝大部分玩家都转向了视觉 激光雷达的综合方案,
但特斯拉依然坚持。
Karpathy 详细介绍了特斯拉高纯视觉方案的思路,和现行 8 摄像头方案的特点,以及
它为什么能 work。
特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看作一个生物,有眼睛、有神经、
有大脑。
目前的方案有八个摄像头,背后是被称为 HydraNets —— " 九头蛇网络 " 的多任务
学习神经网络。
" 九头蛇网络 " 可以同时处理目标检测、交通标志识别、车道预测等等任务,其关键
在于对各种数据的特征提取,包括不同种类数据的特征共享、对不同任务的分别调参,
以及参数缓存,用来加快调参速度。
这也是实现 FSD 敏捷开发,半年内迭代 2-3 个版本的关键。
接下来,Karpathy 描述了纯视觉方案的历史,以及方案发展到今天的逻辑,他展示了
一段特斯拉处理其图像数据的视频。
他说过去 的 FSD 虽然很好,但事实证明这样的系统不够完善,每个摄像头能够检测到
工程师预期的目标,但背后神经网络的矢量空间是不够的。
于是,特斯拉如重新设计了神经网络,就是上面的 " 九头蛇 "。
另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。
特斯拉方面还比较了多摄像头方案和单摄像头方案的差别,相同的场景下,单摄像头方
案识别率明显低于多摄像头方案。
特斯拉车辆上的 8 个摄像头获取原始输入后,系统会创建各种分辨率的图像,用于各
种功能和目的。
这些不同的图像会被分别喂给处理不同任务的神经网络,作为整个自动驾驶系统的决策
依据。
接着,Karpathy 介绍了特斯拉的 " 终极建筑师 ",即车辆在行驶过程中可以实时对车
道、环境建模。
车道线实时建模,其实就是特斯拉自己的高精地图能力。
中国自动驾驶玩家,强调 " 高精度地图 " 的不少,但特斯拉的思路," 现成资源 "
不是本质能力,本质能力应该是 " 创造资源 " 的能力。
最后,Karpathy 谈了 AI 公司常见的数据标注问题,他认为,把数据外包给第三方去
做手工标注并不好,所以特斯拉选择自建团队来给数据打标,目前已经从 2D 图像标记
升级到 4D 矢量空间的标记。
n*****9
发帖数: 654
2
马药停从一个忽悠走向另一个忽悠。
:)
s*******9
发帖数: 1559
3
skynet啥时候出, 等不及了
l**p
发帖数: 6080
4
弄个真人伪装机器人
马要听真不要脸

【在 n*****9 的大作中提到】
: 马药停从一个忽悠走向另一个忽悠。
: :)

1 (共1页)
进入Military版参与讨论