只比马斯克矮一点，特斯拉人形机器人震撼宣布！ - Military版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Military版 - 只比马斯克矮一点，特斯拉人形机器人震撼宣布！

进入Military版参与讨论

1

(共1页)

l**********y 发帖数: 330	1 全球最快的 AI 训练速度王座，刚刚易主了。不是英伟达 GPU，也不是谷歌 TPU…… 马斯克治下的特斯拉，自研 AI 训练芯片D1，自研 AI 超级计算机Dojo ExaPod，首秀即巅峰，登场就是全球第一。此外，马斯克还带来了另一个特斯拉新品：汽车机器人，搭载了特斯拉包含芯片在内的软硬件系统，但跟百度的不同，不像汽车更像人。这就是特斯拉年度 AI 开放日上，马斯克再次带来的一系列激动人心的大进展。特斯拉自研 AI 训练芯片 D1 发布马斯克说：要有一个超快的计算机来训练 Autopilot 在内的整个自动驾驶系统。于是 DOJO 诞生了。 DOJO，取名源自日语里 " 练武 " 专用的道场，顾名思义，DOJO 就是特斯拉 AI 不断精益功夫的道场。 DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽和低延迟，以及分区和映射的大型网络。实际上，在 CVPR 2021 现场，特斯拉就已经剧透过 DOJO 的相关性能。当时总算力达1.8EFLOPS，读写速度高达 1.6TBps，一度被认为超越全球排名第一的超级计算机富岳，创造超算新纪录。但那时 DOJO 用的是英伟达的 A100 GPU，单卡算力 321TFLOPS，共计5760张，节点数高达 720 个。而现在，DOJO 更进一步，自研了 " 心脏 "芯片。特斯拉首款 AI 训练芯片D1，正式发布。 7nm工艺，单片 FP32 达到算力 22.6TOPs，BF16 算力 362TOPs。特斯拉发布会现场，还用图展示性能，拳打英伟达 GPU，脚踢谷歌 TPU。一句话概括，比现在市面上任何芯片都强。特斯拉也用 "Pure Learning Machine"，纯学习机器，来称呼 D1 芯片。此外，D1 芯片强的不只是单兵作战能力，还有集团军作战能力，它们可以无缝融合，变成超大规模计算阵列。能有多大，接下来，特斯拉就揭晓了之前预热海报上的 " 神秘物种 "：集合了 25 块 D1 芯片的训练模块！这也是特斯拉首个训练模块，而把多个模块集合，就能形成更大算力的训练阵列：至此，特斯拉自研超算 DOJO完整真身亮相！超过 50 万个训练节点。每个模块算力为 9 petaflops，带宽为 36TB/s。 DOJO 的可怕之处在于，不同于世界其他超算需要承担多种不同任务，DOJO 的唯一使命就是 AI 训练，或者可以说聚焦到自动驾驶算法的训练。因为专注，所以首秀即巅峰。 AutoPilot、FSD，特斯拉的其他 AI 训练任务，都能在 DOJO 里更高效练就。另外，特斯拉官方还继续剧透：这不是终点，下一代 DOJO 还会有 10 倍性能的提升！所以到这里就完了？拿衣服。最后也是最强，特斯拉 D1 支持下的终极大杀器登场： ExaPOD，集成 120 个训练模块，包含 3000 个 D1 芯片，超过 1 百万个训练节点。算力达到1.1EFLOP。而且每单位能耗下的性能比当今最强超算高 1.3 倍，但碳排放仅为 1/5。速度和性能，冠绝业内。于是特斯拉明确：这就是全球最快的 AI 训练计算机。有意思的是，2019 年美国能源部曾放言要花 6 亿美元建 E 级算力的超算，2023 年问世 …… 万万没想到，这个目标被 " 车企 " 特斯拉率先实现了。最强 " 炼丹炉 " 为谁而建？所以问题来了，自研 D1 芯片有了，最强 AI 训练超算 DOJO ready 了，接下来特斯拉会有怎样的改变？特斯拉 AI 技术主管 Andrej Karpathy（李飞飞高徒）登场，介绍了 D1 芯片和 DOJO ，主要服务的对象——特斯拉的在自动驾驶方面领先所有对手的 " 灵丹妙药 "：纯视觉方案。事故频出，争议四起，甚至中国绝大部分玩家都转向了视觉激光雷达的综合方案，但特斯拉依然坚持。 Karpathy 详细介绍了特斯拉高纯视觉方案的思路，和现行 8 摄像头方案的特点，以及它为什么能 work。特斯拉纯视觉方案，基本构建原则是把自动驾驶系统看作一个生物，有眼睛、有神经、有大脑。目前的方案有八个摄像头，背后是被称为 HydraNets —— " 九头蛇网络 " 的多任务学习神经网络。 " 九头蛇网络 " 可以同时处理目标检测、交通标志识别、车道预测等等任务，其关键在于对各种数据的特征提取，包括不同种类数据的特征共享、对不同任务的分别调参，以及参数缓存，用来加快调参速度。这也是实现 FSD 敏捷开发，半年内迭代 2-3 个版本的关键。接下来，Karpathy 描述了纯视觉方案的历史，以及方案发展到今天的逻辑，他展示了一段特斯拉处理其图像数据的视频。他说过去的 FSD 虽然很好，但事实证明这样的系统不够完善，每个摄像头能够检测到工程师预期的目标，但背后神经网络的矢量空间是不够的。于是，特斯拉如重新设计了神经网络，就是上面的 " 九头蛇 "。另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。特斯拉方面还比较了多摄像头方案和单摄像头方案的差别，相同的场景下，单摄像头方案识别率明显低于多摄像头方案。特斯拉车辆上的 8 个摄像头获取原始输入后，系统会创建各种分辨率的图像，用于各种功能和目的。这些不同的图像会被分别喂给处理不同任务的神经网络，作为整个自动驾驶系统的决策依据。接着，Karpathy 介绍了特斯拉的 " 终极建筑师 "，即车辆在行驶过程中可以实时对车道、环境建模。车道线实时建模，其实就是特斯拉自己的高精地图能力。中国自动驾驶玩家，强调 " 高精度地图 " 的不少，但特斯拉的思路，" 现成资源 " 不是本质能力，本质能力应该是 " 创造资源 " 的能力。最后，Karpathy 谈了 AI 公司常见的数据标注问题，他认为，把数据外包给第三方去做手工标注并不好，所以特斯拉选择自建团队来给数据打标，目前已经从 2D 图像标记升级到 4D 矢量空间的标记。
n*****9 发帖数: 654	2 马药停从一个忽悠走向另一个忽悠。：）
s*******9 发帖数: 1559	3 skynet啥时候出, 等不及了
l**p 发帖数: 6080	4 弄个真人伪装机器人马要听真不要脸【在 n*****9 的大作中提到】 : 马药停从一个忽悠走向另一个忽悠。 : ：）

1

(共1页)

进入Military版参与讨论

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)