z*********n 发帖数: 94654 | 1 挺有意思的
背后的原理有点类似rm -rf,lol
虽然呈现的具体形式不太一样
https://aws.amazon.com/message/41926/ |
z*********n 发帖数: 94654 | 2 亚麻承认,自己的status board放在s3上且一个region是个bad idea,已经改进,哈哈
【在 z*********n 的大作中提到】 : 挺有意思的 : 背后的原理有点类似rm -rf,lol : 虽然呈现的具体形式不太一样 : https://aws.amazon.com/message/41926/
|
d********f 发帖数: 8289 | 3
这个码农要被fire了吧
【在 z*********n 的大作中提到】 : 挺有意思的 : 背后的原理有点类似rm -rf,lol : 虽然呈现的具体形式不太一样 : https://aws.amazon.com/message/41926/
|
z*********n 发帖数: 94654 | 4 没准给分红了
亚麻发现s3营收激增,大家都开始cross region backup了
【在 d********f 的大作中提到】 : : 这个码农要被fire了吧
|
n******r 发帖数: 4455 | 5 看过一个公开课视频,总结了历年比较大的cloud当机历史,除了不可抗力以外,基本
上都是删除命令直接或者间接引起的
关键是这玩意不好实测,不出问题也没人想着去改
【在 z*********n 的大作中提到】 : 挺有意思的 : 背后的原理有点类似rm -rf,lol : 虽然呈现的具体形式不太一样 : https://aws.amazon.com/message/41926/
|
z*********n 发帖数: 94654 | 6 不错
【在 n******r 的大作中提到】 : 看过一个公开课视频,总结了历年比较大的cloud当机历史,除了不可抗力以外,基本 : 上都是删除命令直接或者间接引起的 : 关键是这玩意不好实测,不出问题也没人想着去改
|
d********f 发帖数: 43471 | 7 这又是那个三哥主任程序员写的牛b玩艺?
【在 z*********n 的大作中提到】 : 挺有意思的 : 背后的原理有点类似rm -rf,lol : 虽然呈现的具体形式不太一样 : https://aws.amazon.com/message/41926/
|
z*********n 发帖数: 94654 | 8 应该是ansible, 就是输入参数搞砸了,估计就是某个regular expression意想不到
match了更多的server
活着多了个空格之类的
*billing 写成 * billing了,第一个*全部match了
【在 d********f 的大作中提到】 : 这又是那个三哥主任程序员写的牛b玩艺?
|
y****i 发帖数: 12114 | 9 是真不能实测,还是不会实测?
这种问题出来了就是大问题啊。
【在 n******r 的大作中提到】 : 看过一个公开课视频,总结了历年比较大的cloud当机历史,除了不可抗力以外,基本 : 上都是删除命令直接或者间接引起的 : 关键是这玩意不好实测,不出问题也没人想着去改
|
l*****o 发帖数: 19235 | |
|
|
z*********n 发帖数: 94654 | 11 关键还是权限,能让一个人一下把机器都删了
不过,operational engineer的确都有这权限
类似原理的出错几乎不可能避免
要不你不给权限,估计operational engineer开心死了,老子没权限,干不了
不管上层的安全做得再好,最终低层的管理人员还是能造成很大的伤害
【在 y****i 的大作中提到】 : 是真不能实测,还是不会实测? : 这种问题出来了就是大问题啊。
|
z*********n 发帖数: 94654 | 12 或者就走政府,军队的道路,我一个同事现在还是哥现役军官
跟我说他们navy的it,落后得可怕,程序多的可怕,一台机器一个team管,想登陆这台
机器打入一个命令,需要几十道流程,lol
这样的话,硅谷需要扩招三十倍人
【在 z*********n 的大作中提到】 : 关键还是权限,能让一个人一下把机器都删了 : 不过,operational engineer的确都有这权限 : 类似原理的出错几乎不可能避免 : 要不你不给权限,估计operational engineer开心死了,老子没权限,干不了 : 不管上层的安全做得再好,最终低层的管理人员还是能造成很大的伤害
|
k**l 发帖数: 2966 | 13 以后人为输入到机器命令之间加一层 AI ?
【在 z*********n 的大作中提到】 : 关键还是权限,能让一个人一下把机器都删了 : 不过,operational engineer的确都有这权限 : 类似原理的出错几乎不可能避免 : 要不你不给权限,估计operational engineer开心死了,老子没权限,干不了 : 不管上层的安全做得再好,最终低层的管理人员还是能造成很大的伤害
|
z*********n 发帖数: 94654 | 14 加一些逻辑,比如,这人是不是要删除某个功能的全部机器,如果是,拒绝
等等,
很多事情事后诸葛亮觉得很应该,但是事先的确未必能想到,或者根本没精力没
priority去考虑那些情况
毕竟那些user case使用的次数太少,不比用户前台,有千千万万用户帮你qa出来无数
种可能和bug
【在 k**l 的大作中提到】 : 以后人为输入到机器命令之间加一层 AI ?
|
n******r 发帖数: 4455 | 15 如果实测会引起当机就不好测了,有些问题的机制类似于原子弹链式反应,很难从初始
操作推测出最后的结果
【在 y****i 的大作中提到】 : 是真不能实测,还是不会实测? : 这种问题出来了就是大问题啊。
|
d********f 发帖数: 43471 | 16 瞎讲,scripting基本功就是不可能犯这种低级错误。这都弄不好直接开了就得了。这
就是我反对java这种轮子功的原因,程序员这种玩艺宜精不宜多,费材招的越多效率越
差。
【在 z*********n 的大作中提到】 : 加一些逻辑,比如,这人是不是要删除某个功能的全部机器,如果是,拒绝 : 等等, : 很多事情事后诸葛亮觉得很应该,但是事先的确未必能想到,或者根本没精力没 : priority去考虑那些情况 : 毕竟那些user case使用的次数太少,不比用户前台,有千千万万用户帮你qa出来无数 : 种可能和bug
|
z*********n 发帖数: 94654 | 17 出错可能太多,无法预测
后来操作和前台不一样
就是哥平衡问题,要么增加流程增加safeguard换来更安全,但是productivity降低几倍
要么就承担风险,只能说,next time be more careful
【在 n******r 的大作中提到】 : 如果实测会引起当机就不好测了,有些问题的机制类似于原子弹链式反应,很难从初始 : 操作推测出最后的结果
|
z*********n 发帖数: 94654 | 18 不可能完全杜绝的,总有意想不到的可能造成事故的
我举的只是比较stupid的原因,很多原因不发生不知道,发生了事后诸葛亮会觉得,太
基本了,咋没想到呢
亚麻的事故率算低的了
【在 d********f 的大作中提到】 : 瞎讲,scripting基本功就是不可能犯这种低级错误。这都弄不好直接开了就得了。这 : 就是我反对java这种轮子功的原因,程序员这种玩艺宜精不宜多,费材招的越多效率越 : 差。
|
y****i 发帖数: 12114 | 19 其实无非是出了事故对个人也没啥影响,所以就瞎jb整呗。 |
N*****m 发帖数: 42603 | 20 说明unit testing不到家
【在 z*********n 的大作中提到】 : 应该是ansible, 就是输入参数搞砸了,估计就是某个regular expression意想不到 : match了更多的server : 活着多了个空格之类的 : *billing 写成 * billing了,第一个*全部match了
|