1.2021年6月,位元組的一位實習生誤刪了公司機器學習平臺 Lagrange Lite 全量 Batch 模型的備份,原因是扁平化管理,實習生與正式員工有同樣的檔案權限,有人表示刪的都是離線資料,影響不大,還有人表示重新訓練模型和延遲上線,理論上都會對指標有負向,只是不那么明顯了,
2.亞馬遜扁平化管理,SDE啥活兒都要干,權限一視同仁,AWS的一個新人在上班第一天做熟悉開發環境自助培訓時,他本來想連測驗環境,結果連不上,老員工給了他一個配置,他沒分清哪個是測驗的,哪個是生產的,不小心連上了生產環境資料庫,于是把整個資料庫給 Rebuild 了,導致全美 Netflix 停服數小時!
3.2014年某領導安排妹子在生產服務器上本意卸載重新安裝 Oracle,但腳本中有一句話:rm -rf $ORACLE_BASE/*
不幸變數 ORACLE_BASE 未賦值!
于是乎 Tomcat/MySQL...全刪了!
由于沒有及時發現,造成部分資料寫入磁盤,加大了不可恢復的幾率!
更悲劇的是,找到脫機備份,發現備份檔案只有1KB,里面只有幾行熟悉的 mysqldump 注釋,可用的、最接近的備份時間是2013年年底!
欲知后事如何,請看:https://www.cnblogs.com/zhouyu629/p/3734494.html
4.2021年3月,一位實習生為了炫耀自己的新作業,拍攝并分享了德國柏林海德丁監獄內鑰匙的照片,當地司法部門得知這起泄密事件后,監獄隨即連夜換鎖,舊鑰匙也被立即銷毀,
柏林司法部發言人對媒體說:“所有牢房和通道的門鎖都被更換了,該實習生也被禁止進入監獄,他的實習也就此終止,”他還補充稱,更換600把鎖的費用可能會由這名見習生負擔,預估5萬歐元,
5.某云計算廠商,一位試用期員工,在業務巡檢系統上,原本應輸入“last reboot”命令,結果看檔案的時候這條命令自動折行了,他只看到了后一句“reboot”,于是這句“reboot”就被自動化工具給廣播出去了,生產環境里所有節點重啟!//感謝網友向昀哥提供這條訊息
6.某年某電商平臺雙十一之前,代碼原本應該用“disconnect”命令來斷開與 Redis 之間的連接,沒想到新人代碼中寫的卻是“shutdown”命令!于是乎……
昀哥寫作于2021年6月24日
關鍵詞:責任事故,安全,運維,實習生,新人
-全文完,如果覺得有識訓,記得點推薦或“收藏”-
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/288457.html
標籤:其他
