我們在雪花資料庫中的表中連續插入、更新和洗掉,這會在一段時間內減慢雪花中的表的性能嗎?
uj5u.com熱心網友回復:
是的。有兩個原因。
因為 INSERT、UPDATE 和 DELETE 的更改改變了磁區資料的片段,因此即使 N 小時/天后存在相同數量的 ROW,行的布局也可能與您運行的查詢的關聯性不一致,因此,您的性能組態檔可以從高度修剪磁區讀取到全表讀取。
還有大量的更改,即使資料在此之后都是完全有序的,但許多更改的共享事實意味著您最終會得到太多的磁區,這會減慢 SQL 編譯的速度。
如果您同時對同一個表進行 INSERT、UPDATE 和 DELETE 操作,也會導致性能不佳,因為第二個操作會被前者阻塞。這會浪費掛鐘和信用分配(如果它們是不同的倉庫)
你可以做一些事情來避免這種情況,運行集群,在“停機時間”重建表。不洗掉資料,而是插入“洗掉表”,然后離開連接和排除匹配項。我們已經完成了以上所有作業。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/420799.html
標籤:
上一篇:為什么兩個看似相似的陣列方法會導致時間復雜度大不相同?
下一篇:為什么即使在圖形模式下,TensorFlow2中Float64tf.matmul的CPU性能也明顯慢于NumPymatmul?
