我們公司的業務屬于Redshift的重度使用者,有4個集群節點來支持10個資料庫表。其中有一張大表命名為“click_track”用來記錄用戶在移動app上的點擊操作。這個表會在每個月的第一天做一次刪減,以只保留3個月內的資料。由于業務增長迅速,現在這張表會在月中的時候資料量暴漲,達到30億資料量,并且磁盤空間達到95%的占用率。
基于以上情況,我的問題有兩個:
1. 磁盤使用率非常不平均,在其中的兩個節點上,使用率為92%,但在另外兩個節點上,使用率是45%, 請問如何能夠平衡這4個節點的磁盤使用率?
2. 我們每周都在為這張大表做Vacuum維護以釋放磁盤空間,但是隨著表的size增加,變得很慢。有時候需要12個小時來完成一個動作,并且影響再次期間的更多的寫入性能,請問如何可以優化呢?
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/82794.html
標籤:數據倉庫
上一篇:oracle 中 update table1 id=rownum 在 mysql中怎么實作
下一篇:基礎的SQL陳述句
