場景描述:
1、歷史資料記錄按天進行分表
2、每個表中用關鍵欄位組合進行磁區(hash磁區) 每張表目前設定10個磁區 每個磁區的資料大概為1000萬條左右
需求:
1、從表中統計出當天有哪些主鍵(非唯一索引)有記錄,獲取主鍵后去重
2、根據去重后的主鍵 從當天表中 獲取 該主鍵下 某數字欄位 最大值、最小值
其他要求:
1、有性能要求,盡可能高效
uj5u.com熱心網友回復:
1、從表中統計出當天有哪些主鍵(非唯一索引)有記錄,獲取主鍵后去重主鍵,怎么會非唯一索引呢?
uj5u.com熱心網友回復:
說錯了 只是幾個關鍵字組成的一個標準索引 這個索引值作為最終統一結構的key值
uj5u.com熱心網友回復:
樓主你這是啥意思 問問題還是想外包啊。。。。你想怎么做,標題寫個oracle大資料?
用oracle來算 還是用大資料來算
uj5u.com熱心網友回復:
要做洗掉重復的操作,還是查詢重復的操作uj5u.com熱心網友回復:
樓主直接用group by 和集合函式是性能不行么??uj5u.com熱心網友回復:
問題貌似沒描述清楚!
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/97844.html
標籤:開發
上一篇:高水位疑惑
