隨著我國國力的增強,國家經濟、人口、資源、環境等各方面的普查也越來越多,但由于普查員都是各基層人員,而一般普查時間短,即使有培訓也是層層培訓,導致基層普查員接收到的普查要求和最終普查資料匯總分析人員的要求不一致。而且不同地區不同普查人員填寫的普查表也千差萬別。這就需要進行對普查資料進行分析、篩選和清洗。如何用計算機快速幫普查人員進行快速篩選出離群值呢?大家都談談如何應對。
uj5u.com熱心網友回復:
雖然我不是搞普查的,但這種情況太常見了:資料收集不規范,這個無法完全避免。通常的情況如下:1)雖然格式不規范但是相對來說還是比較準確的,大資料中的處理非結構性資料輕松搞定。
2)資料不準確。看不準確性能否被容忍,或者需要一級排查。比如你可以設計一個Scan to Data 的軟體幫你排查,連人臉都能識別,這個小Case了。
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/72081.html
標籤:數據倉庫
上一篇:各位大神,我是一名實習生,剛進入社會,遇到一個專案無從下手,求幫助啊、、、
下一篇:請教一下大資料平臺的建模方式
