spark streaming 對接kafka ,然后自定義輸出,保存到hdfs,按檔案內容,一小時為一批檔案,實作檔案追加,采用gzip壓縮輸出檔案,但是運行起來后,發現executor 過幾個小時就被yarn kill掉,然后啟動新的,追蹤發線是因為壓縮導致的direct memory 記憶體泄漏,因為壓縮使用java的NIO,會使用direct memory,求解決方法!!
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/67582.html
標籤:Spark
