MLlib的cf演算法接受的是Rating型別的RDD:
JavaRDD<Rating>
其中Rating代表的是兩個int 和一個double
org.apache.spark.mllib.recommendation.Rating.Rating(int user, int product, double rating)
但是假如我的用戶唯一標識是uuid,那么怎么轉換成唯一對應的int型別?直接弄個映射表把1234和uuid對應起來么?
uj5u.com熱心網友回復:
額,大家都沒碰到過這個問題么?uj5u.com熱心網友回復:
為什么要用uuid作用戶的唯一標識呢? 直接用int 自增不就好了嗎uj5u.com熱心網友回復:
樓主,你的問題怎么解決的啊?只能弄個映射表把1234和uuid對應起來么uj5u.com熱心網友回復:
看一下StringIndexer的用法uj5u.com熱心網友回復:
請問當初怎么解決的哈?我也遇到這個 id是一連串數字加字符的型別uj5u.com熱心網友回復:
是的,直接弄個主鍵id int自增長表,與用戶uuid對應,注意要去重并一一對應,用sql處理原始資料,用id替換uuid存入演算法讀取訓練資料檔案中,算完結果再將id轉換回uuiduj5u.com熱心網友回復:
請問當初怎么解決的哈?我也遇到這個 id是一連串數字加字符的型別轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/45861.html
標籤:Spark
