我有一個錯誤,在我在 Databricks 中運行我的腳本后出現
TypeError: _() 接受 2 個位置引數,但給出了 4 個
sessionevents = eventsDF.filter(eventsDF.eventcategory.contains("size guide","native size guide","product interactions")).groupby('eventcategory','uniquesessionid').count()
我不確定在這種情況下是否應該定義自我,如果是,那么如何定義。任何人都可以幫助我嗎?
uj5u.com熱心網友回復:
該Column方法contains只能取一個值,但您傳遞的是 3。該函式定義為:
def contains(self, item: Any) -> 列
錯誤訊息顯示“2 個位置引數”,因為它計算self的是 Column 本身。
如果我正確理解了您要實作的目標,則可以改用rlike函式:
sessionevents = eventsDF.filter(
eventsDF.eventcategory.rlike("size guide|native size guide|product interactions")
).groupby('eventcategory', 'uniquesessionid').count().show()
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/421886.html
標籤:
上一篇:將列中的不同值拆分為多列
