我正在嘗試用 N/A 替換空值。我曾嘗試使用以下代碼,但沒有一個有效:
df.withColumn("series_name", when($"series_name") === null,"n/a")
.otherwise($series_name)
和
df.withColumn("series_name", when(col("series_name") === null,"n/a")
我錯過了什么?
--------------------
| series_name|
--------------------
|Families of the M...|
| null|
| Ridiculousness|
| null|
| null|
--------------------
uj5u.com熱心網友回復:
您還可以使用 .fillna() 方法:
df.fillna('N/A', subset=['series_name'])
uj5u.com熱心網友回復:
我更喜歡使用coalesce.
from pyspark.sql import functions as f
df.withColumn('series_name', f.expr("coalesce(series_name, 'n/a')"))
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/370958.html
標籤:数据框 阿帕奇火花 火花 apache-spark-sql
上一篇:熊貓資料框中的for回圈
