我看到一些 PySpark 資料框有像 [2,,3,,,4] 這樣的值串列。逗號之間的這些值為空,但它們在串列中不是“空”。有人可以建議如何生成這種串列嗎?
謝謝,J
uj5u.com熱心網友回復:
他們是empty strings。
import pyspark.sql.functions as F
......
data = [
('2,,3,,,4',)
]
df = spark.createDataFrame(data, ['col'])
df = df.withColumn('col', F.split('col', ','))
df.printSchema()
df.show(truncate=False)
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/388311.html
上一篇:.tolist()IndexError的兩種不同行為
下一篇:使用另一個類的引數呼叫方法
