我有一個需要過濾的字串列。我需要獲取所有包含字母或特殊字符的值。
初始列:
| ID |
|---|
| 12345 |
| 23456 |
| 3940A |
| 19045 |
| 2BB56 |
| 3(40A |
預期輸出:
| ID |
|---|
| 3940A |
| 2BB56 |
| 3(40A |
TIA
uj5u.com熱心網友回復:
只需簡單的數字正則運算式就可以解決您的問題。^\d $將捕獲所有完全數字的值。
from pyspark.sql import functions as F
df.where(F.regexp_extract('id', '^\d $', 0) == '').show()
-----
| id|
-----
|3940A|
|2BB56|
|3(401|
-----
uj5u.com熱心網友回復:
這個問題很模糊,所以這是我能給出的最佳答案:
df_filtered = df.filter(any(not c.isdigit() for c in df.id))
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/377555.html
標籤:Python 验证 火花 apache-spark-sql
下一篇:Blazor驗證組
