學生成績存盤在 hdfs://Hmaster/training/dump/stdmarks1.txt
輸入格式:sno, name, m1, m2, m3, branch 創建rdd并顯示學生所屬分支的學生姓名:cse 使用println顯示學生姓名。輸出格式:xxxx yyyy
我有一個示例文本檔案
1、拉梅什、70、52、60、CSE
2、SOMESH、80、69、88、ECE
3、VANITA、90、73、92、CSE
4、基蘭、74、96、68、IT
輸出應該只是學生的名字:
拉梅什
瓦尼塔
已經按照給定的方式上傳了 hdfs 中的文本檔案,但無法執行進一步的步驟
uj5u.com熱心網友回復:
這是一個例子:
spark
.read
.option("header", "true")
.csv(hdfsFilePath)
.where(col("m3") === "CSE")
.select("name")
.distinct()
.show()
我建議您閱讀檔案。
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/483634.html
