我面臨著一項非常有趣的任務,即按照以下模式將任意 CSV 檔案轉換為 JSON 結構:
{
"Data": [
["value_1", "value_2"],
["value_3", "value_4"]
]
}
在這種情況下,輸入檔案將如下所示:
value_1,value_2
value_3,value_4
要求是使用 Azure 資料工廠,我無法將此任務委派給 Azure Functions 或其他服務。我正在考慮使用“復制資料”活動,但無法考慮配置。TabularTranslator似乎只適用于一定數量的列,但我可以接收的 CSV 可以包含任意數量的列。也許 DataFlows 可以幫助我,但他們的設定看起來也不是一件容易的事。另外,如果我理解正確,DataFlows 需要更多時間才能啟動。
所以,基本上,我只需要獲取 CSV 內容并將其放入“資料”二維陣列中。
關于如何做到這一點的任何想法?
uj5u.com熱心網友回復:
要達到這個要求,使用Copy dataorTabularTranslator是復雜的。這可以通過以下方式使用資料流來實作。
- 首先使用以下配置創建源資料集。這允許我們將整行讀取為單個列值(字串):

- 匯入投影并將列命名為
data。以下是資料預覽的樣子:

split現在,首先使用轉換中的函式拆分這些列值derived column。我正在使用替換同一列split(data,',')。

- 然后,我添加了一個
key具有常量值“x”的列,以便我可以對所有行進行分組并將分組資料轉換為陣列陣列。

- 經過上述步驟后,資料將如下所示:

- 使用
aggregate轉換按上面創建的列進行分組,并使用collect聚合函式創建陣列陣列(collect(data))。

- 使用
select轉換僅選擇上面創建的列Data。

- 最后,在接收器中,選擇您的目的地并創建接收器 JSON 資料集。在設定中選擇
output to single file并提供檔案名。

- 創建資料流管道活動并運行上述資料流。該檔案將被創建,如下所示:

轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/515555.html
