我正在嘗試將此網址作為 JSON 讀入 R:https ://comtrade.un.org/Data/cache/reporterAreas.json
我看到檔案頂部還有其他內容,包裝了我所追求的內容。該檔案的示例如下所示:
{
"more": false,
"results": [
{
"id": "all",
"text": "All"
},
{
"id": "4",
"text": "Afghanistan"
},
{
"id": "8",
"text": "Albania"
}
]
}
嘗試閱讀使用:
x <- GET(url)
fromJSON(rawToChar(x$content))
不起作用拋出錯誤:unexpected character '<ef>'。我假設這是看到[.
我也試過download.file(url, file),打電話fromJSON(file),但拋出了錯誤unexpected character 'r',我猜這是來自“結果”
我認為這只是 JSON 的一些標頭格式(抱歉,我對 JSON 檔案做的不多),并且可以選擇通過GET()或來處理它fromJSON(),但我在檔案中看不到任何內容。我見過的描述如何從 url 中提取 JSON 的示例都沒有這種格式。
當我稱它為class(rawToChar(x$content))achr vector時,我可以清除它以消除{"more": false,"results": [and ]},但這對于看起來像標準格式的東西來說似乎很不穩定。
如果有人可以告訴我如何正確匯入它,我會歡迎它。也歡迎一個更有用的問題標題,它更有效地描述了這個問題。
uj5u.com熱心網友回復:
該<ef>字符是轉換為 UTF-8 的位元組順序標記的第一個位元組。其他位元組是<bb><bf>.
當我使用下載檔案download.file()然后使用解碼時jsonlite::read_json(),它會發出有關 BOM 的警告,但似乎讀取檔案的其余部分沒有錯誤。你應該試試。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/487365.html
