我試圖使用rvest以從 R 中的 ASP.NET HTML 元素中提取一些值。
使用 selectorgadget 我試圖識別我需要的元素,但我不確定我是否正確執行:
main =read_html(html_detallepersona)
Name = a %>% html_elements("fieldset fieldset > ul~ ul ul li:nth-child(1)")
paste(Name)
[1] "<li>\r\n <span id=\"ctl00_cphMain_lblPrimerNombre\" class=\"label\">Primer Nombre(*)</span>\r\n <input name=\"ctl00$cphMain$txtPrimerNombre\" type=\"text\" value=\"Veronica\" maxlength=\"30\" id=\"ctl00_cphMain_txtPrimerNombre\" disabled class=\"aspNetDisabled comboBox\" style=\"text-transform: capitalize;\">\n</li>"
Name %>% html_attr("value")
[1] NA
我需要價值本身(維羅妮卡)
源 HTML 看起來像這樣,所以我不知道 rvest 方法是否適合我的情況。我依賴于input name為了獲得它旁邊的所需值。


編輯 1:下拉選單怎么樣?我正在尋找“貢獻”值

Regimen = detallepersona %>% html_elements("#ctl00_cphMain_upAseguradora ul:nth-child(1) li:nth-child(1) option") #%>% html_text()
paste(Regimen)
[1] "<option value=\"0\">-Seleccione-</option>\n" "<option selected value=\"58\">Contributivo</option>\n"
[3] "<option value=\"61\">Especial</option>\n" "<option value=\"60\">Pobre no afiliado</option>\n"
[5] "<option value=\"59\">Subsidiado</option>"
Regimen %>% html_text()
[1] "-Seleccione-" "Contributivo" "Especial" "Pobre no afiliado" "Subsidiado"
uj5u.com熱心網友回復:
現在你正在選擇<li>元素,如果你想要value=屬性,那么你可以用html_attr()函式選擇它。
Name %>% html_attr("value")
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/340036.html
