嗨——我已經開始學習使用 R 進行網頁抓取。我的第一個專案是從 indigo 收集所有烹飪書籍的串列并進行一些分析。
但目前,我只能從頁面中選擇第一本書。我使用“rvest”包和谷歌瀏覽器選擇器小工具。我看過 YouTube 視頻和鏈接,但似乎沒有人有這個問題,很高興得到關于從頁面和所有可用頁面中列出所有書籍的任何想法。
代碼:
library(rvest) library(tidyverse)
indigo_page = read_html("https://www.chapters.indigo.ca/en-ca/books/top-tens/cookbooks/")
indigo_page%>% html_node(".product-list__product-title")%>% html_text()
輸出:
[1] "The Comfortable Kitchen: 105 Laid-back, Healthy, And Wholesome Recipes"
uj5u.com熱心網友回復:
Donjazz,我想第一個建議是使用 html_nodes(),而不是 html_node()。這個微小的變化似乎為你輸出了所有的標題。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/409294.html
標籤:
