前言

本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理，

今天來教大家一個自動化爬蟲的工具 selenium

selenium

Selenium 是一個 Web 的自動化測驗工具，最初是為網站自動化測驗而開發的，就像玩游戲用的按鍵精靈，可以按指定的命令自動操作，

Selenium 測驗工具直接操控瀏覽器中，就像真正的用戶在操作一樣，Selenium 可以根據的指令，讓瀏覽器自動加載頁面，獲取需要的資料，甚至頁面截屏，或者判斷網站上某些動作是否發生等，

專案目標

今天的目標是爬取付費歌曲

受害者地址

http://tool.liumingye.cn/music/?page=homePage

先給大家看下效果

爬蟲代碼

匯入工具

import time
import requests
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

決議網頁

打開F12 開發者工具，不管三七二十一，先來一頓瞎分析~

哦豁~ 這里面居然有資料介面，還是post請求，那這樣的話就咱們就看它的data引數，那里有變化

driver = webdriver.Chrome(executable_path='chromedriver.exe', options=chrome_options)
# key_world = input('請輸入歌手名字：')
driver.get('http://tool.liumingye.cn/music/?page=searchPage')
driver.find_element_by_css_selector('#input').send_keys('張杰')
driver.find_element_by_css_selector('#search  button:nth-child(2) i').click()
def download(name, url):
    filename = 'C:\\Users\\Administrator\\Desktop\\音樂\\' + name + '.mp3'
    response = requests.get(url=url)
    with open(filename, mode='wb') as f:
        f.write(response.content)

def drop_down():
    """模擬人去滾動滑鼠向下瀏覽頁面"""
    for x in range(1, 20, 10):
        time.sleep(0.5)
        j = x / 10
        js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % j
        driver.execute_script(js)


lis = driver.find_elements_by_css_selector('#player li')
f = 0
for li in lis:
    f += 1
    name = li.find_element_by_css_selector('.aplayer-list-title').text
    li.find_element_by_css_selector('.aplayer-list-download').click()
    down_url = driver.find_element_by_css_selector('#m-download > div > div > div.modal-body > div:nth-child(6) > div.input-group-append > a.btn.btn-outline-secondary.download').get_attribute('href')
    driver.find_element_by_css_selector('#m-download > div > div > div.modal-header > button').click()
    # time.sleep(1)
    download(name, down_url)
    print(name, down_url)
    if f % 10 == 0:
        drop_down()

運行代碼后，效果如下

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/169646.html

標籤：其他

上一篇：spring框架bean注入

下一篇：python教程：內置函式和語法糖觸發魔法方法

如何讓程式像人一樣的去批量下載歌曲？Python爬取付費歌曲

前言

selenium

專案目標

爬蟲代碼