如果我們提供了url，如何下載影像？-有解無憂

我有以下 URL，我想使用代碼下載這些影像。有數百萬個 URL，所以我想用 python 來做。

1) https://image.lexica.art/md/dbbb96f1-fce2-4970-ab62-b4b4e6859fe9
2) https://image.lexica.art/md/76318f25-5736-4cda-965d-96fe34823263
3) https://image.lexica.art/md/c11dd279-757e-43ff-8305-43e106f6c345
4) https://image.lexica.art/md/f38d92bb-99bc-4611-938f-c5d6cc70d6ea

我已經嘗試了以下代碼，但沒有奏效。

url = 'https://image.lexica.art/md/76318f25-5736-4cda-965d-96fe34823263'
folder_path = 'images_artistics'
file_name = url.split('/')[-1][:-4]

image_content = requests.get(url).content
image_file = io.BytesIO(image_content)
image = Image.open(image_file).convert('RGB')
file_path = os.path.join(folder_path, file_name)
f = open(file_path, 'wb')
image.save(f, "JPEG", quality=85)
print(f"SAVED - {url} - AT: {file_path}")

我得到的錯誤；如果我們提供了 url，如何下載影像？

uj5u.com熱心網友回復：

相當復雜......從wireshark跟蹤，我看到它正在使用HTTP2，我猜服務器也會檢查類似瀏覽器的HTTP標頭（例如“User-Agent”等）

確保使用 http2 安裝 httpxpip3 install 'httpx[http2]'

然后試試這個，

import httpx
from PIL import Image
from io import BytesIO
import httpx
import asyncio

async def main():
    url_list = [
        'https://image.lexica.art/md/dbbb96f1-fce2-4970-ab62-b4b4e6859fe9',
        #'https://image.lexica.art/md/76318f25-5736-4cda-965d-96fe34823263',
        #'https://image.lexica.art/md/c11dd279-757e-43ff-8305-43e106f6c345',
        #'https://image.lexica.art/md/f38d92bb-99bc-4611-938f-c5d6cc70d6ea',
    ]

    headers = {
        'Host': 'image.lexica.art',
        'authority': 'image.lexica.art',
        'method': 'GET',
        'scheme': 'https',
        'accept': 'text/html,application/xhtml xml,application/xml;q=0.9,image/avif,image,webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
        'accept-encoding': 'gzip, deflate, br',
        'accept-language': 'en-US,en;q=0.9',
        'cache-control': 'max-age=0',
        'sec-ch-ua': '" Not A;Brand";v="99", "Chromium";v="102", "Google Chrome";v="102"',
        'sec-ch-ua-mobile': '?0',
        'sec-ch-ua-platform': 'macOS',
        'sec-fetch-dest': 'document',
        'sec-fetch-mode': 'navigate',
        'sec-fetch-site': 'none',
        'sec-fetch-user': '?1',
        'upgrade-insecure-requests': '1',
        'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.0.0 Safari/537.36'
    }

    for url in url_list:
        filename = url.split('/')[-1]
        client = httpx.AsyncClient(http2=True)
        response = await client.get(url, headers=headers)
        image = Image.open(BytesIO(response.content)).convert('RGB')
        image.show()

if __name__ == "__main__":
    asyncio.run( main() )

祝你好運！

uj5u.com熱心網友回復：

我會用requests這個。

import requests

url_list = [
    'https://image.lexica.art/md/dbbb96f1-fce2-4970-ab62-b4b4e6859fe9',
    'https://image.lexica.art/md/76318f25-5736-4cda-965d-96fe34823263',
    'https://image.lexica.art/md/c11dd279-757e-43ff-8305-43e106f6c345',
    'https://image.lexica.art/md/f38d92bb-99bc-4611-938f-c5d6cc70d6ea',
]

for url in url_list:
    filename = url.split('/')[-1]
    response = requests.get(url)
    open(filename, 'wb').write(response.content)

轉載請註明出處，本文鏈接：https://www.uj5u.com/qukuanlian/525873.html

標籤：Python网页抓取python成像库

上一篇：從bs4獲取跨度文本

下一篇：beautifulsoup-從里面的文本中獲取標簽和它的父級？