我想從此 YouTube 頁面(鏈接)中提取字幕。通過“查看頁面源”查看時,
我發現了timedtext 。
但不是當我通過 javascript 控制臺搜索時。它不會找到它:
document.querySelector("html").innerHTML.match("timedtext")
但對于這個其他 YouTube 頁面,它確實可以同時作業。
差異如何以及如何解決?
uj5u.com熱心網友回復:
正如我評論的那樣,如果您想使用這種方式提取字幕,請考慮搜索具有ytInitialData變數 = 的腳本標記,即具有 timedtext 的 url 的那個。
我無法區分,但是,我假設一旦頁面加載,javascript 代碼就會注入 HTML 代碼。
粘貼您在評論中分享的行后:
ytInitialPlayerResponse.captions.playerCaptionsTracklistRenderer.captionTracks
我得到了可用語言的定時文本。但請記住,可能并非所有視頻都有自動生成的字幕 -示例
在那個例子中,我沒有得到字幕,所以,我認為檢查頁面的源代碼并不適用于所有視頻。
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/483238.html
