我正在嘗試從 HTM 檔案中獲取 URL 串列“https://www.crocodiletrading.co.uk/”,我還需要獲取主 URL 之后的任何內容,例如 /blog/name-of-blog等等。
我正在使用 Notepad 和 Regex 來嘗試完成此操作,但我正在努力。我不太了解正則運算式。
我試過這樣的事情: .*?(https\:\/\/www\.[a-zA-Z0-9\.\/\-] )
誰能讓我知道我如何做到這一點?
我得到了一個被標記為損壞的 URL 串列,這樣我就可以使用它來設定 301 重定向。
如果有人想看一看,這里是HTML 檔案。
提前致謝。
uj5u.com熱心網友回復:
這是我最終做的事情,使用舊的 jQuery 來獲取包含 crocodiletrading.co.uk 的 URL
jQuery( document ).ready( function() {
var arr = [];
i = 0;
jQuery('a[href*="crocodiletrading.co.uk"]').each(function() {
arr[i ] = jQuery(this).attr('href');
});
var list = '<ul ><li role="menuitem"><a tabindex="-1">' arr.join('</a></li><li>') '</li></ul>';
console.log(list);
});
uj5u.com熱心網友回復:
此函式列印所有錨標簽內的所有鏈接(<a href="link to some page"> </a>)
const getAllLinks = () => {
const links = document.querySelectorAll("a");
links.forEach(link => {
console.log(link.href);
})
}
uj5u.com熱心網友回復:
試試這個代碼它可能會有所幫助,
找: ^[\s\S] ?(https://www.crocodiletrading.co.uk/).*\n*(blog.*\d ).*
全部替換: $1$2
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/318233.html
標籤:javascript 网址 超链接
