我想在谷歌表格上從這個網站上洗掉資料。我有一個錯誤,使用以下語法說匯入的內容為空:
=IMPORTXML("https://lokia.zohorecruit.com/jobs/Careers";"//*[@id='website_block_jobs']/career-website-job-layout3/div/div[3]/div/div[3]/div[2]/div[1]/h3/a")
我只想廢棄函式的標題(在一列中)和另一列中的日期。
我的合成器有什么不正確的地方?你能幫我嗎
uj5u.com熱心網友回復:
在這種情況下,沒有正確的語法。谷歌表格的任何 IMPORT 公式都不支持 JavaScript 元素。如果您為給定站點禁用 JS,您可以隨時回查它,看看是否有任何需要報廢的東西

uj5u.com熱心網友回復:
可以使用 Google Apps Script 獲取職業資料。資料存盤在隱藏欄位中,可以使用正則運算式進行選擇。這種方法存在缺陷,使用可能在 Cheerio 或 JSDOM 中找到的標準決議器可能更可取。話雖如此,代碼如下:
const ENTITY_CODES = {
" ": " ",
"!":"!",
""":"\"",
"#":"#",
"$":"$",
"%":"%",
"&":"&",
"'":"'",
"(":"(",
")":")",
"*":"*",
"+":" ",
",":":",
"-":"-",
".":".",
"/":"/",
":":":",
";":";",
"<":"<",
"=":"=",
">":">",
"?":"?",
"@":"@",
"[":"[",
"\":"\\",
"]":"]",
"^":"^",
"_":"_",
"`":"`",
"{":"{",
"|":"|",
"}":"}",
"~":"~",
""":'"',
"&":"&",
"<":"<",
">":">"
};
async function getData() {
const data = await (await UrlFetchApp.fetch('https://lokia.zohorecruit.com/jobs/Careers')).getContentText();
const careersMatches = data.match(/value="([^"]*)" id="jobs"/mi);
let careersData;
if (careersMatches && careersMatches[1]) {
careersData = careersMatches[1];
for (let [entityCode, entityValue] of Object.entries(ENTITY_CODES)) {
const regex = new RegExp(entityCode, 'gim');
careersData = careersData.replace(regex, entityValue);
};
}
careersData = JSON.parse(careersData);
return careersData;
}
async function onOpen() {
const careersData = await getData();
}
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/416289.html
標籤:
