我想從字串中洗掉所有標簽標簽。
這是輸入字串。
<p>
<title>Contact Us</title>
</p>
<table dropzone="copy">
<tbody>
<tr>
<td class="label" style="cursor: default;">Full Name</td>
<td style=
"cursor: default;">[<label id="{0a4a7240-9606-416a-bf7b-ef11a47cca8e}">First name</label>] [<label id="{94263497-683b-46f9-ba0f-69f4c2736598}">Last name</label>]</td>
</tr>
<tr>
<td class="label" style="cursor: d
efault;">Telephone</td>
<td style="cursor: default;">[<label id="{ce68e02e-e9fd-40ee-9375-ee1b05972e9b}">Phone</label>]</td>
</tr>
<tr>
<td class="label" style="cursor: default;">Email</td>
<td style="cursor: default;">[<label id="{411b580e-f7e9-4dd2-a70d-947385360cd0}">Email</label>]</td>
</tr>
<tr>
<td class="label" style="cursor: default;">Message</td>
<td style="cursor: default;">[
<label id="{13e2ff23-135c-4c6d-beb4-2960a533cb98}">Your Message</label>]</td>
</tr>
<tr>
<td class="label" style="cursor: default;">Company</td>
<td style="cursor: default;">[<label id="{c3f22c3a-8fc1
-48a4-8d6a-fe346024ca2b}">Company</label>]</td>
</tr>
</tbody>
</table>
<p> </p>
<p> </p>
需要洗掉標簽標簽,但不應洗掉字串中的值
<label id="{0a4a7240-9606-416a-bf7b-ef11a47cca8e}">First name</label>會變成First name
<label id="{ce68e02e-e9fd-40ee-9375-ee1b05972e9b}">Phone</label>會變成Phone
<label id="{411b580e-f7e9-4dd2-a70d-947385360cd0}">Email</label>會變成Email
<label id="{13e2ff23-135c-4c6d-beb4-2960a533cb98}">Your Message</label>會變成Your Message
<label id="{c3f22c3a-8fc1-48a4-8d6a-fe346024ca2b}">Company</label>會變成Company
我嘗試了以下正則運算式[Regex]::Match( $text, '(?s)<label(.*)">' ).Groups.Value但它不起作用。
任何建議,將不勝感激
提前致謝
uj5u.com熱心網友回復:
這個正則運算式可以作業,您可以使用-replace運算子而不是呼叫Regex.Replace:
(Get-Content path\to\file -Raw) -replace '<label id="\{[\d\w-] }">([a-z ] )<\/label>', '$1'
有關詳細資訊,請參閱https://regex101.com/r/3gbJEp/1。
uj5u.com熱心網友回復:
嘗試使用正則運算式決議 HTML通常是個壞主意。
而是使用專用的 HTML 決議器作為HtmlDocument類
例子
function ParseHtml($String) {
$Unicode = [System.Text.Encoding]::Unicode.GetBytes($String)
$Html = New-Object -Com 'HTMLFile'
if ($Html.PSObject.Methods.Name -Contains 'IHTMLDocument2_Write') {
$Html.IHTMLDocument2_Write($Unicode)
} else {
$Html.write($Unicode)
}
$Html.Close()
$Html
}
$Html = ParseHtml ' # Your Html
<p>
...
<p> </p>
'
$Html.getElementsByTagName('label') |ForEach-Object { $Null = $_.removeNode() }
$Html.body.innerHtml
<P></P>
<TABLE dropzone="copy">
<TBODY>
<TR>
<TD class=label style="CURSOR: default">Full Name</TD>
<TD style="CURSOR: default">[First name] [Last name]</TD></TR>
<TR>
<TD class=label style="CURSOR: d efault">Telephone</TD>
<TD style="CURSOR: default">[Phone]</TD></TR>
<TR>
<TD class=label style="CURSOR: default">Email</TD>
<TD style="CURSOR: default">[Email]</TD></TR>
<TR>
<TD class=label style="CURSOR: default">Message</TD>
<TD style="CURSOR: default">[ Your Message]</TD></TR>
<TR>
<TD class=label style="CURSOR: default">Company</TD>
<TD style="CURSOR: default">[Company]</TD></TR></TBODY></TABLE>
<P></P>
<P></P>
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/478636.html
