我有一個 250mb 的大 xml 檔案,其中一個標簽包含我需要處理的另一個 xml。
但問題是,這個 xml 被包裝了CDATA,如果我嘗試做一個replace/replaceAll
String xml= fileContent.replace("<![CDATA[", " ");
String replace = xml.replace("]]>", " ");
我開始了
java.lang.OutOfMemoryError: Java heap space
一個簡單的結構示例。
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<a>
<b>
<c>
<![CDATA[<?xml version="1.0" encoding="UTF-8" standalone="yes"?><bigXML>]]>
</c>
</b>
</a>
即使使用像VDT或SAX這樣的XML 決議器也無濟于事,因為我仍然需要洗掉<