我們有大約 3000 個檔案,這些檔案混合了 Office、PDF、zip,看起來像一些 .DB 和一些我以前從未見過的檔案型別(.bfa、.ses)檔案,并被要求查看并確認是否所有檔案都可以在標準瀏覽器上查看。有誰知道一種聰明的方法來檢查這個 Vs 是否有資源一次打開一個檔案?
我沒有太多撰寫代碼的經驗,但過去使用過現有的 sql 和 shell 腳本。
uj5u.com熱心網友回復:
你可以做一個簡單的“魔術”測驗作為第一次通過,所以對于這里的 PDF,我們可以看到有一個可疑的流氓b4ascii.pdf
>dir /B *.pdf >pdfs.txt
>findstr /B /M "%PDF-" *.pdf>match.txt
>fc pdfs.txt match.txt
Comparing files pdfs.txt and MATCH.TXT
***** pdfs.txt
b4.pdf
b4ascii.pdf
bad2.pdf
***** MATCH.TXT
b4.pdf
bad2.pdf
*****
您可以通過使用對可疑 pdf 更加挑剔
>findstr /B /M "%%EOF" *.pdf>match.txt
這可能會清除不良下載,但檔案可能仍然有效,只是更加可疑。因此,在我典型的前 100 個 PDF 中,第一個嫌疑人現在加入了其他三個嫌疑人。在測驗中,這 3 個似乎沒問題,只是可能不完全是標準的,但兩個串列中的壞的都不會顯示,結果是一個命名錯誤的 HTML.htm 檔案。
您可以對包含所有 Office.extX 檔案的 Zip 進行類似操作,請注意,如果找不到一種型別,則匹配應該相等并不重要。
>dir /B *.zip *.docx *.xlsx >zips.txt
>findstr /B /M "PK" *.zip *.docx *.xlsx>match.txt
FINDSTR: Cannot open *.docx
FINDSTR: Cannot open *.xlsx
>fc zips.txt match.txt
Comparing files zips.txt and MATCH.TXT
FC: no differences encountered
>
一般來說,如果沒有專門的檢查實用程式來檢查 pdf 的每個部分或 zip 的每個部分,就無法知道是否存在惡意檔案。最簡單的方法是運行一個包含錯誤級別輸出的文本提取器,以表明它有問題。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/426009.html
