我正在嘗試將 Word 檔案和 PDF 的內容發送到 Apache OpenNLP。我想知道是否可以使用 ActiveMQ 讀取 MS 字,以便我可以觸發 Apache Kafka 的行程來處理流。
歡迎任何關于流式傳輸 PDF 或 ActiveMQ 以外的單詞的建議。
uj5u.com熱心網友回復:
如果您使用 ActiveMQ“經典”(即任何 5.x 版本),您將在移動大訊息時遇到問題,因為該用例沒有真正的支持。但是,ActiveMQ Artemis(即 ActiveMQ 的下一代代理)支持任意大的訊息,這將有助于您的用例。在代理中支持大訊息的好處是您不必在您的解決方案中涉及某種其他型別的存盤機制。這使您的應用程式和環境的開發和維護變得更加簡單。
uj5u.com熱心網友回復:
訊息佇列通常不應用于檔案傳輸。將檔案放在像 S3 這樣的 blob 存盤中,然后在客戶端之間發送 URI(例如"s3://bucket/file.txt"),并在其他地方下載和處理......其他選擇是在生產者客戶端中使用 Apache POI 或類似工具來決議您的檔案,然后發送該資料以您想要的任何格式(JSON、Avro 或 Protobuf,在流媒體工具中通常比 XML 更常用)
實際檔案處理與使用的佇列技術無關
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/311217.html
上一篇:阻止訪問偽造PDF頁面的流量
