主頁 > 資料庫 > nifi processer介紹

nifi processer介紹

2020-09-13 08:57:49 資料庫

2.3 NiFi Processor應用介紹
對于NiFi的使用者來說,如果想要創建一個高效的資料流,那么就需要了解什么樣的單元處理器才最適合這個資料流,NiFi擁有大量的可以用于各種業務場景的單元處理器可供使用者挑選和使用,這些單元處理器主要提供例如系統之間資料的傳輸,資料的路由,資料的轉換、處理、分割和聚合等大類的功能,
在每個NiFi的版本發布中都會有大量的新的處理器單元產生,這就導致本書中講重點介紹1.4.0版本及之前的常用處理器單元的功能,我們講根據這些常用的處理器單元的不同用處進行分類,

2.3.1 資料轉換類處理器單元

CompressContent

CompressContent處理器單元主要用途是對NiFi資料流的FlowFile的內容進行壓縮和解壓縮,支持的壓縮種類如圖

70?

ConvertCharacterSet

ConvertCharacterSet處理器單元主要用途將NiFi資料流的FlowFile的內容從一種字符集轉換成另外一種字符集,配置例子如圖

70?

EncryptContent

EncryptContent處理器單元主要用途將NiFi資料流的FlowFile的內容進行加密/解密傳輸,
70?

ReplaceText

ReplaceText處理器單元主要用途是根據處理器屬性配置的正則運算式對FlowFile的內容進行匹配,如果匹配成功將會降匹配成功的欄位替換為配置屬性中的欄位,將FlowFile的內容全部替換為nifi的配置例子如圖

70?
?

2.3.2 資料路由類和調制處理器單元

ControlRate

ControlRate處理器單元用來控制資料流部分流量的速率,
?

上面的圖中的例子表示1分鐘內只允許最多1000個FlowFile流過,

DetectDuplicate

DetectDuplicate處理器單元用來依據用戶定義的特征來監控和發現重復的FlowFile,通常這個處理器會搭配HashContent單元處理器來完成功能,

?

上面的圖中的例子表示Processor根據輸入的FlowFile的hash.value屬性值作為去重條件對FlowFile進行匹配,將去重后的映射到non-duplicate的Relationship中,將重復的FlowFile映射到duplicate的Relationship中,

MonitorActivity

MonitorActivity處理器單元可以在用戶定義的時段內如果沒有資料流量就是發送告警通知,也可以選擇附加功能,在資料流量恢復之后發送恢復通知,
?

上面的圖中例子標示Processor每1分鐘內沒有FlowFile輸入就會不間斷的發出Inactivity Message屬性的內容,且檢測范圍是本Node節點,

RouteOnAttribute

RouteOnAttribute處理器單元可以根據FlowFile的屬性制定路由規則來對FlowFile進行路由,

?

上面的圖中例子表示Processor根據輸入的FlowFile的value屬性進行路由,將含有hello的FlowFile路由到include hello text的Relationship中,將含有world的FlowFile路由到include world text的Relationship中,

ScanAttribute

ScanAttribute處理器單元用途是將FlowFile屬性中被用戶定義的屬性與用戶自定義的字典進行對比,看是否能夠匹配,
?

上面的圖中例子表示Processor輸入的FlowFile中的屬性值只要有一個包含了Sample.txt字典中任意一行的字符,那么Processor就會將這個FlowFile路由到matched的Relationship中,

RouteOnContent

RouteOnContent處理器單元的功能近似于RouteOnAttribute,區別在于RouteOnContent處理器單元進行路由判定的內容是FlowFile的內容而不是之前RouteOnAttribute處理器單元所使用的屬性,
?

上面的圖中例子表示Processor根據輸入FlowFile的內容進行路由,如果輸入的FlowFile的內容為hello,那么它將會被路由到hello relationship的relationship中,

ScanContent

ScanContent處理器單元同樣也近似于ScanAttribute,區別在于前者用戶選取的比對物件是內容而后者定義卻是屬性,
?

上面的圖中例子表示Processor根據輸入FlowFile內容進行掃描路由,如果FlowFile的內容為hello,那么它將會被路由到matched的relationship中,

ValidateXml

ValidateXml處理器單元將FlowFile的XML內容和用戶的XML定義進行校驗,將符合XML定義的FlowFile進行路由,
?

上面的圖中表示Processor根據輸入XML的Schema檔案對輸入的FlowFile內容進行校驗匹配,如果校驗合格的FlowFile會被映射到valid的relationship中,

上面的圖中表示Processor根據輸入的FlowFile中的HiveQL往Hive中寫入或者更新資料,

2.3.3 資料接入類處理器單元

ConvertJSONToSQL

ConvertJSONToSQL處理器單元可以將結構化的Json轉換成INSERT或者UPDATE這樣命令的SQL,配合PutSQL處理器單元可以直接根據這鞋命令將資料插入資料庫中,
?

上面的圖中表示Processor根據輸入的FlowFile的JSON內容,將JSON轉化成Update的SQL陳述句,

ExecuteSQL

ExecuteSQL處理器單元直接運行運行用戶配置的SQL查詢陳述句,并將查詢結果以Avro的格式寫入到FlowFile的內容中去,
?

上面的圖中表示Processor根據用戶配置SQL select query陳述句,從資料庫中查詢出結果,并將結果FlowFile映射到success的relationship中,

PutSQL

PutSQL處理器單元可以根據傳入的FlowFile內容中的DDM SQL對資料庫進行更新操作,
?

上面的圖中表示Processor根據輸入的FlowFile的SQL內容,每100個SQL作為一個事務提交資料庫,并將生成的Key回傳且在事務提交失敗的情況下對事務進行回滾,

SelectHiveQL

SelectHiveQL處理器單元執行Hive的查詢陳述句HiveQL,并且將結果以Avro或者CSV的格式寫入到FlowFile中,
?

上面的圖中表示Processor根據HiveQL陳述句查詢Hive,并將結果以CSV格式輸出,CSV擁有Header為username和age,

PutHiveQL

PutHiveQL處理器根據傳入的HiveQL DDM陳述句對Hive資料倉庫的內容進行更新,
?

上面的圖中表示Processor根據輸入的FlowFile中的HiveQL往Hive中寫入或者更新資料,

2.3.4 屬性提取類處理器單元

EvaluateJsonPath

EvaluateJsonPath處理器單元根據用戶定義的JSONpath運算式對FlowFile的JSON內容進行決議,將這些運算式所決議出來的內容替換FlowFile的內容或者將其更新到FlowFile的屬性中,以便于后續的單元處理器的參考,
?

上面的圖中表示Processor將輸入內容為JSON格式的FlowFile例如{“name”:”zhangsan”,”phone”:”13734564321”},將其中的phone決議出來后輸出到FlowFile的內容中,

EvaluateXPath

EvaluateXPath處理器單元功能近似于EvaluateJsonPath,根據用戶提供的XPath運算式,將FlowFile的XML內容用運算式進行決議,將決議的結果替換如FlowFile的正文或者更新FlowFile的屬性,
?

上面的圖中表示Processor對輸入內容為XML格式的FlowFile利用配置XPath運算式進行決議,并將結果輸出到FlowFile的內容中,

EvaluateXQuery

EvaluateXQuery處理器單元根據用戶定義的XQuery,將FlowFile的XML正文與運算式進行進行虬枝,將提取的結果替換FlowFile的正文或者更新FlowFile的屬性,
?

上面的圖中表示Processor對輸入內容為XML格式的FlowFile利用配置的XQuery運算式進行決議,并將結果以XML格式輸入到FlowFile的內容中,

HashAttribute

HashAttribute處理器單元對用戶選擇的已有屬性串列的值拼接后的字串進行Hash計算,
?

上面的圖中表示Processor對輸入的FlowFile中value屬性值進行hash計算,并將結果輸出到FlowFile的value屬性中,

HashContent

HashContent處理器單元對FlowFile的內容進行Hash,并將Hash值添加到FlowFile的屬性中,
?

上面的圖中表示Processor對輸入的FlowFile中的內容進行hash計算,并將結果輸出到FlowFile的hash.value屬性中,

IdentifyMimeType

IdentifyMimeType處理器單元對FlowFile的內容格式進行判定,此處理器能夠檢測許多不同的MIME型別,例如它能夠判定出FlowFile的內容是圖片,文本和壓縮檔案等格式,

UpdateAttribute

UpdateAttribute處理器單元可以對FlowFile添加任意的用戶定義的屬性,這將有利于對FlowFile添加靜態的屬性,也可以根據NiFi運算式語言來動態的添加屬性,
?

上面的圖中表示Processor對輸入的FlowFile中屬性進行修改,添加一個鍵值為value值為helloworld的屬性,

2.3.5 系統互動類處理器單元

ExecuteProcess

ExecuteProcess處理器單元能夠運行用戶定義的作業系統命令,將處理完的標準輸出內容寫入flowfile中,該處理器是一個不需要輸入的源處理器,它會輸出產生一個新的FlowFile,如果需要提供輸入源請使用下面介紹的executestreamcommand處理器單元,

?

上面的圖中表示Processor根據輸入的指令和引數執行命令ls –l /user,并將結果輸出到FlowFile中,

ExecuteStreamCommand

ExecuteStreamCommand處理器單元運行用戶定義的作業系統命令,輸入的FlowFile的內容作為命令的標準輸入,將處理完的標準輸出內容寫入FlowFile內容中,此處理器單元不同于ExecuteProcess,它必須有FlowFile的輸入才能正常完成功能,
?

上面的圖中表示Processor根據輸入的FlowFile中的path屬性值為/usr/cmd.sh命令腳本的運行引數來運行命令,并將結果輸出到FlowFile中,

2.3.6 資料提取類處理器單元

GetFile

GetFile處理器單元從本地磁盤獲取檔案的內容到NiFi,并洗掉原有的磁盤檔案,這個處理器應用場景是將一個檔案從一個地方搬移到另外一個地方而不是對檔案的拷貝,
?

上面的圖中表示Processor將/user/sample.txt檔案的內容輸出到FlowFile的內容中,

GetFTP

GetFTP處理器單元從FTP服務器檔案內容輸出到FlowFile中,并可以選擇洗掉原有檔案,同樣它的使用場景是檔案的搬移而不是檔案的拷貝,
?

上面的圖中表示Processor將ftpServer01上/resource路徑下的檔案內容輸出到FlowFile中,并將源檔案洗掉,

GetSFTP

GetSFTP處理器單元從SFTP檔案內容輸出到FlowFile中,并可以選擇洗掉原有檔案,同樣它的使用場景是檔案的搬移而不是檔案的拷貝,
?

上面的圖中表示Processor將sftpServer01上/resource路徑下的檔案內容輸出到FlowFile中,并將源檔案洗掉,

GetJMSQueue

GetJMSQueue處理器單元從JMS佇列中下載訊息,并通過JMS Message來創建FlowFile的內容,同時也可以指定創建FlowFile的屬性,

?

GetJMSTopic

GetJMSTopic處理器單元從JMS的Topic中下載訊息,并根據JMS訊息創建FlowFile的內容,通過選擇也能生成FlowFile的屬性,這個處理器單元支持長期和非長期的訂閱模式,

GetHTTP

GetHTTP處理器單元能夠根據URL通過HTTP或者HTTPS協議下載內容到NiFi,從而形成的新的FlowFile內容,同時處理器單元在下載的同時也記憶ETag和最新修改時間來防止資料的重復下載問題,

?

上面的圖中表示Processor根據配置的URL進行http訪問,將訪問結果發送到FlowFile的內容中并且filename屬性值為配置的Filename的值,

ListenHTTP

ListenHTTP處理器單元啟動一個HTTP或者HTTPS監聽埠,當監聽到有POST請求過來的時候,會首先回傳200狀態,并利用POST的請求內容形成新的FlowFile,

?

上面的圖中表示Processor監聽8811埠的HTTP POST請求,當有POST請求訪問http://localhost:8811/contentListener的時候,Processor就會首先回傳200狀態,讓后將POST請求的引數輸出到新的FlowFile的內容中,

ListenUDP

ListenUDP處理器單元監聽UDP資料包,并根據配置獲取一定量的包來創建一個FlowFile并將FlowFile發射到success的Relationships關系中,
?

GetHDFS

GetHDFS處理器單元監控用戶定義的HDFS指定路徑的檔案變化,當有新的檔案寫入HDFS中的該路徑下,那么檔案的內容被用來創建新的FlowFile的內容,同時洗掉原有的檔案,這個處理器同前面一樣適用于檔案的搬移場景而非檔案的復制場景,

?

上面的圖中表示Processor將HDFS上/target路徑下的檔案內容輸出到FlowFile中,并將源檔案洗掉,

2.3.7資料發送類處理器單元

PutEmail

PutEmail處理器單元主要功能是將FlowFile的內容以郵件的形式發送給配置的用戶郵箱,也可以通過配置選擇將FlowFile的內容以附件的方式發送出去,
?

PutFile

PutFile處理器主要功能是將FlowFile的內容以檔案的形式寫入本地磁盤,

?

上面的圖中表示Processor將接收到的FlowFile的內容寫入到本地的磁盤檔案中,(注意:1.5.0之前此Processor不支持追加寫入)

PutFTP

PutFTP處理器單元將FlowFile的內容拷貝到遠程的FTP服務器上,

?

上面的圖中表示Processor將輸入的FlowFile的內容通過FTP協議寫入到ftpServer01的/upload路徑下且上傳路徑不存在的情況下自動創建路徑,

PutSFTP

PutSFTP處理器單元主要功能將FlowFile的內容拷貝到遠程的SFTP服務器上,
?

上面的圖中表示Processor將輸入的FlowFile的內容通過SFTP協議寫入到sftpServer01的/upload路徑下且上傳路徑不存在的情況下自動創建路徑,

PutJMS

PutJMS處理器單元主要功能將FlowFile的內容座位JMS訊息發送到JMS代理上,也可以通過配置根據FlowFile的屬性來添加JMS配置屬性,
?

PutSQL

PutSQL處理器單元的主要功能是將FlowFile的正文當作SQL DDL宣告,FlowFile必須是正確的符合SQL規范的SQL宣告,FlowFile的屬性被用作DDL SQL的引數,這樣可以有效的防止SQL注入攻擊,

?

上面的圖中表示Processor將輸入的FlowFile的內容按照100個進行batch操作寫入資料庫,

PutKafka

PutKafka處理器單元專門是針對0.8.x版本的Kafka,它將FlowFile的內容以訊息的形式發送到Kafka訊息佇列中,FlowFile的內容既可以作為一條完整的訊息發送到Kafka,同時也可以通過分隔符將它切分為多個訊息來發送到Kafka,例如換行符,

?

上面的圖中表示Processor從localhost安裝的Kafka的Sample_topic_A消費資料,并將資料輸出到FlowFile的內容中,

PutMongo

PutMongo處理器單元將FlowFile的內容插入或者更新到MongoDB中,

?

上面的圖中表示Processor根據輸入的FlowFile內容中的doc來寫入MongoDB,

2.3.8切分和聚合類處理器單元

SplitText

SplitText處理器單元可以將一個文本內容的FlowFile切分成你想要數量的FlowFile,
?

上面的圖中表示Processor將輸入的FlowFile的內容切分成多個FlowFile,每個FlowFile的內容都來自于FlowFile中的一行內容,

SplitJson

SplitJson處理器單元可以將一個JSON物件根據它的結構拆解成JSON內部的字物件,
?

上面的圖中表示Processor將輸入的FlowFile內容中的Json按照JsonPath運算式$.*進行第一級切分生成新的FlowFile,

SplitXml

SplitXml處理器單元可以將XML訊息分解為多個FlowFile,且新的FlowFile中包含原有的分段資訊,這種處理器單元經常適用于多個XML元素被封裝在一個元素中,而此處理器單元允許這些元素分離成各自單獨的XML元素,

?

上面的圖中表示Processor對于輸入的FlowFile內容中的XML按照第一層級進行切分,切分出來的子XML輸出到FlowFile中,

UnpackContent

UnpackContent處理器單元可以對壓縮格式的檔案如ZIP和TAR進行解壓,且解壓后的檔案作為一個FlowFile的內容輸出,
?

上圖中UnpackContent和IdentifyMimeType一起使用,后者輸出的FlowFile由前者來進行處理,UnpackContent根據輸入的FlowFile的mime.type屬性對FlowFile的內容進行解壓,

MergeContent

MergeContent處理器單元的主要功能是將多個FlowFile的內容合并成一個FlowFile,這些FlowFile的內容合并的同時,也可以通過配置對合并后的內容增加標題,頁腳和分隔符,也可以對合并后的內容置頂歸檔格式,比如ZIP和TAR,在FlowFile合并的程序中可以依據相同的屬性進行合并,也可以根據之前分片處理器分片后的序號來進行合并,用戶可以定義合并后FlowFile內容的最大值和最小值,當達到這個值的時候FlowFile就合并完畢,為了防止在FlowFile沒有達到配置的大小值的程序中時間太久,用戶也可以通過配置超時引數來有效的解決這個問題,
?

上圖中表示Processor將輸入的FlowFile的內容按照從Queue中任意消費的FlowFile的內容進行Merge輸出到新的FlowFile中,FlowFile的內容格式為TAR,選擇各個輸入FlowFile中一致的屬性寫入到新輸出的FlowFile中,對于不同的Metadata不進行Merge,輸出的新的FlowFile內容中同事也增加了頁頭和頁腳,

SegmentContent

SegmentContent處理器單元可以根據配置切分后的FlowFile大小將一個大的FlowFile切分成許多小的FlowFile,分片是基于位元組的偏移量而不是分隔符,這種將大的FlowFile以分片的形式進行傳輸可以有效的減少大檔案傳輸程序中的延時問題,當這些分片傳輸到達目標端的時候,可以通過其它的處理器單元重新進行組裝,例如上面所說的MergeContent處理器單元,
?

上面的途中表示Processor把輸入的FlowFile的內容按照1MB的大小進行切分,切分成新的FlowFile且新的FlowFile中寫入了分片的序號segment.index和數量segment.count屬性,

SplitContent

SplitContent處理器單元的功能近似于SegmentContent將一個FlowFile分解成多個FlowFile,但區別在于SplitContent在進行分解的程序中不是按照設定的位元組大小,而是根據分隔符進行分裂,
?

上面的圖中表示Processor對輸入的FlowFile的內容按照豎線 | 符號進行切分,切分成多個FlowFile,

2.3.9 HTTP協議類處理器單元

GetHTTP

GetHTTP處理器單元對配置的http或者https協議的URL發起請求并將回傳結果輸出到新的FlowFile中,而且GetHTTP會記錄Etag和最新資料修改時間避免不停的訪問給服務端產生不必要的開銷,如下圖

?

ListenHTTP

ListenHTTP處理器單元監聽Http或者Https請求,如果有請求先回傳200然后將POST的請求引數輸出到新的FlowFile中,

?

上面的圖中表示Processor監聽locahost的http請求,請求URL為http://localhost:9080/contentListener

InvokeHTTP

InvokeHTTP處理器單元能夠根據用戶的配置發送HTTP協議請求,InvokeHTTP處理器單元通過更多的配置可以完成比GetHTTP和PostHTTP更多的功能,如下圖
?

PostHTTP

PostHTTP處理器單元將FlowFile的內容作為HTTP POST請求的body訊息,它通常與ListenHTTP處理器單元組合使用,應用于當多個NiFi實體之間不能通過Site-to-Site的方式進行資料交換的場景,如下圖

?

HandleHttpRequest / HandleHttpResponse

HandleHttpRequest處理器單元可以作為一個源處理器單元來啟動一個HTTP監聽服務功能,類似于ListenHTTP,但是這個處理器不回應客戶端,它將請求的引數以FlowFile的內容和屬性的方式,響資料流的下游進行傳遞,HandleHttpResponse處理器單元能夠回應并將處理后的FlowFile結果回傳請求的客戶端,這兩個處理器通常都是在一起被使用的,

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/22826.html

標籤:大數據

上一篇:Elasticsearch 之聚合分析入門

下一篇:Kylin 新定位:分析型資料倉庫

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more