主頁 > 移動端開發 > flink初識及集群搭建和簡單驗證

flink初識及集群搭建和簡單驗證

2020-10-14 14:20:49 移動端開發

批計算和流計算

在軟體系統中,尤其是企業級軟體,基本離不開資料統計和分析等資料計算,最初,多數常見的統計分析都是基于資料庫的資料進行處理,例如某一段時間的活躍用戶數統計,這種計算方式稱作離線計算,也稱作批量計算(個人理解),

而現實世界中的資料產生方式有很多都是持續不斷的,也就是說實際很多場景的資料是就是資料流,這些資料隨著時間的流逝,價值會不斷的降低,因此就需要盡可能實時的進行處理,

而批計算是一批資料一起處理,尤其是最初資料先入資料庫,再拿出來處理,這種方式在資料量日漸爆發的場景下,對于實時分析的業務就會有很多瓶頸,于是漸漸的出現了流計算,

相對于傳統的批計算而言,流計算更加的實時,基本是在資料產生并接收到的同時就進行處理,更加符合當前很多要求實時計算的場景,

flink發展

流計算,或者說實時計算,最初代表性的技術是storm,除此之外還有spark,目前對這兩個技識訓沒有深入了解,據說storm是真正的實時計算,而spark所謂的實時計算,實際只是縮小了批計算的范圍,嚴格來說依然還是批計算,

因此實際上spark的實時計算沒有storm快,但是spark支持實時計算的同時還支持批計算以及機器學習,并且也有它豐富的生態圈,因此spark應用場景也很廣,

spark是2013年貢獻給apache基金會,在2014年左右正式流行起來,而flink實際上也是差不多的時間貢獻給apache基金會,但是當時卻沒有spark流行,由于乍一聽起來和spark功能很重合,都是同時支持批計算、流計算和機器學習,所以之前甚至有人說它生不逢時,

直到2015年之后,阿里巴巴開始注意到這個框架并大量使用和改進,在經過了若干次雙11的洗禮之后,這個框架的能力越來越被大眾接收,使用的公司也越來越多,于是flink似乎翻身了,

上邊說spark的實時計算實際上只是縮小了批計算的范圍,而flink的實時計算則是真正的實時計算,所以flink實時計算的性能也要強于spark,

在flink的思想中,資料處理都是基于資料流,實時計算的資料流稱作無界流,批計算的資料流稱作有界流,

無界流

所謂的無界流,就是一段資料有開始時間,沒有結束時間,其實就是資料持續在產生,需要持續的分析處理,

有界流

同理,有界流就是一段資料有開始時間,也有結束時間,所以其實也很容易發現有界流其實就是無界流的一個特例,在無界流中定義一個結束時間的話,這一段資料就是有界流,

flink的概念還有很多,例如jobManager、taskManager、solt等,對于flink集群來說,還有master和worker,這些概念均關聯很多其他技術點,后續再進一步深入,

抱著先知其然再知其所以然的心態,這里先搭建一個簡單的flink集群用起來,

flink簡單集群搭建(centos)

flink集群搭建相對簡單,首先需要下載安裝包,我下載的目前官網最新版1.11.2,可在官網https://flink.apache.org/downloads.html處查看最新版本并下載,下載方式多種,我這里使用wget直接下載到虛擬機:

wget https://downloads.apache.org/flink/flink-1.11.2/flink-1.11.2-bin-scala_2.11.tgz

下載好了之后是解壓:

tar -zxf flink-1.11.2-bin-scala_2.11.tgz

然后是簡單的配置,分為兩步,一個是配置jobManager,一個是配置taskManager,其他配置暫時默認,

jobManager只需要修改解壓后目錄的conf目錄的flink-conf.yaml檔案,找到jobmanager.rpc.address這一行,把后邊的localhost改為實際的jobManager節點的主機名,我這里就是node001,因此配置修改如下:

jobmanager.rpc.address: node001

然后同樣是conf目錄下,修改workers檔案,早期版本的可能不叫workers,而是slaves,這個和hbase新舊版本中檔案命名有點像,在workers檔案中加入規劃的taskManager節點主機名,例如我修改后如下:

node002
node003
node004

上述配置需要各個節點保持一致,所以需要把修改好的檔案包括整個flink分發到其他機器上,也就是把解壓后的這個flink的目錄傳到另外幾個節點上,例如我是在node001上操作的,然后就可以使用類似如下的命令分發到其他機器:

scp -r flink-1.11.2 node002:`pwd`/

分發完成之后,各個機器需要配置一下環境變數,修改/etc/profile檔案,加入flink內容,然后就可以在規劃的jobManager節點執行啟動命令啟動flink集群:

start-cluster.sh

上述命令實際是flink解壓后目錄下的bin目錄下的腳本,執行上述腳本后會看到日志依次列印出各個節點的啟動情況:

Starting cluster.
Starting standalonesession daemon on host node001.
Starting taskexecutor daemon on host node002.
Starting taskexecutor daemon on host node003.
Starting taskexecutor daemon on host node004.

啟動完成就要可以進行驗證,最直接的驗證就是訪問自帶的web界面,默認就是開啟的,使用8081埠,例如我這里就可以使用http://node001:8081進行訪問,

除此之外,為了更進一步的驗證,參考官網示例,可以寫一個簡單的java代碼驗證,

java程式驗證flink

撰寫一個簡單的flink程式,需要引入flink相應的依賴包,如下:

<dependency>
	<groupId>org.apache.flink</groupId>
	<artifactId>flink-scala_2.11</artifactId>
	<version>1.11.2</version>
</dependency>
<dependency>
	<groupId>org.apache.flink</groupId>
	<artifactId>flink-streaming-scala_2.11</artifactId>
	<version>1.11.2</version>
</dependency>
<dependency>
	<groupId>org.apache.flink</groupId>
	<artifactId>flink-clients_2.11</artifactId>
	<version>1.11.2</version>
</dependency>

然后根據官網https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/datastream_api.html的示例撰寫如下代碼:

package com.tzx.study.demo.flink;

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.util.Collector;

public class FlinkTest {
    public static void main(String [] args)throws Exception{
        StreamExecutionEnvironment env= StreamExecutionEnvironment.getExecutionEnvironment();
        DataStream<Tuple2<String, Integer>> dataStream = env
            .socketTextStream("localhost", 8888)
            .flatMap(new Splitter())
            .keyBy(value -> value.f0)
            .sum(1);
        dataStream.print();
        env.execute("Window WordCount");
    }

    public static class Splitter implements FlatMapFunction<String, Tuple2<String, Integer>> {
        @Override
        public void flatMap(String sentence, Collector<Tuple2<String, Integer>> out) throws Exception {
            for (String word: sentence.split(" ")) {
                out.collect(new Tuple2<String, Integer>(word, 1));
            }
        }
    }
}

上述代碼的意思是,創建一個執行環境,如果是idea等開發工具運行,就創建本地運行環境,如果是把程式生成可執行jar放到flink集群運行,就是集群環境,

然后建立一個本地的埠是8888的socket檔案資料流連接,讀到每行資料以空格分隔,然后計算數量,

上述代碼在main方法中,因此是可以直接運行的,需要注意的是,運行之前需要先開啟8888socket埠監聽,否則會啟動失敗,如果是本地idea測驗,需要windows上啟動這個埠,我是直接執行nc -lp 8888命令,后來把這個程式生成jar放到集群環境中運行,就需要在運行的linux節點中監聽這個埠,例如nc -lk 8888,windows和linux中稍有區別,
當然了,如果要更方便的驗證,也完全可以直接把localhost換成實際的主機名,這樣就不需要分別在不同環境啟動這個埠,

運行之后,在nc監聽的界面輸入相應資訊,便可以看到實時輸出的統計資料,代表簡單的flink集群和程式驗證成功,也標志著第一步成功邁出,接下來就是基于此的進一步應用和理解,

涂宗勛 CSDN認證博客專家 web安全 系統安全 安全架構
【若想不迷路,記得點關注,動動小手指,點點全是福】

6年java作業經驗,現居湖北武漢,有過支付、OA、CA、OAUTH2等作業經驗,現從事車聯網行業,
愛好分享,個人博客blog.tzxcode.cn,微信tuzongxun,qq1160569243,歡迎來撩,

轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/171977.html

標籤:其他

上一篇:qt呼叫簡單udp程式出錯!

下一篇:跪了!阿里內部瘋傳的神仙“MySQL面試寶典”,居然讓我拿到30Koffer!建議收藏。

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【從零開始擼一個App】Dagger2

    Dagger2是一個IOC框架,一般用于Android平臺,第一次接觸的朋友,一定會被搞得暈頭轉向。它延續了Java平臺Spring框架代碼碎片化,注解滿天飛的傳統。嘗試將各處代碼片段串聯起來,理清思緒,真不是件容易的事。更不用說還有各版本細微的差別。 與Spring不同的是,Spring是通過反射 ......

    uj5u.com 2020-09-10 06:57:59 more
  • Flutter Weekly Issue 66

    新聞 Flutter 季度調研結果分享 教程 Flutter+FaaS一體化任務編排的思考與設計 詳解Dart中如何通過注解生成代碼 GitHub 用對了嗎?Flutter 團隊分享如何管理大型開源專案 插件 flutter-bubble-tab-indicator A Flutter librar ......

    uj5u.com 2020-09-10 06:58:52 more
  • Proguard 常用規則

    介紹 Proguard 入口,如何查看輸出,如何使用 keep 設定入口以及使用實體,如何配置壓縮,混淆,校驗等規則。

    ......

    uj5u.com 2020-09-10 06:59:00 more
  • Android 開發技術周報 Issue#292

    新聞 Android即將獲得類AirDrop功能:可向附近設備快速分享檔案 谷歌為安卓檔案管理應用引入可安全隱藏資料的Safe Folder功能 Android TV新主界面將顯示電影、電視節目和應用推薦內容 泄露的Android檔案暗示了傳說中的谷歌Pixel 5a與折疊屏新機 谷歌發布Andro ......

    uj5u.com 2020-09-10 07:00:37 more
  • AutoFitTextureView Error inflating class

    報錯: Binary XML file line #0: Binary XML file line #0: Error inflating class xxx.AutoFitTextureView 解決: <com.example.testy2.AutoFitTextureView android: ......

    uj5u.com 2020-09-10 07:00:41 more
  • 根據Uri,Cursor沒有獲取到對應的屬性

    Android: 背景:呼叫攝像頭,拍攝視頻,指定保存的地址,但是回傳的Cursor檔案,只有名稱和大小的屬性,沒有其他諸如時長,連ID屬性都沒有 使用 cursor.getInt(cursor.getColumnIndexOrThrow(MediaStore.Video.Media.DURATIO ......

    uj5u.com 2020-09-10 07:00:44 more
  • Android連載29-持久化技術

    一、持久化技術 我們平時所使用的APP產生的資料,在記憶體中都是瞬時的,會隨著斷電、關機等丟失資料,因此android系統采用了持久化技術,用于存盤這些“瞬時”資料 持久化技術包括:檔案存盤、SharedPreference存盤以及資料庫存盤,還有更復雜的SD卡記憶體儲。 二、檔案存盤 最基本存盤方式, ......

    uj5u.com 2020-09-10 07:00:47 more
  • Android Camera2Video整合到自己專案里

    背景: Android專案里呼叫攝像頭拍攝視頻,原本使用的 MediaStore.ACTION_VIDEO_CAPTURE, 后來因專案需要,改成了camera2 1.Camera2Video 官方demo有點問題,下載后,不能直接整合到專案 問題1.多次拍攝視頻崩潰 問題2.雙擊record按鈕, ......

    uj5u.com 2020-09-10 07:00:50 more
  • Android 開發技術周報 Issue#293

    新聞 谷歌為Android TV開發者提供多種新功能 Android 11將自動填表功能整合到鍵盤輸入建議中 谷歌宣布Android Auto即將支持更多的導航和數字停車應用 谷歌Pixel 5只有XL版本 搭載驍龍765G且將比Pixel 4更便宜 [圖]Wear OS將迎來重磅更新:應用啟動時間 ......

    uj5u.com 2020-09-10 07:01:38 more
  • 海豚星空掃碼投屏 Android 接收端 SDK 集成 六步驟

    掃碼投屏,開放網路,獨占設備,不需要額外下載軟體,微信掃碼,發現設備。支持標準DLNA協議,支持倍速播放。視頻,音頻,圖片投屏。好點意思。還支持自定義基于 DLNA 擴展的操作動作。好像要收費,沒體驗。 這里簡單記錄一下集成程序。 一 跟目錄的build.gradle添加私有mevan倉庫 mave ......

    uj5u.com 2020-09-10 07:01:43 more
最新发布
  • 歡迎頁輪播影片

    如圖,引導開始,球從上落下,同時淡入文字,然后文字開始輪播,最后一頁時停止,點擊進入首頁。 在來看看效果圖。 重力球先不講,主要歡迎輪播簡單實作 首先新建一個類 TextTranslationXGuideView,用于影片展示 文本是類似的,最后會有個圖片箭頭影片,布局很簡單,就是一個 TextVi ......

    uj5u.com 2023-04-20 08:40:31 more
  • 【FAQ】關于華為推送服務因營銷訊息頻次管控導致服務通訊類訊息

    一. 問題描述 使用華為推送服務下發IM訊息時,下發訊息請求成功且code碼為80000000,但是手機總是收不到訊息; 在華為推送自助分析(Beta)平臺查看發現,訊息發送觸發了頻控。 二. 問題原因及背景 2023年1月05日起,華為推送服務對咨詢營銷類訊息做了單個設備每日推送數量上限管理,具體 ......

    uj5u.com 2023-04-20 08:40:11 more
  • 歡迎頁輪播影片

    如圖,引導開始,球從上落下,同時淡入文字,然后文字開始輪播,最后一頁時停止,點擊進入首頁。 在來看看效果圖。 重力球先不講,主要歡迎輪播簡單實作 首先新建一個類 TextTranslationXGuideView,用于影片展示 文本是類似的,最后會有個圖片箭頭影片,布局很簡單,就是一個 TextVi ......

    uj5u.com 2023-04-20 08:39:36 more
  • 【FAQ】關于華為推送服務因營銷訊息頻次管控導致服務通訊類訊息

    一. 問題描述 使用華為推送服務下發IM訊息時,下發訊息請求成功且code碼為80000000,但是手機總是收不到訊息; 在華為推送自助分析(Beta)平臺查看發現,訊息發送觸發了頻控。 二. 問題原因及背景 2023年1月05日起,華為推送服務對咨詢營銷類訊息做了單個設備每日推送數量上限管理,具體 ......

    uj5u.com 2023-04-20 08:39:13 more
  • iOS從UI記憶體地址到讀取成員變數(oc/swift)

    開發除錯時,我們發現bug時常首先是從UI顯示發現例外,下一步才會去定位UI相關連的資料的。XCode有給我們提供一系列debug工具,但是很多人可能還沒有形成一套穩定的除錯流程,因此本文嘗試解決這個問題,順便提出一個暴論:UI顯示例外問題只需要兩個步驟就能完成定位作業的80%: 定位例外 UI 組 ......

    uj5u.com 2023-04-19 09:16:23 more
  • FIDE重磅更新!性能飛躍!體驗有禮!

    FIDE 開發者工具重構升級啦!實作500%性能提升,誠邀體驗! 一直以來不少開發者朋友在社區反饋,在使用 FIDE 工具的程序中,時常會遇到諸如加載不及時、代碼預覽/渲染性能不如意的情況,十分影響開發體驗。 作為技術團隊,我們深知一件趁手的開發工具對開發者的重要性,因此,在2023年開年,FinC ......

    uj5u.com 2023-04-19 09:16:15 more
  • 游戲內嵌社區服務開放,助力開發者提升玩家互動與留存

    華為 HMS Core 游戲內嵌社區服務提供快速訪問華為游戲中心論壇能力,支持玩家直接在游戲內瀏覽帖子和交流互動,助力開發者擴展內容生產和觸達的場景。 一、為什么要游戲內嵌社區? 二、游戲內嵌社區的典型使用場景 1、游戲內打開論壇 您可以在游戲內繪制論壇入口,為玩家提供沉浸式發帖、瀏覽、點贊、回帖、 ......

    uj5u.com 2023-04-19 09:15:46 more
  • iOS從UI記憶體地址到讀取成員變數(oc/swift)

    開發除錯時,我們發現bug時常首先是從UI顯示發現例外,下一步才會去定位UI相關連的資料的。XCode有給我們提供一系列debug工具,但是很多人可能還沒有形成一套穩定的除錯流程,因此本文嘗試解決這個問題,順便提出一個暴論:UI顯示例外問題只需要兩個步驟就能完成定位作業的80%: 定位例外 UI 組 ......

    uj5u.com 2023-04-19 09:14:53 more
  • FIDE重磅更新!性能飛躍!體驗有禮!

    FIDE 開發者工具重構升級啦!實作500%性能提升,誠邀體驗! 一直以來不少開發者朋友在社區反饋,在使用 FIDE 工具的程序中,時常會遇到諸如加載不及時、代碼預覽/渲染性能不如意的情況,十分影響開發體驗。 作為技術團隊,我們深知一件趁手的開發工具對開發者的重要性,因此,在2023年開年,FinC ......

    uj5u.com 2023-04-19 09:14:08 more
  • 游戲內嵌社區服務開放,助力開發者提升玩家互動與留存

    華為 HMS Core 游戲內嵌社區服務提供快速訪問華為游戲中心論壇能力,支持玩家直接在游戲內瀏覽帖子和交流互動,助力開發者擴展內容生產和觸達的場景。 一、為什么要游戲內嵌社區? 二、游戲內嵌社區的典型使用場景 1、游戲內打開論壇 您可以在游戲內繪制論壇入口,為玩家提供沉浸式發帖、瀏覽、點贊、回帖、 ......

    uj5u.com 2023-04-19 09:08:34 more