主頁 > 後端開發 > 【深入淺出 Yarn 架構與實作】6-4 Container 生命周期原始碼分析

【深入淺出 Yarn 架構與實作】6-4 Container 生命周期原始碼分析

2023-05-16 09:50:49 後端開發

本文將深入探討 AM 向 RM 申請并獲得 Container 資源后,在 NM 節點上如何啟動和清理 Container,將詳細分析整個程序的原始碼實作,

一、Container 生命周期介紹

Container 的啟動由 ApplicationMaster 通過呼叫 RPC 函式 ContainerManagementProtocol#startContainers() 發起請求,NM 中的 ContainerManagerImpl 組件負責接收并處理該函式發來的請求,
Container 啟動程序主要分為四個階段:通知 NM 啟動 Container、資源本地化、啟動并運行 Container、資源清理,
image.png

資源本地化:
主要是指分布式快取機制完成的作業(詳見上一篇《6-3 NodeManager 分布式快取》),
功能包括初始化各種服務組件、創建作業目錄、從 HDFS 下載運行所需的各種資源(比如文本檔案、JAR 包、可執行檔案)等,
Container 啟動:
ContainerLauncher 服務完成,該服務將進一步呼叫插拔式組件 ContainerExecutor,Yarn 中提供了三種 ContainerExecutor 實作,分別為 DefaultContainerExecutorLinuxContainerExecutorDockerContainerExecutor
資源清理:
是資源本地化的逆程序,它負責清理各類資源,均由 ResourceLocalizationService 服務完成,

二、Container 生命周期原始碼分析

一)AM 通知 NM 啟動 Container

主要流程如下:
image.png

AM AMRMClientAsyncImpl 通過 RPC 函式 ApplicationMaster#allocate() 周期性向 RM 申請資源,并將申請到的資源保存在阻塞佇列 responseQueue 中,
(下面僅截取重要邏輯的原始碼)

  private class HeartbeatThread extends Thread {
    public void run() {
      while (true) {
        AllocateResponse response = null;

          try {
            // 發心跳,發給 RM 當前的進度,從 RM 領取分配的 Container 及其他資訊,
            response = client.allocate(progress);
          } 
          
          // 將 RM 通過心跳回傳的資訊放到阻塞佇列 responseQueue 中,等待處理
          responseQueue.put(response);

跟蹤 responseQueue,其在 CallbackHandlerThread 進行取出,處理分配到的 Container,

  private class CallbackHandlerThread extends Thread {
    public void run() {
      while (true) {
        try {
          AllocateResponse response;
          try {
            // 從 responseQueue 取出資源,對應心跳執行緒中 responseQueue.put(response)
            response = responseQueue.take();
          }

          // 重點:處理分配到的 Container
          List<Container> allocated = response.getAllocatedContainers();
          if (!allocated.isEmpty()) {
            // 到 ApplicationMaster#onContainersAllocated() 處理
            handler.onContainersAllocated(allocated);
          }

ApplicationMaster#onContainersAllocated() 會對分配出來的 Container 資源進行處理,

    public void onContainersAllocated(List<Container> allocatedContainers) {
      for (Container allocatedContainer : allocatedContainers) {
        // 創建運行 Container 的 LaunchContainerRunnable 執行緒
        Thread launchThread = createLaunchContainerThread(allocatedContainer,
            yarnShellId);

        // launch and start the container on a separate thread to keep
        // the main thread unblocked
        // as all containers may not be allocated at one go.
        launchThreads.add(launchThread);
        launchedContainers.add(allocatedContainer.getId());
        // 啟動 LaunchContainerRunnable 執行緒
        launchThread.start();
      }
    }

launchThread 是內部類 LaunchContainerRunnable 的實體,關注其 run() 方法干了啥,主要兩件事:

  • 構建 Container 的啟動腳本
  • 呼叫 NMClientAsync#startContainerAsync() api 介面發送 ContainerEventType.START_CONTAINER 事件
	  // 1. 構建 Container 的啟動腳本(省略了構建的細節)
	  ContainerLaunchContext ctx = ContainerLaunchContext.newInstance(
        localResources, myShellEnv, commands, null, allTokens.duplicate(),
          null);
      containerListener.addContainer(container.getId(), container);
	  // 2. 重點:通過 NMClientAsync api 發送 ContainerEventType.START_CONTAINER 事件
      nmClientAsync.startContainerAsync(container, ctx);

后續就是處理這個事件,并呼叫 NM RPC 函式啟動 container 的程序,具體如下:

  • 放到 BlockingQueue<ContainerEvent> events
  • NMClientAsyncImpleventDispatcherThread 會不斷處理 events 中的事件
  • START_CONTAINER 事件對應的狀態機處理類是 StartContainerTransition
  • 其中執行 container.nmClientAsync.getClient().startContainer()
  • 這里呼叫 NM RPC **ContainerManagementProtocol#startContainers()** 通知 NM 啟動 Container,
// yarn/client/api/impl/NMClientImpl.java
  public Map<String, ByteBuffer> startContainer(
      Container container, ContainerLaunchContext containerLaunchContext)
          throws YarnException, IOException {

        // 獲取 RPC 代理(stub)
        proxy =
            cmProxy.getProxy(container.getNodeId().toString(),
                container.getId());

        // 重點:獲取到 RPC 呼叫協議 ContainerManagementProtocol,并通過 RPC 函式 startContainers 啟動 Container
        StartContainersResponse response =
            proxy
                .getContainerManagementProtocol().startContainers(allRequests);

至此,AM 與 NM 的互動流程已實作,通過 RPC 函式 ContainerManagementProtocol#startContainers() 來啟動 Container,后面我們將繼續在 NM 端看是如何處理這個 RPC 請求的,

二)Container 資源本地化

在 NM 端處理上述 RPC 請求的是:yarn/server/nodemanager/containermanager/ContainerManagerImpl#startContainers
主要完成兩個事情:

  • 應用程式初始化作業(該 Container 是 AM 發送到該節點的第一個 Container)
  • Container 本地化作業(非第一個 Container,會嘗試下載前面 Container 還未開始下載的檔案,以加快檔案下載速度)

image.png

1、程式初始化操作

里面會先做一些權限檢查、初始化等,然后呼叫函式 startContainerInternal(),我們重點關注這里面的邏輯,

// org/apache/hadoop/yarn/server/nodemanager/containermanager/ContainerManagerImpl.java
  private void startContainerInternal(NMTokenIdentifier nmTokenIdentifier,
      ContainerTokenIdentifier containerTokenIdentifier,
      StartContainerRequest request) throws YarnException, IOException {
    // 省略 Token 認證及 ContainerLaunchContext背景關系初始化
    // 真正處理邏輯
    this.readLock.lock();
    try {
      if (!serviceStopped) {
        // Create the application
        Application application =
            new ApplicationImpl(dispatcher, user, applicationID, credentials, context);
        // 應用程式的初始化,供后續 container 使用,這個邏輯只呼叫一次,通常由來自 ApplicationMaster 的第一個 container 完成
        if (null == context.getApplications().putIfAbsent(applicationID,
          application)) {
          // 1. 發送事件 ApplicationEventType.INIT_APPLICATION(資源本地化)
          dispatcher.getEventHandler().handle(
            new ApplicationInitEvent(applicationID, appAcls,
              logAggregationContext));
        }

        this.context.getNMStateStore().storeContainer(containerId,
            containerTokenIdentifier.getVersion(), request);
        // 2. 發送事件 ApplicationEventType.INIT_CONTAINER(啟動和運行 Container)
        dispatcher.getEventHandler().handle(
          new ApplicationContainerInitEvent(container));

        this.context.getContainerTokenSecretManager().startContainerSuccessful(
          containerTokenIdentifier);

發送事件 ApplicationEventType.INIT_APPLICATIONAppInitTransition 狀態機設定 ACL 屬性后,向 LogHandler(目前有兩種實作方式,分別是 LogAggregationServiceNonAggregatingLogHandler,這里以 LogAggregationService 服務為例)發送事件 LogHandlerEventType.APPLICATION_STARTED

LogHandler 收到 ApplicationEventType.APPLICATION_LOG_HANDLING_INITED 事件后,將創建應用程式日志目錄、設定目錄權限等,然后向 ApplicationImpl 發送一個 ApplicationEventType.APPLICATION_LOG_HANDLING_INITED 事件,

// yarn/server/nodemanager/containermanager/logaggregation/LogAggregationService.java
	case APPLICATION_STARTED:
        LogHandlerAppStartedEvent appStartEvent =
            (LogHandlerAppStartedEvent) event;
        initApp(appStartEvent.getApplicationId(), appStartEvent.getUser(),
            appStartEvent.getCredentials(),
            appStartEvent.getApplicationAcls(),
            appStartEvent.getLogAggregationContext());

  // initApp()
  private void initApp(final ApplicationId appId, String user,
      Credentials credentials, Map<ApplicationAccessType, String> appAcls,
      LogAggregationContext logAggregationContext) {
    ApplicationEvent eventResponse;
    try {
      verifyAndCreateRemoteLogDir(getConfig());
      initAppAggregator(appId, user, credentials, appAcls,
          logAggregationContext);
      // 發送事件        
      eventResponse = new ApplicationEvent(appId,
          ApplicationEventType.APPLICATION_LOG_HANDLING_INITED);
    } catch (YarnRuntimeException e) {
      LOG.warn("Application failed to init aggregation", e);
      eventResponse = new ApplicationEvent(appId,
          ApplicationEventType.APPLICATION_LOG_HANDLING_FAILED);
    }
    this.dispatcher.getEventHandler().handle(eventResponse);
  }

ApplicationImpl 收到 ApplicationEventType.APPLICATION_LOG_HANDLING_INITED 事件后,直接向 ResourceLocalizationService 發送 LocalizationEventType.INIT_APPLICATION_RESOURCES 事件,此時 ApplicationImpl 仍處于 INITING 狀態,

           .addTransition(ApplicationState.INITING, ApplicationState.INITING,
               ApplicationEventType.APPLICATION_LOG_HANDLING_INITED,

ResourceLocalizationService 收到事件請求時會創建一個 LocalResourcesTrackerImpl 物件,為接下來資源下載做準備,并向 ApplicationImpl 發送事件 ApplicationEventType.APPLICATION_INITED

// yarn/server/nodemanager/containermanager/localizer/ResourceLocalizationService.java
  private void handleInitApplicationResources(Application app) {
    // 0) Create application tracking structs
    String userName = app.getUser();
    // 創建 LocalResourcesTrackerImpl 物件,為接下來的資源下載做準備
    privateRsrc.putIfAbsent(userName, new LocalResourcesTrackerImpl(userName,
        null, dispatcher, true, super.getConfig(), stateStore, dirsHandler));
    String appIdStr = app.getAppId().toString();
    appRsrc.putIfAbsent(appIdStr, new LocalResourcesTrackerImpl(app.getUser(),
        app.getAppId(), dispatcher, false, super.getConfig(), stateStore,
        dirsHandler));
    // 1) Signal container init
    //
    // This is handled by the ApplicationImpl state machine and allows
    // containers to proceed with launching.
    // 向 ApplicationImpl 發送 ApplicationEventType.APPLICATION_INITED 事件
    dispatcher.getEventHandler().handle(new ApplicationInitedEvent(
          app.getAppId()));
  }

ApplicationImpl 收到 ApplicationEventType.APPLICATION_INITED 事件后,依次向該應用程式已經保持的所有 Container 發送一個 INIT_CONTAINER 事件以通知它們進行初始化,此時,ApplicationImpl 運行狀態由 INITING 轉換為 RUNNING,

2、完成 Container 本地化作業

之后的一些處理邏輯:

  • ContainerImpl 收到 INIT_CONTAINER 事件后,先向附屬服務 AuxServices 發送 APPLICATION_INIT 事件,以通知它有新的應用程式 Container 啟動,然后從 ContainerLaunchContext 中獲取各類可見性資源,并保存到 ContainerImpl 中特定的資料結構中,之后向 ResourceLocalizationService 發送 LocalizationEventType.INIT_CONTAINER_RESOURCES 事件,此時 ContainerImpl 運行狀態已由 NEW 轉換為 LOCALIZING,
  • ResourceLocalizationService 收到 LocalizationEventType.INIT_CONTAINER_RESOURCES 事件后,依次將 Container 所需的資源封裝成一個 REQUEST 事件,發送給對應的資源狀態追蹤器 LocalResourcesTrackerImpl
  • LocalResourcesTrackerImpl 收到 REQUEST 事件后,將為對應的資源創建一個狀態機物件 LocalizeResource 以跟蹤資源的生命周期,并將 REQUEST 事件進一步傳送給 LocalizedResource
  • LocalizedResource 收到 REQUEST 事件后,將待下載資源資訊通過 LocalizerEventType.REQUEST_RESOURCE_LOCALIZATION 事件發送給資源下載服務 ResourceLocalizationService,之后 LocalizedResource 狀態由 NEW 轉換為 DOWNLOADING,

【這里是重點,對應的下載邏輯】
ResourceLocalizationService 收到 LocalizerEventType.REQUEST_RESOURCE_LOCALIZATION 事件后,將交給 LocalizerTrackerResourceLocalizationService 的內部類) 服務處理,

  • 如果是 PUBLIC 資源,則統一交給 PublicLocalizer 處理,
  • 如果該 Container 未創建 LocalizerRunner 執行緒,則創建一個,
  • 然后添加到該執行緒的下載佇列中,

該執行緒會呼叫 ContainerExecutor#startLocalizer() 函式下載資源,該函式通過協議 LocalizationProtocolResourceLocalizationService 通信,以順序獲取待下載資源位置下載,待資源下載完成后,向 LocalizedResource 發送一個 LOCALIZED 事件,

    public void handle(LocalizerEvent event) {
      String locId = event.getLocalizerId();
      switch (event.getType()) {
      case REQUEST_RESOURCE_LOCALIZATION:
        // 0) find running localizer or start new thread
        LocalizerResourceRequestEvent req =
          (LocalizerResourceRequestEvent)event;
        switch (req.getVisibility()) {
        case PUBLIC:
          // 如果是 PUBLIC 資源,則統一交給 PublicLocalizer 處理
          publicLocalizer.addResource(req);
          break;
        case PRIVATE:
        case APPLICATION:
          // 檢查是否已經為該 Container 創建了 LocalizerRunner 執行緒,
          // 如果沒有,則創建一個,
          // 然后添加到該執行緒的下載佇列中,該執行緒會呼叫 ContainerExecutor#startLocalizer() 函式下載資源
          synchronized (privLocalizers) {
            LocalizerRunner localizer = privLocalizers.get(locId);
            if (null == localizer) {
              LOG.info("Created localizer for " + locId);
              localizer = new LocalizerRunner(req.getContext(), locId);
              privLocalizers.put(locId, localizer);
              localizer.start();
            }
            // 1) propagate event
            localizer.addResource(req);
          }
          break;
        }
        break;
      }
    }

LocalizedResource 收到 LOCALIZED 事件后,會向 ContainerImpl 發送一個 ContainerEventType.RESOURCE_LOCALIZED 事件,并且將狀態從 DOWNLOADING 轉換為 LOCALIZED,ContainerImpl 收到事件后,會檢查所依賴的資源是否全部下載完畢,如果下載完成則向 ContainersLauncher 服務發送一個 LAUNCH_CONTAINER 事件,以啟動對應 Container,

資源本地化程序可概括為:

  • 在 NM 上,同一個應用程式的所有 ContainerImpl 異步并發向資源下載服務ResourceLocalizationService 發送待下載的資源,
  • ResourceLocalizationService 下載完一類資源后,將通知依賴該資源的所有Container
  • 一旦一個 Container 依賴的資源已經全部下載完成,則該Container進入運行階段,

三)啟動和運行 Container

我們再回到 ContainerManagerImplINIT_APPLICATION 事件的處理完成了「資源本地化」的操作,后續發送 INIT_CONTAINER 事件,是本節「啟動和運行 Container」要分析的部分,

// org/apache/hadoop/yarn/server/nodemanager/containermanager/ContainerManagerImpl.java
  private void startContainerInternal(NMTokenIdentifier nmTokenIdentifier,
      ContainerTokenIdentifier containerTokenIdentifier,
      StartContainerRequest request) throws YarnException, IOException {
          // 1. 發送事件 ApplicationEventType.INIT_APPLICATION(資源本地化)
          dispatcher.getEventHandler().handle(
            new ApplicationInitEvent(applicationID, appAcls,
              logAggregationContext));

        // 2. 發送事件 ApplicationEventType.INIT_CONTAINER(啟動和運行 Container)
        dispatcher.getEventHandler().handle(
          new ApplicationContainerInitEvent(container));

發送事件 ApplicationEventType.INIT_CONTAINER,由 ApplicationImpl 處理

    .addTransition(ApplicationState.NEW, ApplicationState.NEW,
        ApplicationEventType.INIT_CONTAINER,
        INIT_CONTAINER_TRANSITION)
  • 發送 ContainerEventType.INIT_CONTAINER 事件
  • ContainerImpl.RequestResourcesTransition 中處理
  • 其中重點邏輯是啟動 Container container.sendLaunchEvent()
  • 又發送 ContainersLauncherEventType.LAUNCH_CONTAINER 事件

這里探究下 LAUNCH_CONTAINER 事件的處理流程,從這里去跟蹤的時候會發現,沒有狀態機注冊這個事件,找不到對應的處理邏輯,那么這個事件是如何被處理的呢?
我們去找到這個事件型別注冊的地方:

// yarn/server/nodemanager/containermanager/ContainerManagerImpl.java
dispatcher.register(ContainersLauncherEventType.class, containersLauncher);

其注冊的事件處理器為 ContainersLauncher 類,在這里我們找到了 handle() 方法,里面對事件進行處理,

// yarn/server/nodemanager/containermanager/launcher/ContainersLauncher.java
  public void handle(ContainersLauncherEvent event) {
    // TODO: ContainersLauncher launches containers one by one!!
    Container container = event.getContainer();
    ContainerId containerId = container.getContainerId();
    switch (event.getType()) {
      case LAUNCH_CONTAINER:
        Application app =
          context.getApplications().get(
              containerId.getApplicationAttemptId().getApplicationId());

        // LAUNCH_CONTAINER 事件的處理邏輯,創建 ContainerLaunch 執行緒并啟動執行緒
        ContainerLaunch launch =
            new ContainerLaunch(context, getConfig(), dispatcher, exec, app,
              event.getContainer(), dirsHandler, containerManager);
        // 提交到執行緒池
        containerLauncher.submit(launch);
        // 將其加入到運行的 Container 資料結構 running 中
        running.put(containerId, launch);
        break;

ContainerLaunch 類繼承自 Callable 類,通過 submit() 提交到執行緒池中,之后呼叫 Callable 類的實作方法 call() 來真正執行執行緒,主要邏輯如下:

  • 準備 Container 的執行環境
    • shell啟動腳本的封裝與拓展(添加自定義腳本)
    • 創建本地作業目錄
    • 設定token的保存路徑
  • 更新 Container 狀態,從 LOCALIZED 轉換為 RUNNING
    • 發送 CONTAINER_LAUNCHED 事件
    • 發送 START_MONITORING_CONTAINER 事件,啟動對該 container 的資源監控
  • 呼叫 ContainerExecutor 物件在 NM 節點上啟動 Container
    • ContainerExecutor 由用戶指定(DefaultContainerExecutor, LinuxContainerExecutor, DockerContainerExecutor
    • 通過具體的 ContainerExecutor 在 NM 上啟動 Container
// yarn/server/nodemanager/containermanager/launcher/ContainerLaunch.java
  public Integer call() {
    // 啟動 Container 前的準備作業:
    // 1.shell啟動腳本的封裝與拓展(添加自定義腳本)
    // 2.創建本地作業目錄
    // 3.設定token的保存路徑
    final ContainerLaunchContext launchContext = container.getLaunchContext();

      // 發送 CONTAINER_LAUNCHED 事件 & START_MONITORING_CONTAINER 事件
      dispatcher.getEventHandler().handle(new ContainerEvent(
            containerID,
            ContainerEventType.CONTAINER_LAUNCHED));
      context.getNMStateStore().storeContainerLaunched(containerID);
      
        // 重點:呼叫 ContainerExecutor 物件啟動 Container
        // ContainerExecutor 由用戶指定(DefaultContainerExecutor, LinuxContainerExecutor, DockerContainerExecutor)
        exec.activateContainer(containerID, pidFilePath);
        ret = exec.launchContainer(new ContainerStartContext.Builder()
            .setContainer(container)
            .setLocalizedResources(localResources)
            .setNmPrivateContainerScriptPath(nmPrivateContainerScriptPath)
            .setNmPrivateTokensPath(nmPrivateTokensPath)
            .setUser(user)
            .setAppId(appIdStr)
            .setContainerWorkDir(containerWorkDir)
            .setLocalDirs(localDirs)
            .setLogDirs(logDirs)
            .build());

      
    // 完成發送 CONTAINER_EXITED_WITH_SUCCESS 事件
    LOG.info("Container " + containerIdStr + " succeeded ");
    dispatcher.getEventHandler().handle(
        new ContainerEvent(containerID,
            ContainerEventType.CONTAINER_EXITED_WITH_SUCCESS));

同時,由于 ContainerExecutor#launchContainer 函式是阻塞式的,因此只有當腳本執行完成后才退出,這使得 ContainerLauncher 可在第一時間知道 Container 完成時間,之后向 ContainerImpl 發送一個 CONTAINER_EXITED_WITH_SUCCESS 事件,此時 ContainerImpl 狀態由 RUNNING 轉換為 EXITED_WITH_SUCCESS,
至此,一個 Container 運行完成,接下來將進入該 Container 的資源清理階段,

四)Container 資源清理

當 Container 運行完成后(成功或失敗),會執行資源清理作業,主要清理下面兩類資源:

  • ResourceLocalizationService:從 HDFS 下載到本地的資料檔案
  • ContainerExecutor:為 Container 創建私有作業目錄,并保存一些臨時檔案(比如 Container 行程 pid 檔案)

在上一步 call() 方法最后,Container 運行完成時,會發送 CONTAINER_EXITED_WITH_SUCCESS 事件,

// yarn/server/nodemanager/containermanager/container/ContainerImpl.java
    .addTransition(ContainerState.RUNNING,
        ContainerState.EXITED_WITH_SUCCESS,
        ContainerEventType.CONTAINER_EXITED_WITH_SUCCESS,
        new ExitedWithSuccessTransition(true))

// ------------------------
  static class ExitedWithSuccessTransition extends ContainerTransition {
    public void transition(ContainerImpl container, ContainerEvent event) {
      // Set exit code to 0 on success    	
      container.exitCode = 0;

      if (clCleanupRequired) {
        // 向 ContainerLauncher 發送 ContainersLauncherEventType.CLEANUP_CONTAINER 清理事件
        container.dispatcher.getEventHandler().handle(
            new ContainersLauncherEvent(container,
                ContainersLauncherEventType.CLEANUP_CONTAINER));
      }

      // 向 ResourceLocalizationService 發送 LocalizationEventType.CLEANUP_CONTAINER_RESOURCES 清理事件
      container.cleanup();
    }
  }

1、ContainerLauncher 清理臨時目錄

處理 ContainersLauncherEventType.CLEANUP_CONTAINER 事件,
處理邏輯會進入到 ContainersLauncherhandle() 方法,將 Container 從正在運行的 Container 串列中移除,并呼叫 ContainerLaunch#cleanupContainer() 方法清除 Container 占用的臨時目錄,

      case CLEANUP_CONTAINER:
        // 將 Container 從正在運行 Container 串列中移除
        ContainerLaunch launcher = running.remove(containerId);
        if (launcher == null) {
          // Container not launched. So nothing needs to be done.
          return;
        }

        // Cleanup a container whether it is running/killed/completed, so that
        // no sub-processes are alive.
        try {
          // 清理 Container 占用的臨時目錄(kill行程,洗掉 pid 檔案等)
          launcher.cleanupContainer();
        } catch (IOException e) {
          LOG.warn("Got exception while cleaning container " + containerId
              + ". Ignoring.");
        }
        break;

2、ResourceLocalizationService 清理用戶作業目錄和私有目錄

處理 LocalizationEventType.CLEANUP_CONTAINER_RESOURCES 事件,

    case CLEANUP_CONTAINER_RESOURCES:
      handleCleanupContainerResources((ContainerLocalizationCleanupEvent)event);
      break;

handleCleanupContainerResources() 將會洗掉

  • 用戶作業的資料(即從 HDFS 下載的資料)${yarn.nodemanager.local-dirs}/usercache/<user>/appcache/${appid}/${containerid}
  • 私有目錄資料 ${yarn.nodemanager.local-dirs}/nmPrivate/${appid}/${containerid} (執行腳本、token檔案、pid檔案)
    • 其中 執行腳本、token 會在 Container 啟動時復制到 「用戶作業的資料」目錄中

這兩個目標都存放了 Tokens 檔案和 Shell 運行腳本,

3、保留的目錄

注意:{yarn.nodemanager.local-dirs}/usercache/{appid}/output 并不會洗掉,計算任務之間有依賴關系,因此 NodeManager 不能在 Container 運行完成之后立刻清理它占用的所有資源,尤其是產生的中間資料,而只有當所有 Container 運行完成之后,才能夠全部清空這些資源,
當一個應用程式運行結束時,需要由它廣播給各個NodeManager,再進一步由NodeManager清理應用程式占用的所有資源,包括產生的中間資料,
image.png

到這里 container 清理作業完成,

三、小結

本節深入原始碼介紹了 Container 生命周期的整體流程,從通知 NM 啟動 Container、資源本地化、啟動 Container、資源清理四個方面進行了介紹,


參考文章:
《Hadoop技術內幕:深入決議YARN架構設計與實作原理》
Yarn Container啟動流程原始碼分析
NodeManager詳細組件及功能
深入決議yarn架構設計與技術實作-NodeManager2
hadoop-yarn-src-read - 一些 yarn 學習筆記

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552470.html

標籤:Java

上一篇:Spring原始碼:Bean生命周期(四)

下一篇:返回列表

標籤雲
其他(159041) Python(38129) JavaScript(25421) Java(18043) C(15226) 區塊鏈(8265) C#(7972) AI(7469) 爪哇(7425) MySQL(7186) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1973) 功能(1967) Web開發(1951) HtmlCss(1936) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1876) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 【深入淺出 Yarn 架構與實作】6-4 Container 生命周期原始碼分析

    本文將深入探討 AM 向 RM 申請并獲得 Container 資源后,在 NM 節點上如何啟動和清理 Container。將詳細分析整個程序的原始碼實作。 ......

    uj5u.com 2023-05-16 09:50:49 more
  • Spring原始碼:Bean生命周期(四)

    在本文中,我們深入探討了 Spring 框架中 Bean 的實體化程序,關于某些細節以后我會單獨拿出一篇文章單獨講解,我們來總結下實體化都做了哪些事情:先從bean定義中加載當前類,因為最初Spring使用ASM技術決議元資料時只獲取了當前類的名稱尋找所有InstantiationAwareBean... ......

    uj5u.com 2023-05-16 09:45:31 more
  • Springboot通過谷歌Kaptcha 組件,生成圖形驗證碼

    圖形驗證碼屬于老生常談了,具體細節這里就不說了。生成圖形驗證碼的辦法非常多,今天講解一種通過Kaptcha組件快速生成圖形驗證碼的方法。Kaptcha是谷歌開源的一款簡單實用的圖形驗證碼組件。我個人推薦它的最大原因是容易上手,采用約定大于配置的方式,快速契合到專案中。話不多說,我們看看該如何使用它: ......

    uj5u.com 2023-05-16 09:40:22 more
  • 不是單例的單例——巧用ClassLoader

    本文通過如何將一個單例類實體化兩次的案例,用代碼實踐來引入 Java 類加載器相關的概念與作業機制。理解并熟練掌握相關知識之后可以擴寬解決問題的思路,另辟蹊徑,達到目的。 ......

    uj5u.com 2023-05-16 09:40:16 more
  • SpringBoot 使用 Sa-Token 完成注解鑒權功能

    注解鑒權 —— 優雅的將鑒權與業務代碼分離。本篇我們將介紹在 Sa-Token 中如何通過注解完成權限校驗。 Sa-Token 是一個輕量級 java 權限認證框架,主要解決登錄認證、權限認證、單點登錄、OAuth2、微服務網關鑒權 等一系列權限相關問題。 Gitee 開源地址:https://gi ......

    uj5u.com 2023-05-16 09:40:08 more
  • 從3s到25ms!看看京東的介面優化技巧,確實很優雅!!

    大家好,最近看到京東云的一位大佬分享的介面優化方案,感覺挺不錯的,拿來即用。建議收藏一波或者整理到自己的筆記本中,隨時查閱! 來源:https://toutiao.io/posts/0kwkbbt 下面是正文。 一、背景 針對老專案,去年做了許多降本增效的事情,其中發現最多的就是介面耗時過長的問題, ......

    uj5u.com 2023-05-16 09:39:57 more
  • Bigdecimal使用

    ####1.Bigdecimal回傳資料小數后0自動被洗掉的問題 import com.fasterxml.jackson.core.JsonGenerator; import com.fasterxml.jackson.databind.JsonSerializer; import com.fas ......

    uj5u.com 2023-05-16 09:39:49 more
  • java~"與運算"實作保留一個數的低8位

    int型別另外介紹 int型別的封裝型別是Integer型別,它是有符號的型別,即它有負數和正數兩部分,最小為-2^32,最大值是2^32-1。 int型別由32位二進制陣列成,每4位二進制數表示為1位16進制數,每8位2進制數占用存盤空間為1位元組、即每2位16進制也占用1位元組 一個int型別的數字 ......

    uj5u.com 2023-05-16 09:34:03 more
  • 聊一聊模板方法模式

    模板方法模式,又叫模板模式,屬于23種設計模式中的行為型模式。在抽象類中公開定義了執行的方法,子類可以按需重寫其方法,但是要以抽象類中定義的方式呼叫方法。 ......

    uj5u.com 2023-05-16 09:11:15 more
  • 【設計模式】使用 go 語言實作簡單工廠模式

    最近在看《大話設計模式》,這本書通過對話形式講解設計模式的使用場景,有興趣的可以去看一下。 第一篇講的是簡單工廠模式,要求輸入兩個數和運算子號,得到運行結果。 這個需求不難,難就難在類要怎么設計,才能達到可復用、維護性強、可拓展和靈活性高。 運算子可能是加、減、乘、除,未了方便以后可以拓展其它運算子 ......

    uj5u.com 2023-05-16 09:05:56 more