主頁 > 後端開發 > Superset SSO改造和自定義宏命令

Superset SSO改造和自定義宏命令

2022-01-22 06:17:12 後端開發

目錄
  • 背景
  • 關于Superset
  • 需要解決的問題
  • 定制化改造
    • 準備環境
    • 改造OAuth SSO
      • 安裝依賴
      • 配置SSO
      • 添加自定義的SecurityManager
      • 運行一下吧
    • 自定義宏命令
      • 開啟配置
      • 添加自定義宏命令
      • 補充說明
  • 小結

背景

在最近的一個專案上,客戶想要為他們的多租戶(Multi-tenant)系統添加一個新的報表中心,技術選型自然沿用之前的選擇:Apache Superset,一款由愛彼迎貢獻給開源社區的框架,

關于Superset

Superset的前端是中規中矩的React,圖表功能則是使用NVD3/D3,后端沒有使用萬年Java,而是Python3,Web方面使用的是Flask框架,其他的框架沒有過多的深入了解,

需要解決的問題

由于之前的業務原因,之前的系統在用戶登錄時,只能選擇其中的一個租戶系結到會話中,這個模式在業務早期沒有什么困擾,但隨著多租戶用戶的增多,系統的用戶更希望看到跨租戶的總覽資料,

為此,我們新增了一個資源服務,提供了一個介面用于查詢到當前用戶的租戶資訊,用戶的認證時通過OAuth 2.0,連接到鑒權服務,

這種變化對于原來的解決方案帶來了兩個問題:

  1. Superset需要接入資源服務所用的鑒權服務,并且在OAuth 2.0鑒權后訪問資源服務,通過介面獲取到當前用戶的租戶資訊,
  2. Superset需要在執行查詢時,動態插入行級過濾條件,這個過濾條件的值是依賴當前用戶的租戶資訊,這可以使用SQL Templating,SQL templating,內置了一些運算式(官方稱之為macro,宏,下文稱之為宏命令),但功能有限,
    之前的做法是當通過OAuth登錄Superset,登錄的用戶名被改為租戶的ID,也就是一個租戶下的多個用戶在使用Superset時使用的是一個Superset用戶,這是一個安全的隱患,無法準確地追蹤用戶的行為,另外,因為Superset的Row level security只能系結到角色上,所以每個租戶用戶又有一個獨有的角色,這樣的影響是顯而易見的:但隨著業務的增長,租戶相關的資料會越來越多,一定程度上造成管理上的混亂,

定制化改造

針對問題1,在現在的Superset(1.3.2)中,早已提供了對OAuth登錄的支持,官方提供的教程也很詳細,但是在開發程序中,還是遇到了一些小問題,

針對問題2,想辦法改造這個SQL templating的文本處理邏輯,增加更多的宏命令,來獲取當前用戶的租戶資訊,對于這個功能,官方檔案只提供了一個針對Presto資料庫的文本處理改造方案,對于這部分功能改造的博客,網上的資訊很少,但是經過摸索,還是走出了一條路,

準備環境

官方提供兩種方案,一種容器化的,另一種是本地化加虛擬環境,為了除錯方便,我采用了后者,

Superset默認使用sqlite,本地啟動的話,sqlite檔案在~/.superset/superset.db,可以使用IDEA的database面板打開,資料庫schema請選擇main,

教程中提到的環境變數PYTHONPATH,可以理解為Java中的CLASS_PATH(是目錄,而不是具體的某個檔案),用于加載外部的模塊(module),因為Python是解釋型語言,所以可以在這個目錄直接放入Pythone檔案,Superset在啟動時會加載這個目錄下的superset_config.py,并根據其中的代碼,加載其他模塊,

改造OAuth SSO

請先閱讀官方教程:傳送門(英文),

安裝依賴

Superset接入OAuth SSO需要依賴庫Authlib,可以通過pip安裝,

pip install Authlib

對于采用容器化部署的小伙伴,要注意容器被重置時要安裝下載這個依賴,

對于喜歡多個命令列視窗的小伙伴,要注意安裝這個依賴時,要激活superset虛擬環境(virtualenv),

配置SSO

根據教程,我們會在superset_config.py中選擇認證方式為OAuth,并添加鑒權服務的配置,其中配置的詳細說明如下:

from flask_appbuilder.security.manager import AUTH_OAUTH

AUTH_TYPE = AUTH_OAUTH # 選擇認證方式,注意,這個值是參考自flask_appbuilder.security.manager
OAUTH_PROVIDERS = [
    {
        'name': 'spring-sso', # SSO的名字,用于展示在登錄頁面,格式為SIGN WITH {SSO的名字,大寫},可以配置多個SSO,
        'token_key': 'access_token', # AccessToken在ResponseBody中的名字,必須指定,用于框架保存AccessToken,
        'remote_app': {
            'client_id': 'superset-client', # Superset在鑒權注冊的id
            'client_secret': 'superset', # 配套的密鑰
            'client_kwargs': {
                'scope': 'openid'  # OAuth2的scope,多個值用空格分開
            },
            'access_token_method': 'POST',  # 請求access token介面時的HTTP方法
            'access_token_params': {
                # 請求access token介面附在URL上的引數,視鑒權服務的介面規范添加,可選配置,
                'client_id': 'superset-client',
            },
            'access_token_headers': {
                # 請求access token介面附在HEADER上的引數,視鑒權服務的介面規范添加,可選配置,
                'Authorization': 'Basic Base64EncodedClientIdAndSecret'
            },
            'api_base_url': 'http://resource-server', # 資源服務API根路徑,用于獲取AccessToken后請求用戶資訊,
            'authorize_url': 'http://auth-server/oauth2/authorize', # OAuth 2.0中的authorize介面
            'access_token_url': 'http://auth-server/oauth2/token', # OAuth 2.0中的token介面
        }
    }
]
# 是否允許創建不存在的用戶,通過SSO登錄的用戶有可能沒有保存在Superset的用戶表中,如果這個配置項為False,那么用戶將被拒絕登錄,
AUTH_USER_REGISTRATION = True
# 創建時的默認權限,只允許一個值,
AUTH_USER_REGISTRATION_ROLE = "Admin"

DEFAULT_FEATURE_FLAGS: Dict[str, bool] = {
  	# 當配置項AUTH_ROLES_SYNC_AT_LOGIN為True時,每次SSO登錄后會將用戶資訊中的角色同步至Superset資料庫,
 	  # 具體做法見下一節內容,
    "AUTH_ROLES_SYNC_AT_LOGIN": False, 
}

添加自定義的SecurityManager

Superset默認支持OAuth 2.0的登錄方式有GitHub、Twitter、LinkedIn、Google等,但如果鑒權服務是自建的話,就需要撰寫配套的SecurityManager,以便回傳給框架正確的用戶資訊,

在PYTHONPATH下添加一個新的檔案:custom_sso_security_manager.py,添加一個SecurityManager繼承類,覆寫oauth_user_info方法:

import jwt
from flask import session

from superset.security import SupersetSecurityManager

class CustomSsoSecurityManager(SupersetSecurityManager):

    def oauth_user_info(self, provider, response=None):
        if provider == 'spring-sso': # 判斷SSO的名字
            access_token = response.get('access_token') # 從Response中獲取AccessToken
            decoded = jwt.decode(access_token, verify=False) # 決議JWT
            sub = decoded.get('sub') # 得到OpenId
            # 向資源服務請求,通過oauth_remotes呼叫時,框架會自動在Authorization Header添加AccessToken,
            # 這個AccessToken就是通過之前配置里的token_key決議得到的,
            # 這里的路徑就是之前配置里的api_base_url,
            # 理論上資源服務和鑒權服務是分開的,但大部分的SSO vendor提供的獲取用戶資訊介面與token介面的根路徑是一致的,
            # 這里是根據業務的需要,向資源服務獲取當前用戶的租戶資訊,
            user_details_resp = self.appbuilder.sm.oauth_remotes[provider].get('tenants')
            # 將租戶資訊保存在session中,
            session["tenants"] = user_details_resp.json()
            # 拼接成用戶資訊,
            # 用戶資訊中必須要有username或email,否則日志會拋出例外:OAUTH userinfo does not have username or email
            # 用戶資訊可以添加role_keys串列,作為用戶的角色串列,
            # 當配置項AUTH_ROLES_SYNC_AT_LOGIN為True時,每次SSO登錄后都將串列中的角色同步至Superset資料庫,
            user_info = { 'username': sub, 'first_name': sub }
            return user_info

然后再superset_config.py追加以下幾行:

from custom_sso_security_manager import CustomSsoSecurityManager

CUSTOM_SECURITY_MANAGER = CustomSsoSecurityManager

運行一下吧

大功告成,可以試著運行一下,看看是否可以正常介面SSO,

自定義宏命令

開啟配置

為了根據用戶的租戶資訊對查詢的資料進行過濾,需要Superset的SQL Templating和Row level security兩個特性的配合,在superset_config.py中打開這兩個配置:

DEFAULT_FEATURE_FLAGS: Dict[str, bool] = {
  	# ...
    "ENABLE_TEMPLATE_PROCESSING": True,
    "ROW_LEVEL_SECURITY": True,
  	# ...
}

清先閱讀下官方檔案:SQL Templating和Row level security,

目前Superset的Row level security功能是比較完備的,可以在頁面上配置過濾的從句(Clause),而且過濾從句可以被SQL Templating處理,所以這里可以寫入宏命令,只是注意這里不需要寫上where關鍵字,因此Row level security無需進行任何改造,

但是對于官方提供的宏命令,還不足以支撐業務的需要(比如一個宏命令tenants(),從session中獲取當前用戶的租戶資訊),所以需要對其進行擴展,

添加自定義宏命令

Superset在jinja_context.py下實作了SQL Templating,對于SQL陳述句中的宏命令的替換處理,主要是通過JinjaTemplateProcessor來實作的,對于HQL的支持是通過HiveTemplateProcessor來實作的,后者在前者的基礎上添加了一些針對磁區(partition)的宏命令,

對于宏命令的擴展,可以參考Superset的教程,在superset_config.py中添加CUSTOM_TEMPLATE_PROCESSORS

from custom_template_processor import CustomTemplateProcessor
from superset.jinja_context import BaseTemplateProcessor
from typing import Type, Dict

CUSTOM_TEMPLATE_PROCESSORS: Dict[str, Type[BaseTemplateProcessor]] = {
    "sqlite": CustomTemplateProcessor
}

CUSTOM_TEMPLATE_PROCESSORS是一個Dict物件,可以理解為Java中的Map,鍵型別為str,代表著所負責的資料庫引擎型別,在我的本地環境中,資料庫使用的是sqlite,所以這里的寫的是sqlite,值型別是BaseTemplateProcessor的子類,這里我自定義了一個CustomTemplateProcessor,保存在同目錄的custom_template_processor.py中:

from functools import partial

from flask import session

from superset.jinja_context import JinjaTemplateProcessor, safe_proxy
from typing import Any


def tenants() -> (): return session["tenants"]

# 只需繼承JinjaTemplateProcessor即可,
class CustomTemplateProcessor(JinjaTemplateProcessor):

    # 官方的檔案中給出的列子是將宏命令的識別由{{}}改為$,所以覆寫的是process_template,
    # 現在的需要是添加新的宏命令,所以只需覆寫set_context方法即可,記得執行父類的方法!
    def set_context(self, **kwargs: Any) -> None:
      	# 執行父類的方法,
        super().set_context(**kwargs)
        # 更新context
        self._context.update(
            {
              	# 鍵值是宏命令運算式
              	# 值一定要寫為partial(safe_proxy, func, args),否則父類在更新context會拋出安全例外
                "tenants": partial(safe_proxy, tenants),
            }
        )

添加后,重啟服務,就可以去Row level security添加新增的宏命令了:

tenant IN ({{ "'" + "','".join(tenants()) + "'" }})

補充說明

任何TemplateProcessor都是單例模式,所以不要在這個類中保存與請求或執行緒相關的狀態,

目前租戶資訊是保存在服務session(記憶體)中,后期也可以優化為redis,或是持久化到Superset的資料庫,在每次登錄時更新下,

小結

本篇博客主要是指導如何使用Superset介入OAuth 2.0鑒權服務并從其下的資源服務獲取相關資訊,以及如何添加自定義的宏命令,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/418078.html

標籤:其他

上一篇:Python實作12306自動搶火車票功能

下一篇:go tool - 快速生成CHANGELOG.md

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more