主頁 > 後端開發 > SQL:用有效的from/有效的to欄位連接表

SQL:用有效的from/有效的to欄位連接表

2021-10-17 17:35:28 後端開發

我在我們的Postgresql資料庫中面臨一個非常普遍的問題。許多表都包含只在一段時間內有效的條目,例如,可能會隨著時間的推移而變化的合同細節。

為了處理這個問題,我們提供了兩個欄位,valid fromvalid to,以表明行內容的有效期。每當一個合同發生變化時,就會有一行被添加到表中,其中包含實際的資訊和相應的有效日期。

主要的問題出現在對具有重疊有效期的表進行連接時。更確切地說,給定第一個表:

fg valid_from valid_to attr_table1
key1 2020-01-01-18 A
key1 2020-01-19 null B
key2 2020-01-01-30 A
key2 2020-0130 null B

和第二個表

fg valid_from valid_to attr_table2
key1 20200101 2020-01-10 1。 0
key1 2020-01-10 null 3.0
key2 20200101 2020-01-30 10。 0
key2 2020-01-30 null 11.

我想建立一個帶有有效期欄位的聯接表,該欄位嵌入了兩個表的有效期,例如:

我想建立一個帶有有效期欄位的聯接表,該欄位嵌入了兩個表的有效期。

fg valid_from valid_to attr_table1 attr_table2
key1 20200101 2020-01-10 A 1. 0
key1 20200110 2020-01-18 A 3。 0
key1 2020-01-18 null B 3.
key2 20200101 2020-01-30 A 10. 0
key2 2020-01-30 null B 11.0

直到現在,我最有說服力的嘗試是切換到Postgresql特有的型別daterange,并使用&&運算子("有公共點")。我把valid fromvalid to兩個欄位都串聯到一個validity欄位中,接下來的查詢似乎可以完成這個作業:

select t1.fg。
       (case when upper(t1.validity) is null
             then case when (upper(t2. validity) is null) 
                       then case when lower(t1. validity) > lower(t2.validity) 
                                 then daterange(lower(t1.validity), null)
                                 else daterange(lower(t2.validity), null)
                                 結束else case when lower(t1. validity) > lower(t2.validity) 
                                 then daterange(lower(t1.validity), upper(t2.validity) 
                                 else daterange(lower(t2.validity), upper(t2.validity) 
                                 結束end
             when upper(t2.validity) is null
             then case when (upper(t1. validity) is null) 
                       then case when lower(t1. validity) > lower(t2.validity) 
                                 then daterange(lower(t1.validity), null)
                                 else daterange(lower(t2.validity), null)
                                 結束else case when lower(t1. validity) > lower(t2.validity) 
                                 then daterange(lower(t1.validity), upper(t1.validity) 
                                 else daterange(lower(t2.validity), upper(t1.validity) 
                                 結束end
             when lower(t1.validity) <= lower(t2.validity)
             then case when upper(t1. validity) >= upper(t2.validity) 
                       then daterange(lower(t2.validity), upper(t2.validity)
                       else daterange(lower(t2.validity), upper(t1.validity)
                       結束else case when upper(t1. validity) >= upper(t2.validity) 
                       then daterange(lower(t1.validity), upper(t2.validity)
                       else daterange(lower(t1.validity), upper(t1.validity)
                       結束結束 
            ) as validity,
       t1.attr_table1, 
       t2.attr_table2
  from table1 as t1 
       join table2 as t2
         on t1.fg = t2.fg
        and t1.validity && t2.validity
order by fg, validity

然而,當第一個表的起點與第二個表的任何條目不匹配時,這個查詢就會失敗。例如,在第一個和第二個表中有一個額外的行,比如

在表1中:

key1 2019-12-25 2020-01-01 A

在表2中:

key1 2019-12-27 2020-01-01 -1

結果輸出表的第一行是

key1 2019-12-27 2020-01-01 A -1

而不是

key1 20191225 20191227 A null
key1 20191227 2020-01-01 A -1 

有誰知道有更好的方法嗎?

編輯:依靠daterange創建table1和table2的代碼:

create table table1
( 
  fg文本。
  validity daterange, 
  attr_table1 text
);
insert into table1 
values[/span
('key1', daterange('2020-01-01', '2020-01-18'), 'A') 。
('key1', daterange('2020-01-18', null ) , 'B')。
('key2'/span>, daterange('2020-01-01'/span>, '2020-01-30'/span>), 'A'/span>)。
('key2', daterange('2020-01-30', null ) , 'B')

并且

create table table2
( 
  fg文本。
  validity daterange,  
  attr_table2 text
);
insert into table2 
values[/span
('key1', daterange('2020-01-01', '2020-01-10'), 1.0) 。
('key1', daterange('2020-01-10', null ) , 3.0)。
('key2', daterange('2020-01-01', '2020-01-30'), 10.0) 。
('key2', daterange('2020-01-30', null ) ,11.0)

uj5u.com熱心網友回復:

趕著去參加下一次會議,稍后會寫一個解釋,但現在......

  • 主要是依賴一個人的力量。
  • 主要依賴于行與行之間沒有任何空隙
  • 也依賴于attrib1或attrib2的值從不為空(空值會被替換成之前的非空值)
  • 給...

    with
      合并AS
    (
      select fg, lower(validity) AS valid_from, attr_table1, NULL as attr_table2 from table1
      unionall
      select fg, lower(validity) AS valid_from, NULL AS attr_table1, attr_table2 from table2
    ),
      聚合 AS
    (
      select
        fg,
        valid_from,
        max(attr_table1) asattr_table1,
        max(attr_table2) asattr_table2,
        count(max(attr_table1)) over (partition by fg order by valid_from) attrib1_grp,
        count(max(attr_table2) over (partition by fg order by valid_from) Attrib2_grp
      來自
        組合
       by
        fg,
        有效來自
    )
    SELECT 
      fg,
      valid_from,
      lead(valid_from) overpartition by fg order by valid_from) as valid_to,
      max(attr_table1) over (partition by fg, attrib1_grp) as attr_table1,
      max(attr_table2) over (partition by fg,attrib2_grp) as attr_table2
    來自的
      聚合的
    order by 
      fg,
      有效來自
    

    演示。https://dbfiddle.uk/?rdbms=postgres_13&fiddle=7d97c9623e5f9efb4d729775ff61e7b5












    編輯:

    上面的代碼依賴于這樣一個前提:如果一個鍵的屬性在either表中發生變化,結果集也需要在該日期發生變化。

    這意味著我們只需聯合兩個表,只保留 valid_from,并使用 LEAD() 計算 valid_to(它有時會從同一個表中獲取 valid_from,有時從另一個表中獲取)

    這就在屬性列中留下了一堆空值。 如果attrib1發生變化,attrib2將在聯合的集合中成為NULL,反之亦然。

    要填補這些空值,需要回顧新的時間序列,以找到該屬性的最新的NOT NULL值。 由于LAST_VALUE()沒有一個SKIP NULLS選項,我自己做了一個......

    • 有一個累積的計數器,用于記錄屬性被NOT NULL的次數,并將其作為一個組的識別符號
    • 根據定義,組中的第一個屬性將是NOT NULL,而所有的行將是NULL
    • 因此,采取MAX(attributee)的組允許我得到所有NULL行的前NOT NULL

    這個演示讓我們更容易看到計算的發生......

    這個演示讓我們更容易看到計算的發生。












    編輯:

    認為這現在可以在間隙(屬性被隱式設定為NULL)和行(屬性被顯式設定為NULL)中作業。

    • 假設沒有兩個人被設定為 "NULL"。
    • 假設沒有兩行(相同的鍵,相同的表)開始于同一日期
      • 如果發生了這種情況,那么就會有兩行(相同的鍵,相同的表)在同一日期開始
      • 如果發生了這種情況,該屬性將選擇該日期的MAX()值
    • 假設在前一行(相同的鍵,相同的表)結束之前,沒有行可以開始。
      • 如果發生這種情況,就會回傳胡言亂語

    (盡管我建議進行更嚴格的測驗......)

    with
      組合(
        fg, valid_from, attr_table1, attr_table2, atrib1_set, atrib2_set
      ) AS[/span
    (
      select fg, lower(validity), attr_table1, NULL , 1, NULL: :int from table1
      unionall
      select fg, upper(validity), NULLNULL , 1, NULL: :int from table1
      unionall
      select fg, lower(validity), NULL , attr_table2, NULL, 1 from table2
      unionall
      select fg, upper(validity), NULL , NULL , NULL, 1 from table2
    ),
      聚合 AS
    (
      選擇 
        fg,
        valid_from,
        max(attr_table1) asattr_table1,
        max(attr_table2) asattr_table2,
        count(max(atrib1_set) over (partition by fg order by valid_from) attrib1_grp,
        count(max(atrib2_set) over (partition by fg order by valid_from) Attrib2_grp
      來自
        組合
      where
        valid_from is not null
      group by
        fg,
        有效的_from
    )
    SELECT[/span
      fg,
      valid_from,
      lead(valid_from) overpartition by fg order by valid_from) as valid_to,
      max(attr_table1) over (partition by fg, attrib1_grp) as attr_table1,
      max(attr_table2) over (partition by fg,attrib2_grp) as attr_table2
    來自的
      聚合的
    order by 
      fg,
      有效來自
    

    演示:

    uj5u.com熱心網友回復:

    [UPDATE]

    • fg
    • 制作一個所有現有時間跨度的日歷表。
    • LEFT連接表1和表2到這個表
    • [為了便于比較,我把valid_to的NULL改為infinity]/li>

    create table table1 ( fg文本。 validity daterange, attr_table1 text ); insert into table1 values[/span ('key1', daterange('2019-12-25', '2020-01-01'), 'A'), --NEW ('key1'/span>, daterange('2020-01-01'/span>, '2020-01-18'/span>), 'A'/span>)。 ('key1', daterange('2020-01-19', '無窮大' ), 'B') 。 ('key2'/span>, daterange('2020-01-01'/span>, '2020-01-30'/span>), 'A'/span>)。 ('key2', daterange('2020-01-30', '無窮大' ), 'B') 。 創建 表格 table2 ( fg文本。 有效性daterange。 attr_table2 text ); insert into table2 values[/span ('key1', daterange('2019-12-27', '2020-01-01'), -1 ) , -- NEW ('key1', daterange('2020-01-01', '2020-01-10'), 1.0) 。 ('key1', daterange('2020-01-10', '無窮大' ), 3.0)。 ('key2', daterange('2020-01-01', '2020-01-30'), 10.0) 。 ('key2', daterange('2020-01-30', '無窮大' ), 11.0)。 --制作一個包含所有時間點的'CALENDAR'表(每個fg)-- --------------------------------------------------------- WITH pits AS ( select distinct fg, lower(validity) as pit FROM table1 UNION[/span]。 select distinct fg, upper(validity) as pit FROM table1 UNION[/span]。 select distinct fg, lower(validity) as pit FROM table2 UNION[/span]。 select distinct fg, upper(validity) as pit FROM table2 ) --結合所有相鄰的PITs到范圍-- --------------------------------------- ,對AS ( SELECT fg, pit as opit , lead(pit) OVERPARTITION BY fg ORDER BY pit) AS npit from pits ) -- 從它們中做出dateranges-- -------------------------- , tablex AS ( SELECT fg , daterange(opit,npit) AS validity FROMWHERE npit IS NOT NULL-- ORDER BY 1,2; ) --左鍵連接table1和table2到all_rages-- ---------------------------------------------- SELECT tx.fg , tx.validity , t1.validity * t2.validity AS overlapped , t1.attr_table1 , t2.attr_table2 FROM tablex tx LEFT JOIN table1 t1 ON t1. fg = tx.fg AND t1.validity &&/span> tx.validity LEFT JOIN table2 t2 ON t2. fg = tx.fg AND t2.validity &&/span> tx.validity ORDER BY 1,2 ;

    結果:


    DROP SCHEMA
    CREATE SCHEMA
    SET[/span
    CREATE TABLE
    INSERT 0 5
    CREATE TABLE
    INSERT 0 5
      fg | validity | overlapped | attr_table1 | attr_table2 
    ------ ------------------------- ------------------------- ------------- -------------
     key1 | [20191225, 2019-12-27) | | A | 
     key1 | [20191227, 2020-01-01) | [20191227, 2020-01-01) | A | -1
     key1 | [2020-01-012020-01-10) | [2020-01-01, 2020-01-10) | A | 1.0
     key1 | [20200110, 2020-0118) | [2020-01-10, 2020-0118) | A |  3.0
     key1 | [20200118, 2020-01-19) | | | 3.0
     key1 | [20200119, infinity) | [2020-01-19, infinity) | B | 3. 0
     key2 | [20200101, 2020-0130) | [2020-01-01, 2020-0130) | A | 10.0
     key2 | [20200130, infinity) | [20200130, infinity) | B | 11. 0
    (8 rows)
    

    轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/320145.html

    標籤:

    上一篇:postgresql的頂值多重連接

    下一篇:如何用唯一的用戶ID連接兩個資料框架

    標籤雲
    其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

    熱門瀏覽
    • 【C++】Microsoft C++、C 和匯編程式檔案

      ......

      uj5u.com 2020-09-10 00:57:23 more
    • 例外宣告

      相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

      uj5u.com 2020-09-10 00:57:27 more
    • Codeforces 1400E Clear the Multiset(貪心 + 分治)

      鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

      uj5u.com 2020-09-10 00:57:30 more
    • UVA11610 【Reverse Prime】

      本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

      uj5u.com 2020-09-10 00:57:36 more
    • 統計區間素數數量

      1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

      uj5u.com 2020-09-10 00:57:47 more
    • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

      1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

      uj5u.com 2020-09-10 00:58:04 more
    • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

      1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

      uj5u.com 2020-09-10 00:59:11 more
    • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

      1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

      uj5u.com 2020-09-10 01:00:19 more
    • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

      今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

      uj5u.com 2020-09-10 01:00:22 more
    • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

      眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

      uj5u.com 2020-09-10 01:00:41 more
    最新发布
    • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

      Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

      uj5u.com 2023-04-20 07:24:10 more
    • Java的值傳遞和參考傳遞

      值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

      uj5u.com 2023-04-20 07:24:04 more
    • [2]SpinalHDL教程——Scala簡單入門

      第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

      uj5u.com 2023-04-20 07:23:58 more
    • 理解函式指標和回呼函式

      理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

      uj5u.com 2023-04-20 07:23:52 more
    • Django筆記二十五之資料庫函式之日期函式

      本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

      uj5u.com 2023-04-20 07:23:45 more
    • 一天吃透JVM面試八股文

      什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

      uj5u.com 2023-04-20 07:23:31 more
    • 使用Java接入小程式訂閱訊息!

      更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

      uj5u.com 2023-04-20 07:22:59 more
    • java -- 緩沖流、轉換流、序列化流

      緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

      uj5u.com 2023-04-20 07:22:49 more
    • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

      老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

      uj5u.com 2023-04-20 07:22:42 more
    • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

      教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

      uj5u.com 2023-04-20 07:22:35 more