主頁 > 軟體設計 > SQL優化終于干掉了“distinct”

SQL優化終于干掉了“distinct”

2020-10-09 05:11:38 軟體設計

SQL優化之多表聯合查詢干掉“distinct”去重關鍵字

  • 一、優化目的
  • 二、優化之前的sql長這樣
  • 三、DISTINCT關鍵字的用法
  • 四、談:如何優化distinct的sql
  • 五、distinct真的和group by等價嗎?
  • 六、優化后的sql長啥樣?
  • 七、總結

一、優化目的

在我提交了代碼的時候,架構師給我指出我這個sql這樣寫會有問題,因為在分庫分表的時候,是不支持子查詢的,

所以需要把多表的子查詢的sql結構進行優化,

二、優化之前的sql長這樣

是不是挺恐怖的;(此處為了脫敏,我把相關的sql關鍵詞都給打碼掉了)

在這里插入圖片描述
這個sql的執行步驟如下:
1、查詢出來d表中的某個id欄位包含多個id值的所有的資料(因為此表是1-n的關系,所以需要去重,僅需要拿到不重復的id才可以繼續下一個步驟);可以看到此步驟我把查詢出來的多個值的結果給生成的了一個子表名為sss;

2、下一個步驟就是需要進行排序(以時間進行倒序排序,因為要在前臺進行按時間進行展示);

3、第3步就是把這些結果與a表進行合并,查詢出來排序后的每個id的資訊;然后進行分頁處理;

其他的可以不必關心,最終要的是去重關鍵字(DISTINCT),拿小本本記號,一會要考哦,

三、DISTINCT關鍵字的用法

實踐是驗證真理的唯一標準

例如有下表:

可以看到nameproduct_unit列有可能是重復的

mysql> SELECT t1.id,t1.name,t1.product_unit  FROM dd_product_category t1;
+----+----------+--------------+
| id | name     | product_unit |
+----+----------+--------------+
| 55 | 飲料     ||
| 56 | 飲料     ||
| 57 | 零食     ||
| 59 | 膨化食品 ||
| 60 | 方便食品 ||
| 61 | 自熱火鍋 ||
| 62 | 方便面   ||
| 63 | 礦泉水   ||
| 64 | 糖果     |              |
| 65 | 酒類     ||
| 66 | 烈酒     ||
| 67 | 啤酒     ||
| 68 | 預調酒   ||
+----+----------+--------------+
13 rows in set (0.13 sec)

mysql> 
mysql> 

如何我們想只拿到name或者product_unit列的值并且不想要重復的值該怎么辦?

1、拿到單個值是好拿的,但是是存在重復的資料的,這些重復的資料我們只保留一個就可以了,那么該怎么做呢?


mysql> SELECT t1.product_unit  FROM dd_product_category t1;
+--------------+
| product_unit |
+--------------+
||
||
||
||
||
||
||
||
|              |
||
||
||
||
+--------------+
13 rows in set (19.31 sec)

mysql> 

2、去除重復列

mysql> 
mysql> SELECT DISTINCT t1.product_unit  FROM dd_product_category t1;
+--------------+
| product_unit |
+--------------+
||
||
||
||
||
|              |
+--------------+
6 rows in set (0.11 sec)

mysql> 

是不是很簡單,雖然看著簡單,但是如果多表子查詢的時候,就會出現問題,例如你想要查詢表a,b,c三個表的資料,這三個表必然都是有關系的,

a和b是1-n的關系,但是你只有b表中id,你需要先查詢出來b表的資料,然后利用b表的資料去查詢a表的資料,然后再去查詢c表的資料,

想必肯定是很繞的,

整個程序中你肯定是需要去重的

當整個sql寫完,基本上跟我寫的優化前的sql也就差不多了,(多表嵌套,多sql嵌套sql,啦啦啦一大堆),

優化思路還是有很多的,當時能想到的就是把這個復雜的sql拆分成多個簡單的sql執行,然后使用Java后臺代碼進行處理,(對于不甘于現狀的我,想找到一個比這個更友好的解決方案的我,我是不會屈服這個問題的,

四、談:如何優化distinct的sql

說到這里,先給大家放上一個鏈接:

  • 1、(Mysql5.7官方手冊中提及到的關于優化distinct的方法)
    https://dev.mysql.com/doc/refman/5.7/en/distinct-optimization.html

  • 2、還有一個優化group by的:
    https://dev.mysql.com/doc/refman/5.7/en/group-by-optimization.html

推薦大家閱讀,

Mysql5.7官方手冊中提及到的關于優化distinct的方法,原文如下:

MySQL 5.7 Reference Manual / … / DISTINCT Optimization

8.2.1.16 DISTINCT Optimization

DISTINCT combined with ORDER BY needs a temporary table in many cases.

distinct 與order by 結合的許多情況下需要建一個臨時表;

Because DISTINCT may use GROUP BY, learn how MySQL works with columns in ORDER BY or HAVING clauses that are not part of the selected columns. See Section 12.20.3, “MySQL Handling of GROUP BY”.

因為distinct可能使用group by,了解MySQL如何處理按order by 列或者具有不屬于所選列的子句,見12.20.3節, “MySQL Handling of GROUP BY”.

In most cases, a DISTINCT clause can be considered as a special case of GROUP BY. For example, the following two queries are equivalent:

在大多數情況下,一個不同的子句可以被認為是group by 的特殊情況,例如下面這兩個查詢是等價的:

SELECT DISTINCT c1, c2, c3 FROM t1
WHERE c1 > const;
SELECT c1, c2, c3 FROM t1
WHERE c1 > const GROUP BY c1, c2, c3;

Due to this equivalence, the optimizations applicable to GROUP BY queries can be also applied to queries with a DISTINCT clause. Thus, for more details on the optimization possibilities for DISTINCT queries, see Section 8.2.1.15, “GROUP BY Optimization”.

由于這種等價性,適用于group by查詢的優化,也可以應用于具有不同子句的查詢,因此,關于distinct的查詢優化的更多細節可以參考Section 8.2.1.15, “GROUP BY Optimization”.

When combining LIMIT row_count with DISTINCT, MySQL stops as soon as it finds row_count unique rows.

當row_count與distinct一起使用時,MySQL一旦發現row_count是唯一的行,就會停止,

If you do not use columns from all tables named in a query, MySQL stops scanning any unused tables as soon as it finds the first match. In the following case, assuming that t1 is used before t2 (which you can check with EXPLAIN), MySQL stops reading from t2 (for any particular row in t1) when it finds the first row in t2:

如果在查詢中不適用來自所有表的列,MySQL一旦找到第一個匹配項就會停止掃描任何未使用的表,

在下面的例子中,假設t1在t2之前使用(你可以使用explanin來檢查),MySQL在找到t2的第一行時停止從t2讀取(對于t1中的任何特定行),

SELECT DISTINCT t1.a FROM t1, t2 where t1.a=t2.a;

官方的手冊中寫到的,真是句句扣心呀!!!

總結有以下比較重要的幾點:

  • 1、distinct與group by幾乎等價;
  • 2、distinct的相關優化與group by的查詢優化方法是等價的;

五、distinct真的和group by等價嗎?

我們抱著試試看的態度,去做個試驗,

就以下列這個效果為最終目的好了:

mysql> 
mysql> SELECT DISTINCT t1.product_unit  FROM dd_product_category t1;
+--------------+
| product_unit |
+--------------+
||
||
||
||
||
|              |
+--------------+
6 rows in set (0.11 sec)

mysql> 

使用group by去重:

mysql> select  t1.product_unit from dd_product_category t1 group by t1.product_unit;
+--------------+
| product_unit |
+--------------+
|              |
||
||
||
||
||
+--------------+
6 rows in set (19.46 sec)

mysql> 

可以看到,最終拿到的資料是一模一樣的,

那么我們試驗是成功的,distinct的效果和group by的效果是一樣的,

那么我們優化distinct就變向的去優化group by了(我優化前的sql并未使用group by所以談不上優化group by,只能說是把distinct的復雜sql改造成group by 的sql),

打開我前面提到的這個優化group by的官方手冊:
https://dev.mysql.com/doc/refman/5.7/en/group-by-optimization.html

由于原文比較長,這里就不在過多贅述,

現在需要做的就是把distinct改造成group by的sql語法的寫法,

六、優化后的sql長啥樣?

怎么樣,改造后的sql,是不是還挺清爽的,

1、我們扔掉了多個嵌套sql

2、也不用去生成一個sss的臨時表了

在這里插入圖片描述

七、總結

對于本人而言學到了:

  • 1、distinct與group by幾乎等價;
  • 2、distinct的相關優化與group by的查詢優化方法是等價的;
  • 3、如果distinct的不能讓sql最優化,那么可以嘗試著使用group by的方式去改造一下,

這些我都上傳到了百度云,
在這里插入圖片描述

為了防止鏈接丟失可以關注公眾號,回復:"mysql",即可拿到MySQL相關的全部精彩內容,

歡迎一起學習,一起交流,一起進步,

關注我微信公眾號第一時間推送給你精彩內容哦:

回復選單,更有好禮,驚喜在等著你,

在這里插入圖片描述

快來我粉絲群:每天歡快的玩耍(微信掃描二維碼即可加入,群馬上滿,抓緊啦!!!)
在這里插入圖片描述

TrueDei CSDN認證博客專家 Linux 分布式 Java
不荒廢現在,不畏懼未來!我認為把知識給別人講會,講明白,自己才徹底明白,努力把文章寫好,寫明白每一篇文章,分享給更多人,

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/164009.html

標籤:其他

上一篇:優質高效!阿里新產架構進階手冊,Github已星標71.6k

下一篇:花費我一個多月時間整理出這“全程高能得Java面試題合集”面試首選,跳槽必備!誠意之作,收藏不虧!

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more