在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作,
而在所有查詢操作中,統計數量操作更是經常被用到,
關于資料庫中行數統計,無論是MySQL還是Oracle亦或者是SqlServer,都有一個函式可以使用,那就是COUNT,
而對于COUNT,有幾個問題很值得去思考:
1、COUNT有幾種用法?
2、COUNT(欄位名)和COUNT()的查詢結果有什么不同?
3、COUNT(1)和COUNT()之間有什么不同?
4、COUNT(1)和COUNT()之間的效率哪個更高?
5、為什么《阿里巴巴Java開發手冊》建議使用COUNT()
6、MySQL的MyISAM引擎對COUNT()做了哪些優化?
7、MySQL的InnoDB引擎對COUNT()做了哪些優化?
8、上面提到的MySQL對COUNT()做的優化,有一個關鍵的前提是什么?
9、SELECT COUNT() 的時候,加不加where條件有差別嗎?
10、COUNT()、COUNT(1)和COUNT(欄位名)的執行程序是怎樣的?
如果以上10道題,全部準確無誤的回答的話,那說明你真的很了解COUNT函式了,如果有哪些知識點是不了解的,那么本文正好可以重新幫你認識一下Count,也為資料庫優化做一些思考,
認識COUNT
關于COUNT函式的介紹:
1、COUNT(expr) ,回傳SELECT陳述句檢索的行中expr的值不為NULL的數量,結果是一個BIGINT值,
2、如果查詢結果沒有命中任何記錄,則回傳0
3、但是,值得注意的是,COUNT() 的統計結果中,會包含值為NULL的行數,
例:
create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)
使用陳述句count(),count(id),count(id2)查詢結果如下:
select count(),count(id),count(id2)
from #bla
results 7 3 2
除了COUNT(id)和COUNT()以外,還可以使用COUNT(常量)(如COUNT(1))來統計行數,那么這三條SQL陳述句有什么區別呢?
到底哪種效率更高呢?
為什么《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代COUNT()呢?

COUNT(列名)、COUNT(常量)和COUNT()之間的區別
前面我們提到過COUNT(expr)用于做行數統計,統計的是expr不為NULL的行數,那么COUNT(列名)、 COUNT(常量) 和 COUNT()這三種語法中,expr分別是列名、 常量 和 ,
那么列名、 常量 和 這三個條件中,常量是一個固定值,肯定不為NULL,
可以理解為查詢整行,所以肯定也不為NULL,那么就只有列名的查詢結果有可能是NULL了,
所以, COUNT(常量) 和 COUNT()表示的是直接查詢符合條件的資料庫表的行數,
而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數,
除了查詢得到結果集有區別之外,COUNT()相比COUNT(常量) 和 COUNT(列名)來講,COUNT()是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL資料庫對他進行過很多優化,
SQL92,是資料庫的一個ANSI/ISO標準,
它定義了一種語言(SQL)以及資料庫的行為(事務、隔離級別等),
COUNT()的優化
前面提到了COUNT()是SQL92定義的標準統計行數的語法,所以MySQL資料庫對他進行過很多優化,
那么,具體都做過哪些事情呢?
這里的介紹要區分不同的執行引擎,
MySQL中比較常用的執行引擎就是InnoDB和MyISAM,MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT()有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;
而InnoDB支持事務,并且支持行級鎖,
因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串行進行,所以,MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT()進行查詢的時候,可以直接回傳這個記錄下來的數值就可以了,當然,前提是不能有where條件,
MyISAM之所以可以把表中的總行數記錄下來供COUNT()查詢使用,那是因為MyISAM資料庫是表級鎖,不會有并發的資料庫行數修改,所以查詢得到的行數是準確的,
但是,對于InnoDB來說,就不能做這種快取操作了,因為InnoDB支持事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被并發修改,那么快取記錄下來的總行數就不準確了,
但是,InnoDB還是針對COUNT()陳述句做了些優化的,
在InnoDB中,使用COUNT()查詢行數的時候,不可避免的要進行掃表了,那么,就可以在掃表程序中下功夫來優化效率了,
從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT() FROM tblname陳述句,確實在掃表的程序中做了一些優化,
前提是查詢陳述句中不包含WHERE或GROUP BY等條件,
我們知道,COUNT()的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,他如果能夠在掃表的程序中,選擇一個成本較低的索引進行的話,那就可以大大節省時間,
我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值,
所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表,
當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的,
至此,我們介紹完了MySQL資料庫對于COUNT()的優化,這些優化的前提都是查詢陳述句中不包含WHERE以及GROUP BY條件,
COUNT()和COUNT(1)
介紹完了COUNT(),接下來看看COUNT(1),對于,這二者到底有沒有區別,網上的說法眾說紛紜,
有的說COUNT()執行時會轉換成COUNT(1),所以COUNT(1)少了轉換步驟,所以更快,
還有的說,因為MySQL針對COUNT()做了特殊優化,所以COUNT()更快,
那么,到底哪種說法是對的呢?
看下MySQL官方檔案是怎么說的:
InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference.
畫重點:
same way , no performance difference,
所以,對于COUNT(1)和COUNT(),MySQL的優化是完全一樣的,根本不存在誰比誰快!
那既然COUNT()和COUNT(1)一樣,建議用哪個呢?
建議使用COUNT()!
因為這個是SQL92定義的標準統計行數的語法,而且本文只是基于MySQL做了分析,關于Oracle中的這個問題,也是眾說紛紜的呢,
COUNT(欄位)
最后,就是我們一直還沒提到的COUNT(欄位),他的查詢就比較簡單粗暴了,就是進行全表掃描,然后判斷指定欄位的值是不是為NULL,不為NULL則累加,相比COUNT(),COUNT(欄位)多了一個步驟就是判斷所查詢的欄位是否為NULL,所以他的性能要比COUNT()慢,
總結
本文介紹了COUNT函式的用法,主要用于統計表行數,
主要用法有COUNT()、COUNT(欄位)和COUNT(1),
因為COUNT()是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT()查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本,當然,這些優化的前提都是沒有進行where和group的條件查詢,
在InnoDB中COUNT()和COUNT(1)實作上沒有區別,而且效率一樣,但是COUNT(欄位)需要進行欄位的非NULL判斷,所以效率會低一些,
因為COUNT()是SQL92定義的標準統計行數的語法,并且效率高,所以請直接使用COUNT()查詢表的行數!*
本文來自木莊網路博客> 重新認識MySQL中的COUNT陳述句
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/31624.html
標籤:SQL Server
上一篇:SQL Server查詢代碼在哪個視圖、存盤程序、函式、觸發中使用過
下一篇:ms sql事務輸出錯誤
