目錄
- 一、聚集函式
- 1.1 AVG() 函式
- 1.2 COUNT() 函式
- 1.3 MAX() 函式
- 1.4 MIN() 函式
- 1.5 SUM() 函式
- 二、聚集不同值
- 三、組合聚集函式
- 四、小結
本文介紹什么是 SQL 的聚集函式,如何利用它們匯總表的資料,這些函式很高效,它們回傳結果一般比你在自己的客戶端應用程式中計算要快得多,
一、聚集函式
我們經常需要匯總資料而不用把它們實際檢索出來,為此 SQL 提供了專門的函式,使用這些函式,SQL 查詢可用于檢索資料,以便分析和報表生成,這種型別的檢索例子有:
- 確定表中行數(或者滿足某個條件或包含某個特定值的行數);
- 獲得表中某些行的和;
- 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值,
上述例子都需要匯總出表中的資料,而不需要查出資料本身,因此,回傳實際表資料純屬浪費時間和處理資源(更不用說帶寬了),再說一遍,我們實際想要的是匯總資訊,
為方便這種型別的檢索,SQL 給出了 5 個聚集函式,見表 1,這些函式能進行上述檢索,與 SQL 如何使用函式處理資料 介紹的資料處理函式不同,SQL 的聚集函式在各種主要 SQL 實作中得到了相當一致的支持,
聚集函式(aggregate function)
對某些行運行的函式,計算并回傳一個值,
表 1 SQL 聚集函式
| 函式 | 說明 |
|---|---|
AVG() |
回傳某列的平均值 |
COUNT() |
回傳某列的行數 |
MAX() |
回傳某列的最大值 |
MIN() |
回傳某列的最小值 |
SUM() |
回傳某列值之和 |
下面說明各函式的使用,
1.1 AVG() 函式
AVG() 通過對表中行數計數并計算其列值之和,求得該列的平均值,AVG() 可用來回傳所有列的平均值,也可以用來回傳特定列或行的平均值,
下面的例子使用 AVG() 回傳 Products 表中所有產品的平均價格:
SELECT AVG(prod_price) AS avg_price
FROM Products;
輸出:
avg_price
-------------
6.823333
此 SELECT 陳述句回傳值 avg_price,它包含 Products 表中所有產品的平均價格,如 SQL 如何創建計算欄位 中所述,avg_price 是一個別名,
AVG() 也可以用來確定特定列或行的平均值,下面的例子回傳特定供應商所提供產品的平均價格:
SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
輸出:
avg_price
-----------
3.8650
這條 SELECT 陳述句與前一條的不同之處在于,它包含了 WHERE 子句,此 WHERE 子句僅過濾出 vend_id 為 DLL01 的產品,因此 avg_price 中回傳的值只是該供應商產品的平均值,
注意:只用于單個列
AVG()只能用來確定特定數值列的平均值,而且列名必須作為函式引數給出,為了獲得多個列的平均值,必須使用多個AVG()函式,只有一個例外是要從多個列計算出一個值時,本問后面會講到,
說明:
NULL值
AVG()函式忽略列值為NULL的行,
1.2 COUNT() 函式
COUNT() 函式進行計數,可利用 COUNT() 確定表中行的數目或符合特定條件的行的數目,
COUNT() 函式有兩種使用方式:
- 使用
COUNT(*)對表中行的數目進行計數,不管表列中包含的是空值(NULL)還是非空值, - 使用
COUNT(column)對特定列中具有值的行進行計數,忽略NULL值,
下面的例子回傳 Customers 表中顧客的總數:
SELECT COUNT(*) AS num_cust
FROM Customers;
輸出:
num_cust
--------
5
在此例子中,利用 COUNT(*) 對所有行計數,不管行中各列有什么值,計數值在 num_cust 中回傳,
下面的例子只對具有電子郵件地址的客戶計數:
SELECT COUNT(cust_email) AS num_cust
FROM Customers;
輸出:
num_cust
--------
3
這條 SELECT 陳述句使用 COUNT(cust_email) 對 cust_email 列中有值的行進行計數,在此例子中,cust_email 的計數為 3(表示 5 個顧客中只有 3 個顧客有電子郵件地址),
說明:
NULL值如果指定列名,則
COUNT()函式會忽略指定列的值為NULL的行,但如果COUNT()函式中用的是星號(*),則不忽略,
1.3 MAX() 函式
MAX() 回傳指定列中的最大值,MAX() 要求指定列名,如下所示:
SELECT MAX(prod_price) AS max_price
FROM Products;
輸出:
max_price
----------
11.9900
這里,MAX() 回傳 Products 表中最貴物品的價格,
提示:對非數值資料使用
MAX()雖然
MAX()一般用來找出最大的數值或日期值,但許多(并非所有)DBMS 允許將它用來回傳任意列中的最大值,包括回傳文本列中的最大值,在用于文本資料時,
MAX()回傳按該列排序后的最后一行,
說明:
NULL值
MAX()函式忽略列值為NULL的行,
1.4 MIN() 函式
MIN() 的功能正好與 MAX() 功能相反,它回傳指定列的最小值,與 MAX() 一樣,MIN() 要求指定列名,如下所示:
SELECT MIN(prod_price) AS min_price
FROM Products;
輸出:
min_price
----------
3.4900
其中 MIN() 回傳 Products 表中最便宜物品的價格,
提示:對非數值資料使用
MIN()雖然
MIN()一般用來找出最小的數值或日期值,但許多(并非所有)DBMS 允許將它用來回傳任意列中的最小值,包括回傳文本列中的最小值,在用于文本資料時,
MIN()回傳該列排序后最前面的行,
說明:
NULL值
MIN()函式忽略列值為NULL的行,
1.5 SUM() 函式
SUM() 用來回傳指定列值的和(總計),
下面舉一個例子,OrderItems 包含訂單中實際的物品,每個物品有相應的數量,可如下檢索所訂購物品的總數(所有 quantity 值之和):
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;
輸出:
items_ordered
----------
200
函式 SUM(quantity) 回傳訂單中所有物品數量之和,WHERE 子句保證只統計某個物品訂單中的物品,
SUM() 也可以用來合計計算值,在下面的例子中,合計每項物品的 item_price*quantity,得出總的訂單金額:
SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;
輸出:
total_price
----------
1648.0000
函式 SUM(item_price*quantity) 回傳訂單中所有物品價錢之和,WHERE 子句同樣保證只統計某個物品訂單中的物品,
提示:在多個列上進行計算
如本例所示,利用標準的算術運算子,所有聚集函式都可用來執行多個列上的計算,
說明:
NULL值
SUM()函式忽略列值為NULL的行,
二、聚集不同值
以上 5 個聚集函式都可以如下使用,
- 對所有行執行計算,指定
ALL引數或不指定引數(因為ALL是默認行為), - 只包含不同的值,指定
DISTINCT引數,
提示:
ALL為默認
ALL引數不需要指定,因為它是默認行為,如果不指定DISTINCT,則假定為ALL,
下面的例子使用 AVG() 函式回傳特定供應商提供的產品的平均價格,它與上面的 SELECT 陳述句相同,但使用了 DISTINCT 引數,因此平均值只考慮各個不同的價格:
SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
輸出:
avg_price
-----------
4.2400
可以看到,在使用了 DISTINCT 后,此例子中的 avg_price 比較高,因為有多個物品具有相同的較低價格,排除它們提升了平均價格,
注意:
DISTINCT不能用于COUNT(*)如果指定列名,則
DISTINCT只能用于COUNT(),DISTINCT不能用于COUNT(*),類似地,DISTINCT必須使用列名,不能用于計算或運算式,
提示:將
DISTINCT用于MIN()和MAX()雖然
DISTINCT從技術上可用于MIN()和MAX(),但這樣做實際上沒有價值,一個列中的最小值和最大值不管是否只考慮不同值,結果都是相同的,
說明:其他聚集引數
除了這里介紹的
DISTINCT和ALL引數,有的 DBMS 還支持其他引數,如支持對查詢結果的子集進行計算的TOP和TOP PERCENT,為了解具體的 DBMS 支持哪些引數,請參閱相應的檔案,
三、組合聚集函式
目前為止的所有聚集函式例子都只涉及單個函式,但實際上,SELECT 陳述句可根據需要包含多個聚集函式,請看下面的例子:
SELECT COUNT(*) AS num_items,
MIN(prod_price) AS price_min,
MAX(prod_price) AS price_max,
AVG(prod_price) AS price_avg
FROM Products;
輸出:
num_items price_min price_max price_avg
---------- --------------- --------------- ---------
9 3.4900 11.9900 6.823333
這里用單條 SELECT 陳述句執行了 4 個聚集計算,回傳 4 個值(Products 表中物品的數目,產品價格的最高值、最低值以及平均值),
注意:取別名
在指定別名以包含某個聚集函式的結果時,不應該使用表中實際的列名,雖然這樣做也算合法,但許多 SQL 實作不支持,可能會產生模糊的錯誤訊息,
四、小結
聚集函式用來匯總資料,SQL 支持 5 個聚集函式,可以用多種方法使用它們,回傳所需的結果,這些函式很高效,它們回傳結果一般比你在自己的客戶端應用程式中計算要快得多,
原文鏈接:https://www.developerastrid.com/sql/sql-summarizing-data/
(完)
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/472940.html
標籤:其他
上一篇:如何使用 SQL 函式處理資料
