一、資料庫命名規范
- 所有的資料庫物件名稱必須使用小寫字母并用下劃線表示,因為默認情況下,
mysql對大小寫敏感,mysql資料庫本質上是linux系統下的一個檔案,而linux系統是大小寫敏感的, - 所有資料庫物件名稱禁止使用
mysql保留關鍵字, - 資料庫物件的命名要能做到見名知意,并且最好不要超過
32個字符,太長不方便使用,并且會在傳輸時增加網路開銷, - 臨時表必須以
tmp_為前綴并以日期為后綴, - 備份表必須以
bak_為前綴并以日期為后綴, - 所有存盤相同資料的列名和列型別必須一致,比如
user表中的id和order表中的user_id,
二、資料庫基本設計規范
- 所有表必須使用
Innodb存盤引擎,極少數特殊業務需求除外,Innodb引擎是5.6之后的默認存盤引擎,mysql 5.5之前使用Myisam(默認存盤引擎),Innodb優點:支持事務,行級鎖,更好的恢復性,高并發下性能更好, - 資料庫和表的字符集統一使用
UTF-8,如果要存盤一些如表情符號的,還需使用UTF-8的拓展字符集,資料庫,表,欄位字符集一定要統一,統一字符集可以避免由于字符集轉換產生的亂碼,在mysql中UTF-8字符集,漢字占3位元組,ASCII碼占1位元組, - 所有表和欄位都需要添加注釋,良好的注釋能大大減少時間成本,
- 從一開始就進行資料字典的維護 ,即資料庫說明檔案,
- 盡量控制單表資料量大小,建議控制在
500萬以內,雖然500萬并不是mysql的資料庫限制,但是會給修改表結構,備份,恢復帶來很大困難,單表可存盤資料量大小取決于存盤設定和檔案系統,想減少單表資料量:歷史資料歸檔(常見于日志表),分庫分表(常見于業務表),磁區表,建議不要使用mysql磁區表,因為磁區表在物理上表現為多個檔案,在邏輯上表現為一個表,如果一定要磁區,請謹慎選擇磁區鍵,跨磁區查詢效率比查詢大資料量的單表查詢效率更低,建議采物理分表的方式管理大資料,但是對應用程式的開發要求和復雜度更高, - 盡量做到冷熱資料分離,減少表的寬度(欄位數) ,減少磁盤
IO,保證熱資料的記憶體快取命中率,更有效的利用快取,避免讀入無用的冷資料,這樣的話,就要對表的列進行拆分,將經常使用的列放到一個表中,可以避免過多的關聯操作,也可以提高查詢性能, - 禁止在表中建立預留欄位 ,預留欄位很難做到見名知義,預留欄位無法確定存盤的資料型別,后期如果修改欄位型別,會對全表鎖定,嚴重影響資料庫的并發性,對目前
mysql來說,修改一個欄位的成本要遠遠大于增加一個欄位的成本, - 禁止在資料庫中存盤圖片,檔案等二級制資料,這類資料如果要存,就得使用
blog或者text這樣的大欄位加以存盤,會影響資料庫的性能,檔案這種通常所占資料容量很大,會在短時間內造成資料庫檔案的快速增長,而資料庫在讀取資料時,會進行大量的隨機IO操作,如果資料檔案過大,IO操作會非常耗時,從而影響資料庫性能,正確做法是將這類資料存盤在檔案服務器中,而資料庫只存盤地址資訊, - 禁止在線上做資料庫壓力測驗,會對正常業務造成影響,也會產生很多垃圾資料,建議建立專門的壓力測驗資料庫,進行測驗,然后對比測驗服務器和線上服務器的硬體環境,評估線上資料庫的性能,
- 禁止從開發環境,測驗環境直連生產環境資料庫,
三、索引設計規范
Innodb中主鍵實質上是一個索引,
- 限制每張表上索引數量,建議單表不超過
5個索引,索引并不是越多越好,可以提高查詢效率,但是會降低插入和更新的效率,甚至在一些情況下,還會降低查詢效率,因為mysql優化器在選擇如何優化查詢時,會根據統計資訊,對每一個可用索引來進行評估,以生成一個最好的執行計劃,如果同時有很多索引都可以用于查詢,就會增加mysql查詢優化器生成查詢計劃的時間, - 每個
Innodb表都必須有一個主鍵,Innodb是一種索引索引組織表,是指資料存盤的邏輯順序和索引的順序是相同,Innodb是按照主鍵索引的順序來組織表的,因此,每個Innodb表都必須要有一個主鍵,如果我們沒有指定主鍵,那么Innodb會優先選擇表中第一個非空唯一索引來作為主鍵,如果沒有這個索引,那么Innodb會自動生成一個占6位元組的主鍵,而這個主鍵的性能并不是最好, - 不使用更新頻繁的列作為主鍵,不使用多列聯合主鍵,因為
Innodb是一種索引索引組織表,如果主鍵上的值頻繁更新,就意味著資料存盤的邏輯順序頻繁變動,必然會帶來大量的IO操作,降低資料庫性能, - 不要使用
uuid,md5,hash,字串列作為主鍵,因為這種主鍵不能保證主鍵的值是順序增長的,如果后來的主鍵值在已有主鍵值的中間段,那么這個主鍵插入的時候,會將所有主鍵值大于它的列都向后移, - 最好選擇能保證值的順序為順序增長的列為主鍵,并且資料不能重復,建議用
mysql自增id建立主鍵, - 避免建立冗余索引和重復索引,
- 對于頻繁的查詢優先使用覆寫索引,就是包含了所有查詢欄位的索引,這樣可以避免
Innodb表進行索引的二次查找,并可以把隨機IO變為順序IO提高查詢效率, - 盡量避免使用外鍵,
mysql和別的資料庫不同,會自動在外鍵上建立索引,會降低資料庫的寫性能, - 建議不使用外鍵約束,但是一定要在表與表之間的關聯鍵上建立索引,雖然外鍵是為了保證資料的完整性,但是最好在代碼中去保證,
四、欄位設計規范
- 優先選擇符合存盤需要的最小的資料型別,盡量將字串轉化為數字型別存盤:如將
ip存盤為數字:inet_aton(‘255.255.255.255’) = 4294967295,反之inet_ntoa(4294967295) = ‘255.255.255.255’, - 對于非負整型資料,優先使用無符號整型來存盤,如:
id,age,無符號相對于有符號,可以多出一倍的存盤空間, mysql中,varchar(n)中n表示字符數而不是位元組數,- 避免使用
text,blog來存盤欄位,這種型別只能使用前綴索引,如果非要使用,建議將這種資料分離到單獨的拓展表中, - 避免使用
enum型別,列舉本身是一個字串型別,但是內部確是用正數型別來存盤的,所以最多可存盤65535種不同的值,修改的話必須使用alter陳述句,直接修改元資料,有操作風險;order by效率低,必須轉換并無法使用索引,禁止使用數值作為enum值,因為enum本身是索引順序存盤的,會造成邏輯混淆, - 盡可能把所有列定義為
not null,索引null列需要額外的空間來保存,占更多空間,進行比較和計算時,對null值作特別的處理,可能造成索引失效, - 禁止使用字串來存盤日期型資料,無法使用日期函式計算比較,字串存盤要占更多的記憶體空間,
datetime(8位元組)和timestamp(本身是以int存盤,占4位元組,范圍:1970-01-01 00:00:01到2038-01-19 03:14:07) - 財務相關資料,使用
decimal型別 (精準浮點型別,在計算時不丟失精度),
五、SQL開發規范
- 建議使用預編譯陳述句(prepareStatment)進行資料庫操作,可以同步執行預編譯計劃,減少預編譯時間,可以有效避免動態
sql帶來的SQL注入的問題,只傳引數,一次決議,多次使用,比傳遞sql陳述句更高效, - 避免資料型別的隱式轉換,一般出現在
where從句中,會導致索引失效,如:select id,name from user where id = ‘12’;, - 充分利用已存在的索引,避免使用雙
%的查詢條件,不走索引,一個SQL只能利用到復合索引中的一列進行范圍查詢,使用left join或not exists來優化not in操作, - 程式連接不同的資料庫使用不同的賬號,禁止跨庫查詢,為資料庫遷移和分庫分表留出余地,降低業務耦合度,避免權限過大而產生的安全風險,
- 禁止使用
select *來查詢,必須用欄位名,可能會消耗更多的cpu和IO以及網路資源,無法使用覆寫索引,可以減少表結構變更對已有程式的影響, - 禁止使用不含欄位串列的
insert陳述句,可以減少表結構變更對已有程式的影響, - 禁止使用子查詢,雖然可使
sql可讀性好,但是缺點遠遠大于優點,子查詢回傳的結果集無法使用索引,結果集會被存盤到一個臨時表中,結果集越大性能越低,把子查詢優化為join操作,但是并不是所有的都可以優化為join,一般情況下,只有當子查詢是在in字句中,并且子查詢是一個簡單的sql(不包含union,group by,order by,limit)才能轉換為關聯查詢, - 避免
join過多的表,每join一個表會占一部分記憶體(join_buffer_size),會產生臨時表操作,影響查詢效率,mysql最多允許關聯61個表,建議不超過5個, - 減少同資料庫的互動次數,資料庫更適合處理批量操作,合并多個相同的操作到一起,提高處理效率,
- 使用
in代替or,in的值不要超過500個,in操作可以有效利用索引, - 禁止使用
order by rand()進行隨機排序,會把表中所有符合條件的資料裝載到記憶體中進行排序,會消耗大量的cpu和io及記憶體資源,推薦在程式中獲取隨機值, - 禁止在
where從句中對列進行函式轉換和計算,導致無法使用相關列上的索引,where date(create_time)=’20170901’寫成where create_time >= ‘20170901’ and create_time < ‘20170902’, - 在明顯不會有重復值時使用
union all而不是union,union會把所有資料放在臨時表中后再進行去重操作,會多消耗記憶體,IO,網路資源,union all不會再對結果集進行去重操作, - 拆分復雜的大
sql為多個小sql,目前mysql中一個sql只能使用一個cpu計算,不支持多cpu并行計算,sql拆分后可以通過并行執行來提高處理效率,
六、資料庫操作行為規范
主要面向手動操作資料庫的行為,
- 超過
100萬的批量寫操作,要分批多次進行操作,主從復制中:大批量操作可能會造成嚴重的主從延遲,因為當主庫執行完成后,才會在從庫執行,binlog日志為row格式時會產生大量的日志,避免產生大量事務,產生阻塞,占滿可用連接, - 對大表資料結構的修改一定要謹慎,可能會造成嚴重的鎖表操作,尤其是生產環境,是不能忍受的,對于大表使用
pt-online-schema-change修改表結構,首先會建立一個與原表結構相同的新表,然后在新表上進行表結構的修改,然后把原表中的資料復制到新表中,并且增加一些觸發器,以便把原表中即時新增的資料也復制到新表中,在行的所有資料復制完成之后,會在原表上增加一個很準的時間鎖,同時把新表命名為原表,把原表刪掉,實際上是把一個原子的DDL操作分解成多批次進行,避免大表修改產生的主從延遲問題,避免在對表欄位進行修改時進行鎖表, - 禁止為程式使用的賬號賦予
super權限 ,當資料庫連接數達到最大限制時,允許1個有super權限的用戶連接,super權限只能留給DBA處理問題的賬號使用, - 對于程式連接資料庫賬號,遵循權限最小原則,程式使用的資料庫賬號只能在一個
DB下使用,不準跨庫,程式使用的賬號原則上不準有drop權限,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/168742.html
標籤:其他
上一篇:SAP PP銷售預測轉獨立需求
