主頁 > 資料庫 > Python學習日記(四十一) Mysql資料庫篇 九

Python學習日記(四十一) Mysql資料庫篇 九

2020-09-24 06:04:53 資料庫

前言

索引的主要作用是起到約束和加速查找,ORM框架(sqlalchemy)是用類和物件對資料庫進行操作

 

索引的種類

按種類去分

1.普通索引:能夠加速查找

2.主鍵索引:能夠加速查找、不能為空、不能重復

3.唯一索引:加速查找、可以為空、不能重復

4.聯合索引(多列):

①聯合主鍵索引

②聯合唯一索引

③聯合普通索引

 

按資料結構去分

1.hash索引:哈希索引,創建一個索引表,把這些資料(下面用到的'name')轉化成哈希值,再把這些哈希值放入表中,并加上這個資料的存盤地址,在索引表中的順序和資料表中的資料不一定會一致,因為它里面的順序是無序的,如果在資料表中按一個范圍去找值那效能不一定會高,但是如果只找單值的時候它就會很快的查找出結果,

2.btree索引(常用):也就是binary tree索引、二元樹索引,在innodb引擎中它創建btree索引,在范圍內找值效率高,

 

索引的加速查找

首先創建一個表

create table dataset(
    id int not null auto_increment primary key,
    name varchar(32),
    data int,
)engine = innodb default charset = utf8;

再創建一個存盤程序,當我們執行的存盤程序時往表里插入10w筆資料

delimiter //
create procedure inserdatapro()
begin
    declare i int default 1;                                                                             -- 定義一個計數器i
    declare t_name varchar(16);                                                                      -- 臨時名字變數
    declare t_data int;                                                                                  -- 臨時資料變數
    while i <= 100000 do                                                                                 -- 如果i小于10W就執行下面的操作
        set t_name = CONCAT('aaa',i);                                                                    -- 讓'aaa'和i相連接變成字串'aaa1','aaa2'...的形式
        set t_data = CEIL(RAND()*100);                                                                   -- 產生一個0-100的亂數
        insert into dataset(name,data) values(t_name,t_data);                                            -- 將t_name,t_data插入dataset內
        set i = i + 1;                                                                                   -- 將i加一
    end while;                                                                                           -- 結束回圈
end //
delimiter ;

執行存盤程序,往表中插入資料完成要花一定的時間,具體還需要看電腦的性能

call inserdatapro();

比較兩種陳述句的執行速度:

select * from dataset where name = 'aaa94021';
select * from dataset where id = 94021;

結果:

通過比較可以看出用索引(id)去查資料會比較快,像第一種查詢方式因為沒有索引,所以它必須要逐個去翻找出我們要的結果,因此我們可以再創建一個索引去查找資料,

create index nindex on dataset(name);                                                           -- 創建名字的索引

再去執行第一個查詢陳述句:

可以看出效能得到了很顯著的提升

查找方式:

1.無索引

  從前到后依次查找

2.有索引

  會創建一個資料結構或創建額外的檔案,它按照某種格式去進行存盤,所以它的查找方式會從這個索引檔案中查詢這個資料在這張表的什么位置,

  查詢快,但插入更行洗掉慢

  當我們在使用索引查找資料時要命中索引,比如說:

select * from dataset where name like 'aaa94021';

索引相關操作:

1.普通索引

①創建表

 create table t(
    nid int not null auto_increment primary key,
    name varchar(32),
    data int,
    index index_name(name)
 )

②創建索引

create index index_name on t(name);

③洗掉索引

drop index index_name on t;

④查看索引

show index from t;

2.唯一索引

①創建表

create table t2(
    id int not null auto_increment primary key,
    name varchar(32) not null,
    data int,
    unique index_name(name)
)

②創建唯一索引

create unique index index_name on t2(name);

洗掉唯一索引

drop unique index index_name on t2;

3.主鍵索引

①創建表

-- 寫法一
create table t3(
    id int not null auto_increment primary key,
    name varchar(32) not null,
    int data,
    index index_name(name)
)
-- 寫法二
craete table t4(
    id int not null auto_increment,
    name varchar(32) not null,
    int data,
    primary key(id),
    index index_name(name)
) 

②創建主鍵

alter table t3 add primary key(id);

③洗掉主鍵

alter table t3 modify id int,drop primary key;
alter table t3 drop primary key;

4.聯合索引

①創建表

create table mtable(
    id int not null auto_increment,
    name varchar(32) not null,
    data int,
   gender varchar(16),
    primary key(id,name)
)engine=innodb default charset=utf8;

②創建聯合索引

create index index_id_name on mtable(id,name,gender);

最左前綴匹配:只支持最左邊與其他索引之間的匹配方式,如:(id,name)、(id,gender)、(id,name,gender),如果用(name,gender)等就不能達到我們想要的查找效果

-- 符合最左前綴匹配
select * from mtable id = 15 and name = 'aaa15';
select * from mtable id = 15 and gender = 'male';

-- 不符合最左前綴匹配
select * from mtable name = 'aaa20' and id = 20;

組合索引的效率大于索引合并

 

覆寫索引和索引合并

不是真實存在,只是一個名詞

覆寫索引:在索引檔案中直接獲取資料

比方說從表dataset去找'name = aaa12456'的存盤資料

select * from dataset where name = 'aaa12456';

那我們如果想要取它的ID或data就可以通過這種方式拿到:

select id,data from dataset where name = 'aaa12456';

索引合并:把多個單列索引合并使用

例:

select * from dataset where name = 'aaa12456' and id = 12456;

 

命中索引

當我們需要在一個列中頻繁的查找我們才需要創建索引,之后我們就要去命中索引,下面是命中索引的情況

1.like '%xx'(模糊查詢)

select * from t where name like '%cn';

2.使用函式(速度慢,可以在程式級別中使用函式避免效能降低)

select * from t where reverse(name) = '3215aaa';

3.or

當這里id是索引,name不是索引的時候

select * from dataset where id = 15 or name = 'aaa20169';

特殊情況:

當這里id、name是索引,data不是索引,陳述句在執行時會把不是索引的部分給去掉把是索引的兩端給連起來

select * from dataset where id = 15 or data = 98 and name = 'aaa20169';

4.型別不一致

當查詢的型別為字串和非字串的型別時,兩邊所執行的時間會不大相同

select * from dataset where data = '98';
select * from dataset where data = 98;

效能比較:

5.!=

非主鍵情況:

select * from dataset where data != 98;
select * from dataset where data = 98;

效能比較:

主鍵情況,還是會走索引:

select * from dataset where id != 12345;
select * from dataset where id = 12345;

效能比較:

6.>

非數字型別(效能不是很高):

select * from dataset where name > 'aaa1345';      -- name不是主鍵

數字型別(如果是主鍵的話,還會走索引)

select * from dataset where id > 1345;

7.order by

索引排序的時候,選擇的映射如果不是索引,則不走索引

select data from dataset order by data desc;    
select name from dataset order by data desc;

效能比較:

特殊情況,當對主鍵進行排序那還是走索引:

select * from dataset order by id desc;

8.聯合索引最左前綴

 

執行計劃

讓Mysql去預估執行操作(一般情況下預估結果是正確的),語法:explain + MySQL查詢陳述句

例一:

explain select * from dataset; 

執行結果:

type等于All表示全表掃描,執行速度慢 

例二:

explain select * from dataset where id = 9;                              -- id為主鍵

執行結果:

type等于const表示常數

例三:

explain select * from dataset where name = 'aaa17849';                       -- name為索引

執行結果:

type等于ref表示按索引查詢,執行速度快

select_type查詢型別:

SIMPLE          簡單查詢
PRIMARY         最外層查詢
SUBQUERY        映射為子查詢
DERIVED         子查詢
UNION           聯合
UNION RESULT    使用聯合的結果

table表名

possible_keys為可能使用的索引

key為真正使用的索引

key_len為MySQL中使用的索引位元組長度

rows為預估讀取長度

extra為包含MySQL解決查詢的詳細資訊 

type表示查詢時的訪問型別,下面性能的快慢順序:

ALL < INDEX < RANGE < INDEX_MERGE < REF_OR_NULL < REF < EQ_REF < SYSTEM/CONST

https://dev.mysql.com/doc/refman/5.7/en/explain-output.html#jointype_system

 

索引注意事項

1.避免使用select *去查詢

2.count(1)或count(列)代替count(*)

3.創建表時盡量用char代替varchar

4.表的欄位順序固定長度的欄位優先

5.組合索引代替多個單列索引(經常使用多個條件查詢時)

6.盡量使用短索引

7.使用連接(JOIN)來替代子查詢(SUB-QUERIES)

8.連表時注意條件和型別需一致

9.索引散列值(重復少)不適合建索引,比如:性別

 

慢日志

用于記錄執行時間長的SQL、未命中索引把它們放到一個日志檔案路徑

記憶體中配置慢日志

查看當前配置資訊

show variables like '%query%';

執行結果:

這里的long_query_time = 10 表示時間超過十秒的都會被記錄下來、slow_query_log = OFF 表示是否開啟慢日志、slow_query_log_file 表示日志檔案路徑

除此之外

show variables like '%queries%';

也可以查詢到配合資訊,執行結果:

這里的log_queries_not_using_indexed = OFF 表示使用的索引的搜索是否記錄

若想要修改當前配置:

set global 變數名 = 值;

啟動慢日志:

set global slow_query_log = ON;

組態檔

通過啟動服務端

mysqld --default-file=組態檔路徑

這樣我們就可以在一個'my.conf'檔案中去看這些日志記錄

那這些記錄內容就是相關的SQL執行操作,

除了新建一個'my.conf'去記錄日志,也可以通過使用Mysql的'my-default.ini'去記錄日志

注意:在修改了組態檔之后要記得備份和重啟服務

 

分頁

當一個資料的量很大時,作為用戶不可能一下就去閱覽上千條的量,所以我們要設計一個量,方便用戶去閱讀 

首先我們先獲得前十條資料:

select * from dataset limit 0,10;

執行結果:

那以此類推我們可以再去獲得后十條,再后十條的資料從而達到分頁的效果,但是其實我們使用limit它會去將資料進行掃描,當從0-10分10條資料時,它會掃10條資料,而當10-20分十條資料時,它會掃20條的資料...那如果在一個很大的資料量中掃描再去獲取十條資料,那么它的效能就會非常的慢 

因此這種分頁的方式實不可取的,那如何去解決?

方式一:隱藏分頁

方式二:索引表掃描(用到覆寫索引)

但其實用這種方法和全掃相比也不會快到哪里去

select * from dataset where id in(select id from dataset limit 90000,10); 

方式三:制定方案(記錄當前頁最大ID和最小ID)

如果要找后十條資料:

select * from dataset where id > 90000 limit 10;

查詢速度:

如果要找前十條資料:

select * from dataset where id < 90001 order by id desc limit 10 ;

查詢速度:

那如果要實作一個很大的跨度的話,比如說直接跳10000頁,在資料庫上是沒法實作的,不過可以通過其他的方法像快取等,between..and..不能實作問題在于資料庫中ID是不是連續的,因為這些ID會因為一些增刪改的操作出現變動,

在記錄當前頁的最大ID和最小ID還有兩種實作方法:

①頁面只有上一頁或下一頁

假設max_id為當前頁最大ID、min_id為當前頁最小ID

實作下一頁功能:

select * from dataset where id > max_id limit 10;

實作上一頁功能:

select * from dataset where id < min_id order by id desc limit 10;

②在上一頁和下一頁中間有很多頁碼

當前頁(196):cur_page

目標頁(199):tar_page

當前頁最大ID:max_id

select * from dataset where id in (select id from (select id from dataset where id > max_id limit (tar_page-cur_page)*10) as T order by T.id desc limit 10);

當前頁(196):cur_page

目標頁(193):tar_page

當前頁最小ID:min_id

select * from dataset where id in (select id from (select id from dataset where id < min_id limit (cur_page - tar_page)*10) as T order by T.id desc limit 10);

 

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/116987.html

標籤:MySQL

上一篇:[mybatis] sql陳述句無錯誤,但是執行多條sql陳述句時,拋出java.sql.SQLSyntaxErrorException

下一篇:MySQL資料庫基本操作

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more