MySQL 大表的count()優(yōu)化實(shí)現(xiàn)
以下是基于我結(jié)合B+樹的數(shù)據(jù)結(jié)構(gòu)和對實(shí)驗(yàn)結(jié)果的推測作出的判斷,如有錯誤,懇請指正!
今天實(shí)驗(yàn)了一下MySQL的count()操作優(yōu)化, 以下討論基于mysql5.7 InnoDB存儲引擎. x86 windows操作系統(tǒng)。
創(chuàng)建的表的結(jié)構(gòu)如下(數(shù)據(jù)量為100萬):

首先是關(guān)于mysql的count(*),count(PK), count(1)哪個快的問題。 實(shí)現(xiàn)結(jié)果如下:
并沒有什么區(qū)別!加上了WHERE子句之后3個查詢的時間也是相同的,我就不貼圖片了。
之前在公司的時候就寫過一個select count(*) from table的SQL語句,在數(shù)據(jù)多的時候非常慢。所以要怎么優(yōu)化呢?
這要從InnoDB的索引說起, InnoDB的索引是B+Tree。
對主鍵索引來說:它只有在葉子節(jié)點(diǎn)上存儲數(shù)據(jù),它的key是主鍵,并且value為整條數(shù)據(jù)。 對輔助索引來說:key為建索引的列,value為主鍵。
這給我們兩個信息: 1. 根據(jù)主鍵會查到整條數(shù)據(jù) 2. 根據(jù)輔助索引只能查到主鍵,然后必須通過主鍵再查到剩余信息。
所以如果要優(yōu)化count(*)操作的話,我們需要找一個短小的列,為它建立輔助索引。 在我的例子中就是status,雖然它的”severelity”幾乎為0.
先建立索引:ALTER TABLE test1 ADD INDEX (status); 然后查詢,如下圖:
可以看到,查詢時間從3.35s下降到了0.26s,查詢速度提升近13倍。
如果索引是str這一列,結(jié)果又會是怎么樣呢? 先建立索引: alter table test1 add index (str) 結(jié)果如下:

可以看到,時間為0.422s,也很快,但是比起status這列還是有著1.5倍左右的差距。
再大膽一點(diǎn)做個實(shí)驗(yàn),我把status這列的索引刪掉,建立一個status和left(omdb,200)(這一列平均1000個字符)的聯(lián)合索引,然后看查詢時間。 建立索引: alter table test1 add index (status,omdb(200)) 結(jié)果如下:
時間為1.172s
alter table test1 add index (status,imdbid);
補(bǔ)充!! 要注意索引失效的情況! 建立了索引后正常的的樣子:
可以看到key_len為6, Extra的說明是using index.
而如果索引失效的話:

索引失效有很多種情況,比如使用函數(shù),!=操作等,具體請參考官方文檔。
對MySQL沒有很深的研究,以上是基于我結(jié)合B+樹的數(shù)據(jù)結(jié)構(gòu)和對實(shí)驗(yàn)結(jié)果的推測作出的判斷,如有錯誤,懇請指正!
到此這篇關(guān)于MySQL 大表的count()優(yōu)化實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)MySQL 大表count()優(yōu)化內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. MySQL 字符串函數(shù):字符串截取2. MYSQL(電話號碼,身份證)數(shù)據(jù)脫敏的實(shí)現(xiàn)3. MySQL分區(qū)的優(yōu)點(diǎn)4. Mysql入門系列:MYSQL表達(dá)式求值和MYSQL類型轉(zhuǎn)換5. mysql-bin.000001文件的來源及處理方法6. 如何實(shí)現(xiàn)MySQL數(shù)據(jù)庫的備份與恢復(fù)7. 什么是Access數(shù)據(jù)庫8. 從舊版本SQL Server中重新存儲數(shù)據(jù)9. Oracle根據(jù)逗號拆分字段內(nèi)容轉(zhuǎn)成多行的函數(shù)說明10. MySql遠(yuǎn)程連接的實(shí)現(xiàn)方法

網(wǎng)公網(wǎng)安備