發布時間: 2017-06-16 14:03:16
所謂大數據、高并發僅針對中小型應用而言,專業的數據庫運維大神請無視。以下是小編針對相對“大數據”和相對“高并發”場景的一些應對策略的個人總結,部分措施并沒有經過嚴格的對比測試和原理分析,如有錯漏歡迎各種批評指教。
減少查詢的影響結果集,避免出現全表掃描。
影響結果集是SQL優化的核心。影響結果集不是查詢返回的記錄數,而是查詢所掃描的結果數。通過Explain或Desc分析SQL,rows列的值即為影響結果集,還可以通過慢查詢日志的Rows_examined后面的數字得到。
以下是小編常用的一些SQL優化策略:
1.去掉不必要的查詢和搜索。其實在項目的實際應用中,很多查詢條件是可有可無的,能從源頭上避免的多余功能盡量砍掉,這是最簡單粗暴的解決方案;
2.合理使用索引和復合索引。建索引是SQL優化中最有效的手段。查找、刪除、更新以及排序時常用的字段可以適當建立索引。不過要注意,單條查詢不能同時使用多個索引,只能使用一個索引。查詢條件較多時,可以使用多個字段合并的復合索引。切記,使用復合索引時,查詢條件的字段順序需要與復合索引的字段順序保持一致;
3.謹慎使用not in等可能無法使用索引的條件。索引也不是什么時候都可以發揮作用的,當出現"not in","!=","like '%xx%'","is null"等條件時,索引是無效的。使用這些條件的時候,請放到能有效使用索引的條件的右邊。設計表結構時,小編建議盡可能用int類型代替varchar類型,int類型部分時候可以通過大于或小于代替"!="等條件,同時也方便滿足一些需要按類型排序的需求,至于可讀性的問題,完善好數據庫設計文檔才是明智的選擇。同時建議把所有可能的字段設置為"not null",并設置默認值,避免在where字句中出現"is null"的判斷;
4.不要在where子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將無法正確使用索引。盡可能少用MySQL的函數,類似Now()完全可以通過程序實現并賦值,部分函數也可以通過適當的建立冗余字段來間接替代;
5.在where條件中使用or可能導致索引無效。可用 "union all" 或者 "union" 代替,或程序上直接分開兩次獲取數據再合并,確保索引的有效利用;
6.不使用select * ,倒不是能提高查詢效率,主要是減少輸出的數據量,提高傳輸速度;
7.避免類型轉換,類型轉換是指where子句中出現字段的類型和傳入的參數類型不一致的時候發生的類型轉換;
8.分頁查詢的優化。頁數比較多的情況下,如limit 10000,10 影響的結果集是10010行,查詢速度會比較慢。推薦的解決方案是先只查詢主鍵select id from table where .. order by .. limit 10000,10(搜索條件和排序請建立索引),再通過主鍵去獲取數據;
9.統計相關的查詢。影響結果集往往巨大,且部分SQL語句本身已經難以優化。因此,應避免在業務高峰期執行統計相關的查詢或僅在從庫中執行統計查詢。部分統計數據可以通過冗余的數據結構保存,同時建議把數據先保存在內存、緩存中(如redis),再按一定策略寫入數據庫。
隨著數據量的增加,連表操作往往會導致影響結果集大增,從SQL優化的層面已經解決不了問題了。此時,分庫和分表是解決數據庫性能壓力的最優選擇(具體分庫和分表的方案通常結合實際業務的應用場景來確定,此處略過)。這里重點談,如何更好的實現或者過渡到分庫、分表的分布式數據庫架構。核心點就是必須先去除數據表之間的關聯,即不用外鍵,不使用任何連表查詢。為了確保不進行連表操作,在設計數據庫表結構的時候,就需要設計適度冗余的字段來達到不連表的目的。對于一些操作日志、支付記錄等,設計一些記錄用戶信息的字段,個人認為其實不能算冗余,畢竟用戶信息往往會更改,但是這種類似操作日志的表確實是需要記錄用戶操作時的信息,并且不需要在用戶更新信息時同步更新。
實際開發中,為了實現不進行連表而冗余的字段,往往是需要在原表更新數據的時候同步更新冗余字段的數據的,如果應用層沒有對數據表操作做合理封裝,這往往是個棘手的問題,也不方便維護。當然,現在主流的應用框架一般采用orm的方式處理數據表,所以問題不大。相反不連表事實上還可以提高開發效率,比如通過用戶ID獲取用戶姓名操作,如果不連表就可以確保各個業務模塊都通過同樣的方式去獲取用戶姓名,調用同一個封裝好的方法,這樣就能很方便的統一在應用層加入緩存機制或添加統一的業務邏輯。同時如果要對用戶表進行分庫分表,通過應用層程序就可以簡單平滑的實現。
使用Innodb。
關于Innodb和Myisam對比,小編就不過多闡述了。Myisam的表級鎖是致命問題,考慮到MySQL已經默認使用Innodb作為數據庫引擎,小編建議大部分情況可以直接使用Innodb,其它引擎這里就不詳細討論了。
使用緩存。
盡可能在程序上實現常用數據的緩存,目前主流的應用框架應該都能快速實現緩存的需求。如果在程序上沒有實現數據緩存,開啟數據庫的query cache也是緩解數據庫壓力的方式之一,如果確認使用,記得定時清理碎片flush query cache。
下一篇: 如何使用Linux命令行生成高強度密碼