关系型数据库工作原理-查询优化器(翻译自Coding-Geek文章)

2018/3/7 9:55:02 人评论 次浏览 分类:操作技巧

本文翻译自Coding-Geek文章:《 How does a relational database work》。原文链接:http://coding-geek.com/how-databases-work/#Buffer-Replacement_strategies

本文翻译了如下章节, 介绍数据库的查询优化器: 

这里写图片描述

 

Query optimizer–查询优化器

 这里写图片描述


当前所有流行的数据库都使用基于成本的算法(CBO)优化查询SQL。其思路是为所有的操作指令赋予一个成本值,然后找出能降低成本的最优指令执行链。

 

为了帮助理解基于成本的优化器是如何工作的,最好的方式是通过一些样例来感受它的复杂性。在整个章节中我将通过三个常用联表操作来说明数据库是如何做优化的,你可以看到即使是对一个最简单的联表查询语句做优化也是十分复杂的。最后我们来看一下真实的数据库优化器是如何做的。

在这些例子中我将聚焦在分析时间复杂度上面,而一个真实的数据库优化器将同时考虑CPU消耗,磁盘I/O消耗和内存需求(译者:类似于程序算法的复杂度度量方式,O(1)、O(n))。

分析时间复杂度和CPU指令执行成本是有一些差异,但是非常近似。如果是分析CPU指令执行成本,我需要计算所有SQL语句的指令条数,包括加法、条件语句、乘法、循环…等等。甚者还要考虑:

  • 每一条高级语言的代码语句都有对应数量的低级语言(汇编语言)指令。
  • 使用不同的CPU芯片(Core i7, an Intel Pentium 4, an AMD Opteron….),指令的执行成本是不一样的。也就是说,它还取决于不同的CPU架构。

统一使用时间复杂度来度量就简单很多,也不影响我们理解CBO的本质。有时间我也会把磁盘I/O单独拿出来讲,因为它很重要。很多时候,数据库瓶颈在磁盘I/O而不是CPU。

 

相关知识

  • 我必须得告诉大家的MySQL优化原理

    说起MySQL的查询优化,相信大家收藏了一堆奇淫技巧:不能使用SELECT *、不使用NULL字段、合理创建索引、为字段选择合适的数据类型..... 你是否真的理解这些优化技巧?是否理解其背后的工作原理?在实际场景下性能真有提升吗?我想未必。因而理解这些优化建议背后的原理就尤为…

    2017/7/19 8:56:00
  • 优化SQL查询:如何写出高性能SQL语句

    1、 首先要搞明白什么叫执行计划?执行计划是数据库根据SQL语句和相关表的统计信息作出的一个查询方案,这个方案是由查询优化器自动分析产生的,比如一条SQL语句如果用来从一个 10万条记录的表中查1条记录,那查询优化器会选择“索引查找”方式,如果该表进行了归…

    2017/7/19 8:56:00
  • memcached与redis实现的对比

    memcached和redis,作为近些年最常用的缓存服务器,相信大家对它们再熟悉不过了。前两年还在学校时,我曾经读过它们的主要源码,如今写篇笔记从个人角度简单对比一下它们的实现方式,权当做复习,有理解错误之处,欢迎指正。文中使用的架构类的图片大多来自于网络,有部分图…

    2017/7/19 8:56:00
  • SQL Server Management Studio 2016 最让人兴奋的10大新功能

    介绍这篇文章列出了SQL Server Management Studio 2016已经取得的一些令人兴奋的改进。我相信,大多数新功能可以帮助我们提升工作速度,更方便地使用SSMS。1.颜色主题随着SSMS 2016的到来,现在你可以选择自己喜欢的颜色主题,类似于Visual Studio中的相似功能。你可以在两种…

    2017/7/19 8:56:00

共有访客发表了评论 网友评论

验证码: 看不清楚?