18888889999
notice 网站公告
— 杏彩体育资讯 —
作者:MingCong Han
在《十分钟成为 Contributor 系列 | 为 Cascades Planner 添加优化规则》中,我们简单介绍了 Cascades 的相关背景知识,本文将为大家深入介绍 TiDB 新的优化器——Cascades Planner 的框架及原理。
关系型数据库中查询优化器的作用是为一个 SQL 在合理的开销内产生一个合适的查询计划,TiDB 源码阅读系列文章(六)Select 语句概览 中介绍过 TiDB 当前优化器的基本组成,TiDB 当前的优化器将优化过程主要分为逻辑优化(Logical Optimize)和物理优化(Physical Optimize)两个阶段。逻辑优化是将一棵逻辑算子树(LogicalPlan Tree)进行逻辑等价的变化,最后的结果是一棵更优的逻辑算子树;而物理优化则是将一棵逻辑算子树转换成一棵物理算子树(PhysicalPlan Tree)。这棵物理算子树就是我们说的物理执行计划,将交由 TiDB 执行引擎去完成后续的 SQL 执行过程。
TiDB 中,一个 SQL 在进入到逻辑优化阶段之前,它的 AST(抽象语法树)已经转换成了对应的逻辑算子树,因此逻辑优化就是将一个逻辑算子树进行逻辑上等价变换的过程。逻辑优化是基于规则的优化(Rule-Based Optimization,RBO),这些规则背后的原理就是关系代数的等价变换,其中典型的规则包括:列剪裁,谓词下推等。TiDB 现有逻辑优化规则的原理和实现可以参考这两篇源码阅读文章:(七)基于规则的优化,(二十一)基于规则的优化 II。
随着 TiDB 中逻辑优化规则的不断增多,逐渐暴露了当前优化框架存在的几个问题:
select b from t where a > 1
,其中 a
是 int
类型的主键,我们最终会产生这样一个物理执行计划:a
b
两列,也就是说 TiDB 会从 TiKV 中读取两列内容,但最终自己却只需要其中第一列。这个问题背后的原因是:优化器先进行列裁剪,再谓词下推,但是谓词下推之后,有可能列剪裁可以再次生效,而这个可能生效的列剪裁在现在优化器中无法被执行了,导致 TiDB 从 TiKV 多读取了一列数据,增加了 SQL 执行时的网络 IO 使用量。物理优化是一个将逻辑算子树转化为物理算子树的过程,我们在之前的 TiDB 源码阅读系列文章(八)基于代价的优化 中做过详细的介绍。在物理优化中,优化器会结合数据的分布(统计信息)情况来对查询计划进行优化,物理优化是一个记忆化搜索的过程,搜索的目标是为逻辑执行计划寻找满足特定物理属性的物理执行计划,并在其中选择代价最低的作为搜索结果,因此也被称为基于代价的优化(Cost-Based Optimization,CBO),例如 DataSource 应该选择怎样的扫描路径(使用哪个索引),Join 应该选择怎样的执行方式(HashJoin、MergeJoin 或 IndexJoin)等。
在 TiDB 中,物理优化不仅仅是选择物理算子,还完成了算子下推 TiKV 的任务,例如将 Aggregation 算子分裂成 FinalMode 和 PartialMode 两部分,并将 PartialMode 的 Aggregation 下推到 TiKV Coprocessor 中执行,具体可以参考 TiDB 源码阅读系列文章(二十二)Hash Aggregation。
目前支持下推的算子有:Selection、Limit、TopN 和 Aggregation,下推的方式有两种:
下图展示了一个简单的聚合查询如何经过优化得到最后的物理计划:
A.pk > 10
会转换为主键的范围条件,而 A.value > 1
则会产生一个 TiKV 层的 Selection。上述的物理优化过程,存在几个潜在的问题:
Volcano/Cascades Optimizer 是经典的优化器框架,分别产自论文 The Volcano Optimizer Generator: Extensibility and Efficient Search 以及 The Cascades Framework for Query Optimization,其主要作者都是 Goetz Graefe。Cascades Framework 已经被很多常见的数据库系统所实现,我们简单介绍一下两篇文章中提出的一些基本概念。
Volcano Optimizer Generator 本身的定位是一个优化器的“生成器”,其核心贡献是提供了一个搜索引擎。作者提供了一个数据库查询优化器的基本框架,而数据库实现者要为自己的 Data Model 实现相应的接口后便可以生成一个查询优化器。我们下面抛开生成器的概念,只介绍其在“优化器”方向提出的一些方法:
Cascades Optimizer 是 Volcano Optimizer 的后续作品,其对 Volcano Optimizer 做了进一步的优化,下面介绍一些 Cascades Optimizer 中的基本概念。
Cascades Optimizer 在搜索的过程中,其搜索的空间是一个关系代数算子树所组成的森林,而保存这个森林的数据结构就是 Memo。Memo 中两个最基本的概念就是 Expression Group(下文简称 Group) 以及 Group Expression(对应关系代数算子)。每个 Group 中保存的是逻辑等价的 Group Expression,而 Group Expression 的子节点是由 Group 组成。下图是由五个 Group 组成的 Memo:
我们可以通过上面的 Memo 提取出以下两棵等价的算子树,使用 Memo 存储下面两棵树,可以避免存储冗余的算子(如 Scan A 以及 Scan B)。
在 Volcano Optimizer 中,Rule 被分为了 Transformation Rule 和 Implementation Rule 两种。其中 Transformation Rule 用来在 Memo 中添加逻辑等价的 Group Expression。Transformation Rule 具有原子性,只作用于算子树的一个局部小片段,每个 Transformation Rule 都有自己的匹配条件,应用某个 Transformation Rule,通过不停的应用可以匹配上的 Transformation Rule 来扩展搜索的空间,寻找可能的最优解。Implementation Rule 则是为 Group Expression 选择物理算子。
而在 Cascades Optimizer 中,不再对这两类 Rule 做区分。
Pattern 用于描述 Group Expression 的局部特征。每个 Rule 都有自己的 Pattern,只有满足了相应 Pattern 的 Group Expression 才能够应用该 Rule。下图中左侧定义了一个 Selection->Projection
的 Pattern,并在右侧 Memo 中红色虚线内出现了匹配的 Group Expression。
Cascades Optimizer 为 Rule 的应用顺序做了很细致的设计,例如每个 Rule 都有 promise 和 condition 两个方法,其中 promise 用来表示 Rule 在当前搜索过程中的重要性,promise 值越高,则该规则越可能有用,当 promise 值小于等于 0 时,这个 Rule 就不会被执行;而 condition 直接通过返回一个布尔值决定一个 Rule 是否可以在当前过程中被应用。当一个 Rule 被成功应用之后,会计算下一步有可能会被应用的 Rule 的集合。
Cascades Optimizer 的搜索算法与 Volcano Optimizer 有所不同,Volcano Optimizer 将搜索分为两个阶段,在第一个阶段枚举所有逻辑等价的 Logical Algebra,而在第二阶段运用动态规划的方法自顶向下地搜索代价最小的 Physical Algebra。Cascades Optimizer 则将这两个阶段融合在一起,通过提供一个 Guidance 来指导 Rule 的执行顺序,在枚举逻辑等价算子的同时也进行物理算子的生成,这样做可以避免枚举所有的逻辑执行计划,但是其弊端就是错误的 Guidance 会导致搜索在局部收敛,因而搜索不到最优的执行计划。
Volcano/Cascades Optimzier 都使用了 Branch-And-Bound 的方法对搜索空间进行剪枝。由于两者都采用了自顶向下的搜索,在搜索的过程中可以为算子设置其 Cost Upper Bound,如果在向下搜索的过程中还没有搜索到叶子节点就超过了预设的 Cost Upper Bound,就可以对这个搜索分支预先进行剪枝。
基于 Volcano/Cascades Optimizer 的原理,我们为 TiDB 重新设计了一个优化器:TiDB Cascades Planner。我们希望可以通过新的优化器来解决现行优化器的问题,并且也能够带来一些新的特性:
首先我们介绍 TiDB Cascades Planner 中的一些基本的数据结构,以下的部分概念与上文介绍的 Volcano/Cascades Optimizer 大体一致,只会有少许的不同。
GroupExpr 是对 LogicalPlan
的封装,与 LogicalPlan
不同的是,GroupExpr 的子节点不再是 LogicalPlan
,而是 Group:
type GroupExpr struct{
ExprNode plannercore.LogicalPlan
Children[]*Group
Group *Group
...
}
Group 是一组逻辑等价的 GroupExpr 集合,换句话说,从逻辑上来看,通过一个 Group 中任何一个 GroupExpr 产生的算子树都是逻辑等价的。
type Group struct{
Equivalents *list.List
ImplMap map[string]Implementation
Prop *property.LogicalProperty
EngineType EngineType
}
为了加快搜索的过程,我们对 Group 做了一些更细粒度的优化,例如在将 GroupExpr 插入到 Equivalents 时,我们总是保证相同类型的 LogicalPlan 在链表中连续存储;同时为每种类型的首个 GroupExpr 提供一个 map 作为索引等。
通过以上两个定义我们可以发现,Group 和 GroupExpr 相互递归地引用,最终形成一个 Memo 数据结构。
Operand 是 LogicalPlan 的类型符,用于描述 Pattern。
type Operand int
const (
OperandAny Operand=iota
OperandJoin
OperandAggregation
OperandProjection
...
Pattern 是一个树状的数据结构,用于表示逻辑算子树的局部的形状。需要注意的是 Pattern 只能用于匹配逻辑算子的类型(通过 Operand),但是不能够指定算子中具体的内容。
type Pattern struct{
Operand
Children[]*Pattern
}
Transformation 是一个接口类型,用来定义一个逻辑变换规则。
GetPattern()
方法获取这个变换规则所需要匹配的一个 Pattern。Match()
方法可以判断更细节的匹配条件。例如 Pattern 只能描述我们想要一个 Join 类型的算子,但是却没法描述这个 Join 应该是 InnerJoin 或者是 LeftOuterJoin,这类条件就需要在 Match()
中进行判断。OnTransform()
方法中定义了变换规则的具体内容,返回的内容分别是新的 GroupExpr,是否删除旧的 GroupExpr
,是否删除旧的 Group 中所有的 GroupExpr
。下面我们以一个变换规则:PushSelDownAggregation
为例,具体介绍上面三个方法的使用方式。
这个规则匹配的 Pattern 是 Selection -> Aggregation
,作用则是将这个 Selection 下推到 Aggregation 下面,例如 SQL: select a, sum(b) from t group by a having a > 10 and max(c) > 10
中,having 条件里的 a > 10
可以下推到 Aggregation 的下方。更具体地来说,只要 Selection 当中的一个 Expression 里的所有列都出现在 group by 的分组列时,我们就可以把这个 Expression 进行下推。
参考下图:
Selection -> Aggregation
。OnTransform()
的转换,Selection 中的 a > 10
条件被下推到了新的 Aggregation 下方,并且保留的条件 max(c) > 10
成为了一个新的 Selection。OnTransform()
的 eraseOld
返回了 True
,因此最终把原来的 GroupExpr 从 Group 中删除。Implementation 是对 PhysicalPlan 及其对应 cost 计算的一个封装。
type Implementation interface{
CalcCost(outCount float64, children ...Implementation) float64
SetCost(cost float64)
GetCost() float64
GetPlan() plannercore.PhysicalPlan
AttachChildren(children ...Implementation) Implementation
ScaleCostLimit(costLimit float64) float64
}
ImplementationRule
是一个接口类型,用来定义一个逻辑算子的一种物理实现方式。
ImplementationRule
只能通过 Operand 来匹配,因此也需要一个 Match()
方法来对算子内部的细节做更细粒度的匹配。OnImplement()
方法用于为 GroupExpr 生成对应的 Implementation。下面我们仍旧以 Aggregation 为例,我们知道 Aggregation 有两种典型的物理执行方式,一个是 HashAggregation,一种是 StreamAggregation。
实现 HashAgg 的 ImplementationRule 是 ImplHashAgg,源码位于 planner/cascades/implementation_rules.go/implHashAgg ,由于 HashAgg 不能满足上层节点要求的任何 Property,因此在 Match()
方法中,如果上层节点传递下来的 Prop 非空的话,我们这里就不能够将 Aggregation 转换成 HashAgg;而在 OnImplement()
方法中,我们只需要将 LogicalAggregation 转换成 PhysicalHashAgg 就可以了。
Enforcer 用来在算子树中强制添加 Sort 算子来满足父亲节点要求的顺序属性,我们将在下文中的 Implementation Phase 介绍如何使用 Enforcer。
type Enforcer interface{
NewProperty(prop *property.PhysicalProperty) (newProp *property.PhysicalProperty)
OnEnforce(reqProp *property.PhysicalProperty, child memo.Implementation) (impl memo.Implementation)
GetEnforceCost(g *memo.Group) float64
}
LogicalProperty 包含 Schema 和统计信息两部分,因为一个 Group 中所有的 GroupExpr 是逻辑等价的,因此他们共享同一个 LogicalProperty。
type LogicalProperty struct{
Stats *StatsInfo
Schema *expression.Schema
}
PhysicalProperty 中记录 OrderBy Items 以及 ExpectedCount,这两者与 TiDB 源码阅读系列文章(八)基于代价的优化 中描述的一致,这里不再赘述。
为了使 TiDB 能够使用在各种不同的存储组件之上,我们为 TiDB Cascades Planner 引入了 Adapter Model。所谓 Adapter Model 指的是,我们在 LogicalPlan 中添加各种用来从存储引擎收集数据的算子,例如 TiKVTableGather
、TiFlashTableGather
甚至 MySQLGather
等,这些 Gather 算子最终在物理优化阶段会被改写成 TableReader
、IndexReader
等用来读取数据的算子,因此 Gather 的所有父亲算子都是在 TiDB 中执行的,而 Gather 所有子节点的算子都是在相应的存储引擎上执行的。这样做有两个好处:
TiDB Cascades Planner 在当前的设计中将搜索过程分为三个阶段:
这一部分的源码位于 planner/cascades/optimize.go。
在预处理阶段,我们会对原始的逻辑算子树做“一定更优”的逻辑变换,例如列剪裁。
在逻辑搜索阶段,与 TiDB 现行的逻辑优化类似,我们会对输入的逻辑算子树做逻辑上的等价变换。但不同的是,此处我们先将 LogicalPlan Tree 转换成 Group Tree,通过在 Group Tree 应用 Transformation Rule 来实现逻辑上的等价变化。
在搜索算法的实现中,主要涉及三个函数,下面我们自底向上的介绍这三个函数的作用。
1)findMoreEquiv(group, groupExpr)
findMoreEquiv(group, groupExpr)
是对一个 GroupExpr 应用所有的 Transformation 来搜索更多的逻辑等价的 GroupExpr,其过程如下:
Match()
方法进一步判断是否能够匹配相应的细节内容(例如 Join 的类型)。Match()
成功,则调用 OnTransformation()
方法来应用相应的变换规则。OnTransformation
返回了新的 GroupExpr
,则将这个 GroupExpr 插入到 Group 中,并且将 Group 标记为 UnExplored,保证新生成的 GroupExpr 未来也可以被搜索到。OnTransformation
返回的 eraseOld
为 True
,那么在 findMoreEquiv()
结束后,会将当前的 GroupExpr 从 Group 中删除。OnTransformation
返回的 eraseAll
为 True
,那么可以删除当前 Group 中的所有 GroupExpr,插入新的 GroupExpr 并结束当前 Group 的搜索。2)exploreGroup(group)
exploreGroup()
方法自底向上递归地对整个 Group Tree 中的 GroupExpr 调用 findMoreEquiv()
,主要过程如下:
exploreGroup()
,直至子 Group 中不再产生新的 GroupExpr 为止。findMoreEquiv()
,若返回的 eraseCur
为 True
,则将这个 GroupExpr 从 Group 中删除。3)OnPhaseExploration(group)
最后一个部分就是对顶部的 Group (root Group),循环调用 exploreGroup()
,直至所有的 Group 都不再产生新的 GroupExpr 为止。
到这里,我们就通过 Group 保存了所有逻辑等价的 LogicalPlan Tree,接下来我们要为这些 LogicalPlan 选择代价最小的一个 PhysicalPlan Tree。
Implementation Phase 与现行的优化器中的 Physical Optimize 类似,都是将逻辑计划转化成代价最小的物理计划。但不同的是,旧的优化器只能为一个 LogicalPlan Tree 选择物理计划,但在 Cascades Planner 里,我们是为一个 Group Tree 或者说一组逻辑等价的 LogicalPlan Tree 选择物理计划。
我们可以将这个过程分为三部分:
1)implGroupExpr(groupExpr, reqPhysicalProp)
implGroupExpr
为一个 GroupExpr 根据上层传递下来的 PhysicalProperty 来生成 Implementation。过程十分简单,就是尝试对当前的 GroupExpr 应用所有对应的 ImplementationRule,最后将匹配成功后产生的 Implementations 返回。
func (opt *Optimizer) implGroupExpr(groupExpr *memo.GroupExpr, reqPhysProp *property.PhysicalProperty) (impls[]memo.Implementation, err error){
for _, rule :=range opt.GetImplementationRules(groupExpr.ExprNode){
if !rule.Match(groupExpr, reqPhysProp){
continue
}
impl, err :=rule.OnImplement(groupExpr, reqPhysProp)
if err !=nil{
return nil, err
}
if impl !=nil{
impls=append(impls, impl)
}
}
return impls, nil
}
2)implGroup(group, reqPhysicalProp, costLimit)
implGroup()
根据上层传递下来的 PhysicalProperty 递归地为 Group 生成最优的 Implementation。
reqPhysicalProp
对应的最优 Implementation。fillGroupStats()
来填充LogicalProperty 里的统计信息。implGroupExpr()
来产生 Implementation 和递归调用 implGroup()
来搜索子 Group 的过程。3)EnforcerRule
上文中我们没有详细介绍 Enforcer 的概念,我们在这里补充。例如我们有这样一个 SQL:
select b, sum(c) over (partition by b) from t
这是一个带有 Window Function 的查询,Window 中以 b
列为分组,由于目前 Window 的实现是需要下层算子根据分组列有序,当没有可以使 b
列有序的索引时,我们必须在 Window 算子下面强制添加一个 Sort 算子来满足 Window 算子向下传递的 PhysicalProperty。
当在 ImplGroup()
中上层传递下来的 PhysicalProperty 不为空时,我们会为这个 Group 调用 EnforcerRule,EnforcerRule 会先强制添加一个 Sort 算子,然后再用空的 PhysicalProperty 来重新对当前的 Group 调用 ImplGroup()
。
本文主要介绍了 TiDB Cascades Planner 框架的组成以及原理,Cascades Planner 的引入解决了现有优化器存在的部分问题,同时又为 TiDB 引入了一些新的特性。我们希望可以通过 Cascades Planner 来降低社区参与 TiDB 优化器开发的难度,能够吸引更多的同学参与 TiDB 的开发,同时也希望可以通过 Cascades Planner 来使 TiDB 在将来成为更加“通用”的 SQL 计算组件,让 TiDB 可以更容易地接入其他存储引擎。最后,非常欢迎大家加入 #sig-planner 和我们交流讨论~
原文阅读:
揭秘 TiDB 新优化器:Cascades Planner 原理解析 | PingCAP
如有需求请您联系我们!
地址:海南省海口市58号
电话:18888889999
手机:海南省海口市58号
Copyright © 2012-2018 首页-杏彩体育中国官方网站 版权所有 ICP备案编:琼ICP备88889999号