依赖自动统计对性能的影响 from: http://www.cnblogs.com/tom-fu/archive/2008/09/06/1285816.html在使用索引对数据进行查询时,优化器考虑是执行索引扫描还是索......
依赖自动统计对性能的影响
from: http://www.cnblogs.com/tom-fu/archive/2008/09/06/1285816.html
在使用索引对数据进行查询时,优化器考虑是执行索引扫描还是索引查找的依据是根据此索引相关的统计信息。但统计的步长不能超过200(DBCC SHOW_STATISTICS返回的第三部分结果),这在数据量很大的表中,使得统计信息的精度变得越来越不准确。当然,这个影响不会很致命,发生的机会也很少。关键是统计信息得不到及时更新的话,就会使优化器选择错误的执行计划了。
如果我们在事件探查器中发现很多的MISSING_COLUMN_STATISTICS事件时,可以把异步自动更新统计这个选项设置为True。以防止因为查询等待统计信息完成而超时,但这时的查询肯定会因为统计信息不准而选择错误的执行计划了。那么统计信息是在什么时候会被自动更新的呢?
在兼容视图sys.sysindexes中的rowmodctr列中记录了自上次更新统计之后发生变化的记录数,每个统计信息对会对应一行。对就记录数小于500的来说,当变化超过500时,才会触发自动更新。对于更大的表,更新发生在500 20%*表的记录数被修改后(增删改都计算在内)。基于这个更新的比例,如果我们只依赖于自动更新统计时,就会造成优化器选择错误的执行计划了。
下面我们通过一个例子来演示一下这种过于延迟的自动更新操作带来的查询性能的损失。Northwind数据库的Orders表的OrderDate建立一个非唯一非聚集索引。
从上面的实验结果看,适度的对一些经常被修改的表手工进行统计更新可以防止优化器生成错误的执行计划。
|