虽然估算直行和表格大小是相当简单的数学,但我们发现猜测每个索引将占用多少空间(对于给定的表格大小)是一项挑战。我们可以学习哪些方面来计算指数的更好估计和增长率?

有帮助吗?

解决方案

索引叶有一个标识数据页的前导码(7个字节加上可变长度列的一些目录信息,如果有的话)加上一个键值的副本,这些副本的大小与那些表的数据大小相同列。表格中的每一行都有一个。索引的较高级别要小得多,通常不到叶子的1%,除非你索引一个非常宽的密钥。

填充因子留出一些空间,因此更新和插入不会产生过多的叶子分裂流量。

编辑:此MSDN链接描述了页面级结构,虽然它对单个索引行的格式有点了解。 此演示文稿在某种程度上进入磁盘日志条目和数据页的物理格式。 这一个更多细节,包括索引数据结构。数字和固定长度的列具有在盒子上显示的大小;你必须估计varchar列的平均大小。

作为参考,可以在此处这里。

其他提示

如果可能,我通常会从原始表中获取1000条记录, 将它们插入我自己的表中, 并且使用下面的脚本我可以使用一个样本。

好吧,这不准确,但可以给我一个起点。

--Find out the disk size of an index:
--USE [DB NAME HERE]
go
SELECT
OBJECT_NAME(I.OBJECT_ID) AS TableName,
I.name AS IndexName,   
8 * SUM(AU.used_pages) AS 'Index size (KB)',
CAST(8 * SUM(AU.used_pages) / 1024.0 AS DECIMAL(18,2)) AS 'Index size (MB)'
FROM
sys.indexes I
JOIN sys.partitions P ON P.OBJECT_ID = I.OBJECT_ID AND P.index_id = I.index_id
JOIN sys.allocation_units AU ON AU.container_id = P.partition_id
--WHERE 
--    OBJECT_NAME(I.OBJECT_ID) = '<TableName>'    
GROUP BY
I.OBJECT_ID,    
I.name
ORDER BY
TableName

--========================================================================================

--http://msdn.microsoft.com/en-us/library/fooec9de780-68fd-4551-b70b-2d3ab3709b3e.aspx

--I believe that keeping the GROUP BY 
--is the best option in this case
--because of sys.allocation_units
--can have 4 types of data inside
--as below:

--type tinyint
--Type of allocation unit.
--0 = Dropped
--1 = In-row data (all data types, except LOB data types)
--2 = Large object (LOB) data (text, ntext, image, xml, large value types, and CLR     user-defined types)
--3 = Row-overflow data

--marcelo miorelli 8-NOV-2013
--========================================================================================
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top