如何监测谁用了SQL Server的Tempdb空间?

时间:2022-06-17 16:52:36

Tempdb 系统数据库是一个全局资源,供连接到 SQL Server 实例的所有用户使用。在现在的SQL Server里,其使用频率可能会超过用户的想象。如果Tempdb空间耗尽,许多操作将不能完成。

作为一个支持工程师,会被经常问到象“我的Tempdb为什么这么大?”“是谁把我的Tempdb空间用完的?”在SQL 2000的时候,这个问题很难回答。好在SQL 2005以后,引入了一张新的管理视图:sys.dm_db_file_space_usage。通过查询这张视图,能了解tempdb的空间使用情况,能知道tempdb的空间是被哪一块对象使用掉的,是用户对象(user_object_reserved_page_count字段),还是系统对象(internal_object_reserved_page_count字段),还是版本存储区(version_store_reserved_page_count字段)。

在讨论Tempdb空间使用之前,我们先简单介绍一下通常什么操作会大量使用Tempdb。在SQL 2005和SQL 2008里,使用Tempdb空间的远远不止是临时表。常见的使用对象有:

用户对象(user_object_reserved_page_count)

用户对象由用户显式创建。这些对象可以位于用户会话的作用域中,也可位于创建对象所用例程的作用域中。 可以是存储过程、触发器或用户定义函数。 用户对象可以是下列项之一:

  • 用户定义的表和索引
  • 系统表和索引
  • 全局临时表和索引
  • 局部临时表和索引
  • table 变量
  • 表值函数中返回的表

内部对象(internal_object_reserved_page_count)

内部对象是根据需要由 SQL Server 数据库引擎创建的,用于处理 SQL Server 语句。 内部对象可以在语句的作用域中创建和删除。 内部对象可以是下列项之一:

  • 用于游标。
  • 用于哈希联接或哈希聚合操作的查询。
  • 某些 GROUP BY、ORDER BY 或 UNION 查询的中间排序结果。

版本存储(version_store_reserved_page_count)

版本存储区主要用来支持Snapshot事务隔离级别,以及SQL 2005以后推出的一些其他提高数据库并发度的新功能。

由此可见,光从用户发过来的语句本身,是很难判断这个连接的操作是否会使用Tempdb的。一个典型的例子,就是某些查询。如果表格上有良好的索引做支持,SQL Server不需要做哈希联接(Hash Join),那这个查询就不会用Tempdb。反之,如果表格很大,又没有好的索引,那Tempdb使用量就可能不小。

tempdb空间使用的一大特点,是只有一部分对象,例如用户创建的临时表、table变量等,可以用sys.allocation_units 和sys.partitions这样的管理视图来管理。许多内部对象和版本存储在这些管理视图里没有体现。所以,sp_spaceused的结果和真实使用会有很大差异,tempdb的空间使用是不能用sp_spaceused来跟踪的。必须借助sys.dm_db_file_space_usage这样的管理视图和管理函数,才能看到全貌。

 

下面以一个实例,讨论一下如何用DBCC命令、管理视图(DMV)以及管理函数(DMF)来监视是什么语句正在使用tempdb。

为了使结果简单,我们在测试之前先把SQL Server重起一次。

然后我们在Management Studio里做一个连接(连接A),将下面语句输入。这些语句会使用tempdb的空间。

USE [My_Test_DB]
go

SELECT GETDATE()
go

SELECT *
INTO #MyOrderSource
FROM OrderSource AS o

-- 创建一个temp table,OrderSource 是一个很大的表这样效果更明显
-- 这个操作应该会申请user objects page
go

WAITFOR DELAY '0:0:2'

SELECT GETDATE()
go

DROP TABLE #MyOrderSource

-- 删除一个temp table
-- 这个操作后user object page数量应该会下降

go

WAITFOR DELAY '0:0:2'

SELECT GETDATE()
go

SELECT TOP 100000*
FROM OrderSource AS o
JOIN shippingOrder AS s ON o.OrderId=b.OrderId


-- 这里做了一个比较大的join.

-- 应该会有internal objects的申请.

go

SELECT GETDATE()

-- join 语句做完以后internal objects page数目应该下降

那用什么脚本可用监视上面的行为呢?下面的脚本就可以监视和发现当前的Tempdb使用者。这个脚本需要在使用tempdb的语句开始运行之前开始。(读者当然可以根据自己的喜好,修改这个脚本。)

脚本首先用“dbcc showfilestats”语句查询当前tempdb的总体使用量。再查询sys.dm_db_file_space_usage视图,得到Tempdb里当前总共有多少用户对象、内部对象、以及版本存储。然后查询sys.dm_db_session_space_usage和sys.dm_exec_sessions,找到当前使用Tempdb的所有连接。最后通过sys.dm_exec_sql_text,找到这些连接正在运行的语句。

USE tempdb                                                               

-- 每隔1秒钟运行一次,直到用户手工终止脚本运行

WHILE 1 = 1
BEGIN

-- Query 1
-- 从文件级看tempdb使用情况
DBCC showfilestats

-- Query 2
-- 返回所有做过空间申请的session信息
SELECT 'tempdb' AS database_name , GETDATE() AS Time , SUM(user_object_reserved_page_count)/128. AS user_objects_mb ,
SUM(internal_object_reserved_page_count)/128. AS internal_objects_mb , SUM(version_store_reserved_page_count)/128. AS version_store_kb ,
SUM(unallocated_extent_page_count)/128. AS freespace_mb
FROM sys.dm_db_file_space_usage
WHERE database_id = 2

-- Query 3
-- 这个管理视图能够反映当时tempdb空间的总体分配
SELECT t1.session_id , t1.internal_objects_alloc_page_count , t1.user_objects_alloc_page_count , t1.internal_objects_dealloc_page_count ,
t1.user_objects_dealloc_page_count , t3.login_time , t3.login_name , t3.host_name , t3.nt_domain , t3.nt_user_name , t3.program_name ,
t3.status , t3.client_interface_name , t3.cpu_time , t3.memory_usage , t3.total_scheduled_time , t3.total_elapsed_time ,
t3.last_request_start_time , t3.last_request_end_time , t3.reads , t3.writes , t3.logical_reads , t3.is_user_process , t3.row_count ,
t3.prev_error , t3.original_security_id , t3.original_login_name , t3.last_successful_logon , t3.last_unsuccessful_logon ,
t3.unsuccessful_logons , t3.group_id
FROM sys.dm_db_session_space_usage t1 ,
-- 反映每个session累计空间申请
sys.dm_exec_sessions AS t3
-- 每个session的信息
WHERE t1.session_id = t3.session_id
AND (
t1.internal_objects_alloc_page_count > 0
OR t1.user_objects_alloc_page_count > 0
OR t1.internal_objects_dealloc_page_count > 0
OR t1.user_objects_dealloc_page_count > 0
)

-- Query 4
-- 返回正在运行并且做过空间申请的session正在运行的语句
SELECT t1.session_id , st.text , GETDATE()
FROM sys.dm_db_session_space_usage AS t1 ,
sys.dm_exec_requests AS t4
CROSS APPLY sys.dm_exec_sql_text(t4.sql_handle) AS st
WHERE t1.session_id = t4.session_id
AND t1.session_id > 50
AND (
t1.internal_objects_alloc_page_count > 0
OR t1.user_objects_alloc_page_count > 0
OR t1.internal_objects_dealloc_page_count > 0
OR t1.user_objects_dealloc_page_count > 0
)
-- Query 5
-- 返回正在运行的活动的空间使用情况以及语句内容和执行计划
;WITH task_space_usage AS (
-- SUM alloc/delloc pages
SELECT session_id,
request_id,
SUM(internal_objects_alloc_page_count) AS alloc_pages,
SUM(internal_objects_dealloc_page_count) AS dealloc_pages
FROM sys.dm_db_task_space_usage WITH (NOLOCK)
WHERE session_id <> @@SPID
GROUP BY session_id, request_id
)
SELECT TSU.session_id,
TSU.alloc_pages * 1.0 / 128 AS [internal object MB space],
TSU.dealloc_pages * 1.0 / 128 AS [internal object dealloc MB space],
EST.text,
-- Extract statement from sql text
ISNULL(
NULLIF(
SUBSTRING(
EST.text,
ERQ.statement_start_offset / 2,
CASE WHEN ERQ.statement_end_offset < ERQ.statement_start_offset THEN 0 ELSE( ERQ.statement_end_offset - ERQ.statement_start_offset ) / 2 END
), ''
), EST.text
) AS [statement text],
EQP.query_plan
FROM task_space_usage AS TSU
INNER JOIN sys.dm_exec_requests ERQ WITH (NOLOCK)
ON TSU.session_id = ERQ.session_id
AND TSU.request_id = ERQ.request_id
OUTER APPLY sys.dm_exec_sql_text(ERQ.sql_handle) AS EST
OUTER APPLY sys.dm_exec_query_plan(ERQ.plan_handle) AS EQP
WHERE EST.text IS NOT NULL OR EQP.query_plan IS NOT NULL
ORDER BY 3 DESC, 5 DESC


WAITFOR DELAY '0:0:1'
END

在运行这个脚本的连接(连接 B )里 ,我们选择好“ 将结果保存到文本 ”。先开始运行它,指定输出文件路径。然后,我们再运行连接 A (图 2 )。连接 A 运行结束后,手工停止连接 B 的运行。

 连接B生成的是一个文本文件。文本里面可以看出tempdb的使用空间有过增长和下降。结果我在这里不做过多的分析,有兴趣的可以尝试一下

如果没有太好的分析,可以创建几个表,然后把查询结果插入到表里面,然后对表进行分析。从而来确定导致你tempdb 暴增的原因。下面附上建表的脚本,供大家参考使用

-- 1
-- 创建表 tb_showfilestats 记录 DBCC showfilestats 返回的信息
IF OBJECT_ID('tb_showfilestats' , 'U') IS NOT NULL
DROP TABLE tb_showfilestats
GO
CREATE TABLE tb_showfilestats
(
id INT IDENTITY(1,1) PRIMARY KEY,
Fileid INT ,
FileGroup INT ,
TotalExtents INT ,
UsedExtents INT ,
Name VARCHAR(100) ,
FILENAME VARCHAR(255)
)
GO

-- 2
-- 创建表 tb_db_file_space_usage 记录 所有做过空间申请的 session 信息

IF OBJECT_ID('tb_db_file_space_usage' , 'U') IS NOT NULL
DROP TABLE tb_db_file_space_usage
GO
CREATE TABLE tb_db_file_space_usage
(
id INT IDENTITY(1,1) PRIMARY KEY,
database_name VARCHAR(50) ,
InDate DATETIME ,
user_objects_mb DECIMAL(18,4) ,
internal_objects_mb DECIMAL(18,4) ,
version_store_kb DECIMAL(18,4) ,
freespace_mbFILENAME DECIMAL(18,4)
)
GO

-- 3
-- 创建表 tb_db_session_space_usage 记录正在运行的 tempdb 空间的总体分配

IF OBJECT_ID('tb_db_session_space_usage' , 'U') IS NOT NULL
DROP TABLE tb_db_session_space_usage
GO
CREATE TABLE tb_db_session_space_usage
(
id INT IDENTITY(1,1) PRIMARY KEY,
session_id INT ,
internal_objects_alloc_page_count INT ,
user_objects_alloc_page_count INT ,
internal_objects_dealloc_page_count INT ,
user_objects_dealloc_page_count INT ,
login_time DATETIME ,
login_name VARCHAR(100) ,
host_name NVARCHAR(128) ,
nt_domain NVARCHAR(128) ,
nt_user_name NVARCHAR(128) ,
program_name NVARCHAR(128) ,
status VARCHAR(50) ,
client_interface_name NVARCHAR(32) ,
cpu_time INT ,
memory_usage INT ,
total_scheduled_time INT ,
total_elapsed_time INT ,
last_request_start_time DATETIME ,
last_request_end_time DATETIME ,
reads INT ,
writes INT ,
logical_reads INT ,
is_user_process BIT ,
row_count BIGINT ,
prev_error INT ,
original_security_id VARBINARY(85) ,
original_login_name NVARCHAR(128) ,
last_successful_logon DATETIME ,
last_unsuccessful_logon DATETIME ,
unsuccessful_logons BIGINT ,
group_id INT
)
GO

-- 4
-- 记录正在运行并且做过空间申请的session正在运行的语句.


IF OBJECT_ID('tb_db_sql_text' , 'U') IS NOT NULL
DROP TABLE tb_db_sql_text
GO
CREATE TABLE tb_db_sql_text
(
id INT IDENTITY(1,1) PRIMARY KEY,
session_id VARCHAR(50) ,
text VARCHAR(MAX),
InDate DATETIME
)
GO

-- 5
-- 记录正在运行的活动的空间使用情况以及语句内容和执行计划.

IF OBJECT_ID('tb_task_space_usage' , 'U') IS NOT NULL
DROP TABLE tb_task_space_usage
GO
CREATE TABLE tb_task_space_usage
(
id INT IDENTITY(1 , 1)PRIMARY KEY ,
session_id INT ,
internal_object_space_MB DECIMAL(18 , 4) ,
internal_object_dealloc_space_MB DECIMAL(18 , 4) ,
text VARCHAR(MAX) ,
statement_text VARCHAR(MAX) ,
query_plan XML
)