Oracle 死锁与慢查询总结
查看死锁
SELECT s.sid \"会话ID\",s.lockwait \"等待锁\",s.event \"等待的资源/事件\", -- 最近等待或正在等待的资源/事件DECODE(lo.locked_mode, 0, "尚未获得锁", 1, NULL, 2, "行共享锁", 3, "行排它锁", 4, "共享表锁",5,"共享行排它锁",6, "排它表锁") \"锁模式\",do.object_name \"被锁对象\",s.status \"会话状态\",sq.SQL_TEXT,sq.SQL_FULLTEXT, sq.executions \"SQL执行次数\",ROUND(sq.elapsed_time/1000000, 2) \"SQL执行时间(秒)\",DECODE(sq.executions,0,"-",NULL,"-",ROUND(sq.elapsed_time/1000000/sq.executions, 2)) \"SQL平均执行时间(秒)\", DECODE(sq.executions,0,"-",NULL,"-",ROUND(sq.rows_processed/sq.executions, 2)) \"平均返回行数\", s.sql_exec_start \"SQL开始执行时间\",sq.last_active_time \"查询计划最后活跃时间\",lo.process \"操作系统进程ID\",s.port \"进程端口号\",s.program \"进程名称\", lo.os_user_name \"操作系统用户名\",s.machine \"操作系统机器名称\","ALTER SYSTEM KILL SESSSION """||s.sid||","||s.serial#||""";" \"终止会话操作\"FROM v$sql sq JOIN v$session s on s.sql_hash_value = sq.hash_valueJOIN v$locked_object lo on lo.session_id = s.sidJOIN dba_objects do on do.object_id = lo.object_idWHERE s.username="OPT_WMS_USER" ; -- Oracle用户名称,大写
说明:
(资料图片仅供参考)
如果 lockwait 值不为空(形如0000001F83D6C748),并且 status 为 ACTIVE ,则说明存在死锁 event 最近等待或正在等待的资源/事件: enq: TX - row lock contention :按模式6等待TX:当会话等待另一个会话已持有的行级锁时发生该事件,即某个用户正在更新、删除另一个会话希望更新、删除的行时,会发生这种情况。这种类型的TX排队等待对应于等待事件 enq:TX - row lock contention 。 解决方案:已经持有锁的第一个会话执行提交或回查看慢查询
查询执行最慢的SQL
SELECT * FROM ( SELECT s.sql_text, --s.sql_fulltext, 注释掉该列,可以加快查询速度(如果需要查询完整sql文本,可以考虑通过sql_id二次查询) s.sql_id, s.executions \"执行次数\", ROUND(s.elapsed_time / 1000000, 2) \"总执行时间(秒)\", ROUND(s.elapsed_time / 1000000 / s.executions, 2) \"平均执行时间\", --单位:秒 s.first_load_time \"父游标创建时间\", s.parsing_user_id \"用户id\", u.username \"用户名\" FROM v$sqlarea s LEFT JOIN all_users u ON s.parsing_user_id = u.user_id WHERE s.executions >0 AND u.username = "OPT_WMS_USER" --注意 用户名大写 ORDER BY 平均执行时间 DESC)WHERE rownum <= 50
说明:为什么不从 v$sql 统计信息?这是因为即便相同的SQL,每次执行耗时也可能不一样,所以,考虑求平均值,所以需要对SQL分组统计, SQL_TEXT 相同,大概率为同一条SQL,所以考虑从按 SQL_TEXT 分组统计的 v$sqlarea 读取信息。当然,出于严谨的考虑,也可以不分组统计,把 v$sqlarea 替换成 v$sql 就好了。
查询SQL执行次数,按次数降序排序
SELECT * FROM ( SELECT s.sql_text, --s.sql_fulltext, s.sql_id, s.executions \"执行次数\", s.last_active_time \"最后执行时间\", s.first_load_time \"父游标创建时间\", s.parsing_user_id \"执行用户id\", u.username \"执行用户\", RANK() OVER(ORDER BY executions DESC) executions_rank FROM v$sql s LEFT JOIN all_users u ON u.user_id = s.parsing_user_id) TWHERE executions_rank <= 100;
注意:之所以从 v$sql 获取统计数据,是因为这里未对 SQL_TEXT 做GROUP BY(SQL_TEXT是完整SQL文本前1000个字符,存在截断的可能,按在这个统计可能不准确),就针对每条SQL(不管是否相同)单独统计,当然,也可以考虑按 SQL_TEXT 分组统计,把 v$sql 改成 v$sqlarea 就好了。
查看存在 TABLE ACCESS FULL 行为的SQL
SELECT s.sql_text, s.sql_fulltext, sp.sql_id FROM v$sql_plan spLEFT JOIN v$sql s on sp.sql_id = s.sql_idWHERE sp.operation = "TABLE ACCESS"AND sp.options = "FULL"AND sp.object_owner = "OPT_WMS_USER_B" --注意 用户名大写 --可选查询条件
V$SQL
V$SQL 列出了关于共享SQL区,不含 GROUP BY 子句的统计,输入的原始SQL文本的每个子项各占一行。通常在查询执行结束时更新 V$SQL 中展示的统计信息,然而针对长耗时查询,每5秒更新一次。这样更容易在运行期间查看长时间运行的SQL语句带来的影响
Column | Datatype | Description |
SQL_TEXT | VARCHAR2(1000) | 当前游标的SQL文本的前1000个字符 |
SQL_FULLTEXT | CLOB | 以 |
SQL_ID | VARCHAR2(13) | 类库缓存中父游标的SQL标识。 |
SHARABLE_MEM | NUMBER | 子游标使用的共享内存量(字节为单位) |
PERSISTENT_MEM | NUMBER | 子游标生存周期内使用的固定内存量(字节为单位) |
RUNTIME_MEM | NUMBER | 子游标运行期间所需的固定内存量(字节为单位) |
SORTS | NUMBER | 子游标完成的排序次数 |
LOADED_VERSIONS | NUMBER | 指示是否已加载上下文堆,1表示已加载,0表示未加载。 |
OPEN_VERSIONS | NUMBER | 指示子游标是否被锁定,1表示被锁定,0表示未被锁定 |
USERS_OPENING | NUMBER | 任意子游标打开的用户数。 |
FETCHES | NUMBER | 与SQL语句关联的FETCHES的次数 |
EXECUTIONS | NUMBER | 自从对象被加载到类库缓存后,该对象被执行次数。 |
PX_SERVERS_EXECUTIONS | NUMBER | 并行执行服务器执行的总次数 ( 当语句从未被并行执行时为0) |
END_OF_FETCH_COUNT | NUMBER | 游标被加载到类库缓存后,被完整执行的次数。当游标部分执行时,此统计值不会增加,不管是因为在执行过程中失败,还是在关闭或重新执行游标之前只提取了此游标生成的前几行。根据定义,END_of_FETCH_COUNT列的值应小于或等于EXECUTIONS列的值。 |
USERS_EXECUTING | NUMBER | 执行语句的用户数 |
LOADS | NUMBER | 对象被加载或者重新加载的次数 |
FIRST_LOAD_TIME | VARCHAR2(19) | 父游标的创建时间 |
INVALIDATIONS | NUMBER | 子游标无效的次数 |
PARSE_CALLS | NUMBER | 子游标的解析调用次数 |
DISK_READS | NUMBER | 子游标的磁盘读取次数 |
DIRECT_WRITES | NUMBER | 子游标的直接写次数 |
BUFFER_GETS | NUMBER | 子游标的获取缓存区次数 |
APPLICATION_WAIT_TIME | NUMBER | 应用等待时间(微秒为单位) |
CONCURRENCY_WAIT_TIME | NUMBER | 并发等待时间(微秒为单位) |
CLUSTER_WAIT_TIME | NUMBER | 集群等待时间(微秒为单位) |
USER_IO_WAIT_TIME | NUMBER | 用户I/O等待时间(微秒为单位) |
PLSQL_EXEC_TIME | NUMBER | PL/SQL执行时间(微秒为单位) |
JAVA_EXEC_TIME | NUMBER | Java执行时间(微秒为单位) |
ROWS_PROCESSED | NUMBER | 已解析SQL语句返回的总行数 |
COMMAND_TYPE | NUMBER | Oracle命令类型定义 |
OPTIMIZER_MODE | VARCHAR2(10) | SQL语句执行模式(优化器模型) |
OPTIMIZER_COST | NUMBER | 优化器给出的查询成本 |
PARSING_USER_ID | NUMBER | 最初构建此子游标的用户ID |
PARSING_SCHEMA_ID | NUMBER | 最初构建子游标使用的模式ID |
PARSING_SCHEMA_NAME | VARCHAR2(30) | 最初构建子游标使用的模式名称 |
SERVICE | VARCHAR2(64) | 服务名称 |
SERVICE_HASH | NUMBER | SERVICE列展示的服务名称的哈希值 |
MODULE | VARCHAR2(64) | SQL语句第一次被解析时正在执行的模块名称,该名称可通过调用DBMS_APPLICATION_INFO.SET_MODULE进行设置。 |
MODULE_HASH | NUMBER | MODULE列展示的模块名称的哈希值 |
SERIALIZABLE_ABORTS | NUMBER | 每个游标事务序列化失败并产生ORA-08177错误的次数 |
CPU_TIME | NUMBER | 此游标用于解析,执行,获取(fetch)的CPU耗时 (以微秒为单位) |
ELAPSED_TIME | NUMBER | 此游标用于解析,执行,获取的占用时间(以微秒为单位)。如果游标采用并行执行,则ELAPSED_TIME 为查询协调器及所有并行查询slave进程的累计占用时间。 |
OBJECT_STATUS | VARCHAR2(19) | 游标的状态:VALID - 有效,无错误授权 VALID_AUTH_ERROR - 有效,有授权错误授权。VALID_COMPILE_ERROR - 有效, 有编译错误授权。VALID_UNAUTH - 有效,未授权。INVALID_UNAUTH - 无效,未授权。INVALID - 无效,未授权,但保留时间戳。 |
LAST_LOAD_TIME | VARCHAR2(19) | 查询计划被加载到类库缓存的时间 |
IS_OBSOLETE | VARCHAR2(1) | 指示游标是否已过时,是(Y) 或者否(N)。如果子游标的数量太大,则可能发生这种情况。 |
LAST_ACTIVE_TIME | DATE | 查询计划最后活跃时间(即完成SQL解析的时间,可以当做SQL最后执行的时间) |
IO_INTERCONNECT_BYTES | NUMBER | Oracle 数据库和存储系统之间交换的I/O字节数。 |
PHYSICAL_READ_REQUESTS | NUMBER | 被监控SQL发起的物理读I/O请求 |
PHYSICAL_READ_BYTES | NUMBER | 被监控SQL从磁盘读取的字节数。 |
PHYSICAL_WRITE_REQUESTS | NUMBER | 被监控SQL发起的物理写I/O请求。 |
PHYSICAL_WRITE_BYTES | NUMBER | 被监控SQL写入磁盘的字节数 |
OPTIMIZED_PHY_READ_REQUESTS | NUMBER | 被监控SQL从数据库智能闪存缓存发起的物理读取I/O请求数 |
LOCKED_TOTAL | NUMBER | 子游标被锁定的总次数 |
V$SQLAREA 显示共享SQL区域的统计信息,每条SQL字符串为一行。它提供内存中、已解析并准备执行的SQL语句的统计信息。 V$SQLAREA 和 V$SQL 两个视图的不同之处在于, V$SQL 中为每一条SQL保留一个条目,而 V$SQLAREA 中根据 SQL_TEXT 进行GROUP BY,通过VERSION_COUNT计算子指针的个数
V$SESSION
V$SESSION 显示当前会话的会话信息,常见视图字段及字段描述说明如下:
列 | 描述 |
SID | 会话ID |
SERIAL# | 会话序列号。用于唯一标识会话的对象。如果会话结束,而另一个会话以相同的会话ID开始,则保证将会话级命令应用于当前会话的对象。 |
USER# | Oracle用户ID |
USERNAME | Oracle用户名称 |
COMMAND | 正在执行的命令(解析的最后一条语句)。可以通过运行以下SQL查询来查找此 COMMAND 列中返回的任何值 n 的命令名:SELECT Command_name FROM v$sqlcommand WHERE command_type=n COMMAND ”列值为 0,则表示该命令未记录在V$SESSION中。 |
LOCKWAIT | 会话正在等待的锁的地址。NULL值表示没有等待锁。 |
STATUS | 会话状态:ACTIVE-会话当前正在执行SQL,INACTIVE-处于非活动状态且没有配置限制或尚未超过配置的限制的会话。KILLED-标记为被终止的会话。CACHED-为Oracle XA临时缓存的会话。SNIPED-超出某些配置限制(例如,为资源管理器消费者组指定的资源限制或用户配置文件中指定的idle_time)的非活动会话。此类会话将不允许再次激活。 |
SCHEMA# | Schema用户ID |
SCHEMANAME | Schema用户名称 |
OSUSER | 操作系统客户端用户名称 |
PROCESS | 操作系统客户端进程ID |
MACHINE | 操作系统机器名称 |
PORT | 客户端进程端口号 |
TERMINAL | 操作系统终端名称 |
PROGRAM | 操作系统进程名称 |
TYPE | 会话类型 |
SQL_HASH_VALUE | 配合 SQL_HASH_VALUE使用,用于标识当前正在执行的SQL语句。 |
SQL_ID | 当前正在执行的SQL语句的ID |
SQL_EXEC_START | 会话当前执行的SQL开始执行的时间;如果SQL_ID为NULL,则为NULL |
SQL_EXEC_ID | SQL执行标识。 如果SQL_ID为NULL或者该SQL执行还未启动,则为NULL |
LAST_CALL_ET | 如果会话STATUS当前为ACTIVE,则该值表示自会话变为活动状态以来经过的时间(以秒为单位),如果会话STATUS当前为INACTIVE,则该值表示自会话变为非活动状态以来经过的时间(以秒为单位) |
EVENT | 如果会话当前正在等待,则为会话正在等待的资源或事件。如果会话不在等待中,则为会话最近等待的资源或事件。 查阅: \"Oracle Wait Events\" |
V$LOCKED_OBJECT
V$LOCKED_OBECT 列出了系统上每个事务获取的所有锁。它显示了哪些会话在什么对象上以及在什么模式下持有DML锁(即TM类型的队列)。视图常见字段及描述如下:
列 | 描述 |
OBJECT_ID | 正被锁住的对象ID |
SESSION_ID | 会话ID |
ORACLE_USERNAME | Oracle用户名 |
OS_USER_NAME | 操作系统用户名 |
PROCESS | 操作系统进程ID |
LOCKED_MODE | 锁模式。此列的数值映射到表锁的锁模式的这些文本值:0-无:请求但尚未获得的锁;1-NULL;2-ROWS_S(SS):行共享锁;3-Row_X(SX):行排它锁;4-Share(S):共享表锁;5-S/Row-X(SSX):共享行排它锁;6-独占(X):排它表锁。 另请参阅: Oracle数据库概念,以获取有关表锁锁模式的更多信息 |
SELECT object_id \"被锁住的对象ID\",locked_mode \"锁模式\",session_id \"会话ID\",oracle_username \"Oracle用户名\",os_user_name \"操作系统用户名\",process \"操作系统进程ID\"FROM V$LOCKED_OBJECT;