ICode9

精准搜索请尝试: 精确搜索
首页 > 数据库> 文章详细

PostgreSQL中的孤儿文件(orphaned data files)

2020-11-18 08:32:00  阅读:576  来源: 互联网

标签:files 11 PostgreSQL postgres base 75062 data select


创建一个测试表

postgres=# create table t1(a int);
CREATE TABLE
postgres=# select pg_relation_filepath('t1');
 pg_relation_filepath 
----------------------
 base/75062/75297
(1 row)

postgres=# 

在操作系统上已经可以看到该文件。

$ ls -la $PGDATA/base/75062/75297
-rw------- 1 postgres postgres 0 Nov  9 11:11 /data/pgdata/11/data/base/75062/75297

插入一些数据:

postgres=# show segment_size;
 segment_size 
--------------
 1GB
(1 row)
postgres=# insert into t1 select * from generate_series(1,100000000);
INSERT 0 100000000
postgres=# 

因为segment_size的设置为1GB,磁盘上已经有了多个文件

$ ls -la $PGDATA/base/75062/75297*
-rw------- 1 postgres postgres 1073741824 Nov  9 11:19 /data/pgdata/11/data/base/75062/75297
-rw------- 1 postgres postgres 1073741824 Nov  9 11:17 /data/pgdata/11/data/base/75062/75297.1
-rw------- 1 postgres postgres 1073741824 Nov  9 11:18 /data/pgdata/11/data/base/75062/75297.2
-rw------- 1 postgres postgres  439803904 Nov  9 11:19 /data/pgdata/11/data/base/75062/75297.3
-rw------- 1 postgres postgres     917504 Nov  9 11:18 /data/pgdata/11/data/base/75062/75297_fsm

现在,开启另一个会话(session 2)。
在session2中,启动一个事务并创建一个空表,但是不提交事务:

postgres=# begin;
BEGIN
postgres=# create table t2(a int);
CREATE TABLE
postgres=# select pg_relation_filepath('t2');
 pg_relation_filepath 
----------------------
 base/75062/75300
(1 row)

postgres=# select * from pg_backend_pid();
 pg_backend_pid 
----------------
          17710
(1 row)

postgres=# 

在操作系统已经可以看到对应的文件:

$ ls -la $PGDATA/base/75062/75300
-rw------- 1 postgres postgres 0 Nov  9 11:23 /data/pgdata/11/data/base/75062/75300

如果这个时候,posrgresql server发生了奔溃、或者发生了oom被kill了或者session被kill了。会发生什么呢?
我们来模拟一下session被kill的场景:

$ kill -9 17710


再次在session2中执行查询:

postgres=# select 1;
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.
The connection to the server was lost. Attempting reset: Succeeded.
postgres=# 

这个session在事务提交之前被kill了,事务无法正常完成,但是事务已经创建了一个表。应该发生什么呢?事务被回滚,创建的表应该不存在了。

postgres=# select * from t2;
ERROR:  relation "t2" does not exist
LINE 1: select * from t2;
                      ^
postgres=# 


这正是我们所预期的。但在操作系统上,文件仍然存在:

$ ls -la $PGDATA/base/75062/75300
-rw------- 1 postgres postgres 0 Nov  9 11:23 /data/pgdata/11/data/base/75062/75300

这样,文件就成了孤儿文件(orphaned file)。

postgresql并不知道这个文件属于哪个relation

postgres=# select relname from pg_class where oid = '75300';
 relname 
---------
(0 rows)

postgres=# 

这样,你就需要自己手动清理孤儿文件了!

假设你做了大量的数据的加载,就在加载完成之前,会话被杀死:

postgres=# begin;
BEGIN
postgres=# create table t3(a int);
CREATE TABLE
postgres=# select pg_relation_filepath('t3');
 pg_relation_filepath 
----------------------
 base/75062/99528
(1 row)

postgres=# select * from pg_backend_pid();
 pg_backend_pid 
----------------
          21988
(1 row)

postgres=# insert into t3 select * from generate_series(1,1000000000);
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.
The connection to the server was lost. Attempting reset: Failed.


虽然会话被kill了。但是磁盘上的空间并没有被释放。

$ ls -la $PGDATA/base/75062/99528*
-rw------- 1 postgres postgres 1073741824 Nov  9 11:51 /data/pgdata/11/data/base/75062/99528
-rw------- 1 postgres postgres  413777920 Nov  9 11:51 /data/pgdata/11/data/base/75062/99528.1
-rw------- 1 postgres postgres     385024 Nov  9 11:51 /data/pgdata/11/data/base/75062/99528_fsm


在最糟糕的时候,可能会占用大量的磁盘空间。那是否有什么方法去检测这些孤儿文件呢?
你需要比较postgresql中的目录表中的记录和文件系统上信息,然后删除这些孤儿文件。这个过程需要小心谨慎。

首先获得你要检测的数据库的oid:

postgres=# select oid from pg_database where datname = 'postgres';
  oid  
-------
 75062
(1 row)

postgres=#


这样就可以知道文件在文件系统上的位置。即 $PGDATA/base/[OID_OF_THE_DATABASE]

然后,获得孤儿文件:

postgres=# select * from pg_ls_dir ( '/data/pgdata/11/data/base/75062' ) as file where file ~ '^[0-9]*$' and file::text not in (select oid::text from pg_class );
 file  
-------
 75280
 75281
 75282
 75283
 75300
 83144
 99528
(7 rows)

postgres=# 

  

 

标签:files,11,PostgreSQL,postgres,base,75062,data,select
来源: https://www.cnblogs.com/abclife/p/13948101.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有