neondatabase · knizhnik · Apr 23, 2022 · Mar 14, 2022 · Apr 7, 2022 · Apr 19, 2022
diff --git a/contrib/zenith/inmem_smgr.c b/contrib/zenith/inmem_smgr.c
@@ -41,6 +41,9 @@ inmem_init(void)
 {
 	HASHCTL		hashCtl;
 
+	if (inmem_files && hash_get_num_entries(inmem_files) == 0)
+		return;
+
 	hashCtl.keysize = sizeof(WrNodeKey);
 	hashCtl.entrysize = sizeof(WrNode);
 

diff --git a/src/backend/storage/buffer/bufmgr.c b/src/backend/storage/buffer/bufmgr.c
@@ -800,6 +800,8 @@ ReadBufferWithoutRelcache(RelFileNode rnode, ForkNumber forkNum,
 							 mode, strategy, &hit);
 }
 
+extern bool am_wal_redo_postgres;
+
 
 /*
  * ReadBuffer_common -- common logic for all ReadBuffer variants
@@ -815,7 +817,7 @@ ReadBuffer_common(SMgrRelation smgr, char relpersistence, ForkNumber forkNum,
 	Block		bufBlock;
 	bool		found;
 	bool		isExtend;
-	bool		isLocalBuf = SmgrIsTemp(smgr);
+	bool		isLocalBuf = SmgrIsTemp(smgr) || am_wal_redo_postgres;
 
 	*hit = false;
 

diff --git a/src/backend/tcop/zenith_wal_redo.c b/src/backend/tcop/zenith_wal_redo.c
@@ -99,6 +99,9 @@ static ssize_t buffered_read(void *buf, size_t count);
 
 static BufferTag target_redo_tag;
 
+bool am_wal_redo_postgres;
+static XLogReaderState reader_state;
+
 #define TRACE DEBUG5
 
 #ifdef HAVE_LIBSECCOMP
@@ -166,6 +169,7 @@ WalRedoMain(int argc, char *argv[],
 	InitStandaloneProcess(argv[0]);
 
 	SetProcessingMode(InitProcessing);
+	am_wal_redo_postgres = true;
 
 	/*
 	 * Set default values for command-line options.
@@ -293,6 +297,7 @@ WalRedoMain(int argc, char *argv[],
 		if (RmgrTable[rmid].rm_startup != NULL)
 			RmgrTable[rmid].rm_startup();
 	}
+	reader_state.errormsg_buf = MemoryContextAlloc(TopMemoryContext, 1000 + 1); /* MAX_ERRORMSG_LEN */
 
 #ifdef HAVE_LIBSECCOMP
 	/* We prefer opt-out to opt-in for greater security */
@@ -313,24 +318,23 @@ WalRedoMain(int argc, char *argv[],
 	/*
 	 * Main processing loop
 	 */
+	MemoryContextSwitchTo(MessageContext);
+	initStringInfo(&input_message);
+
 	for (;;)
 	{
 		/*
 		 * Release storage left over from prior query cycle, and create a new
 		 * query input buffer in the cleared MessageContext.
 		 */
-		MemoryContextSwitchTo(MessageContext);
-		MemoryContextResetAndDeleteChildren(MessageContext);
-
-		initStringInfo(&input_message);
+		resetStringInfo(&input_message);
 
 		set_ps_display("idle");
 
 		/*
 		 * (3) read a command (loop blocks here)
 		 */
 		firstchar = ReadRedoCommand(&input_message);
-
 		switch (firstchar)
 		{
 			case 'B':			/* BeginRedoForBlock */
@@ -406,23 +410,6 @@ pprint_buffer(char *data, int len)
 	return s.data;
 }
 
-static char *
-pprint_tag(BufferTag *tag)
-{
-	StringInfoData s;
-
-	initStringInfo(&s);
-
-	appendStringInfo(&s, "%u/%u/%u.%d blk %u",
-		tag->rnode.spcNode,
-		tag->rnode.dbNode,
-		tag->rnode.relNode,
-		tag->forkNum,
-		tag->blockNum
-	);
-
-	return s.data;
-}
 /* ----------------------------------------------------------------
  *		routines to obtain user input
  * ----------------------------------------------------------------
@@ -492,7 +479,6 @@ ReadRedoCommand(StringInfo inBuf)
 	return qtype;
 }
 
-
 /*
  * Prepare for WAL replay on given block
  */
@@ -502,7 +488,6 @@ BeginRedoForBlock(StringInfo input_message)
 	RelFileNode rnode;
 	ForkNumber forknum;
 	BlockNumber blknum;
-	MemoryContext oldcxt;
 	SMgrRelation reln;
 
 	/*
@@ -520,16 +505,14 @@ BeginRedoForBlock(StringInfo input_message)
 	rnode.relNode = pq_getmsgint(input_message, 4);
 	blknum = pq_getmsgint(input_message, 4);
 
-	oldcxt = MemoryContextSwitchTo(TopMemoryContext);
 	INIT_BUFFERTAG(target_redo_tag, rnode, forknum, blknum);
 
-	{
-		char* buf = pprint_tag(&target_redo_tag);
-		elog(TRACE, "BeginRedoForBlock %s", buf);
-		pfree(buf);
-	}
-
-	MemoryContextSwitchTo(oldcxt);
+	elog(TRACE, "BeginRedoForBlock %u/%u/%u.%d blk %u",
+		 target_redo_tag.rnode.spcNode,
+		 target_redo_tag.rnode.dbNode,
+		 target_redo_tag.rnode.relNode,
+		 target_redo_tag.forkNum,
+		 target_redo_tag.blockNum);
 
 	reln = smgropen(rnode, InvalidBackendId, RELPERSISTENCE_PERMANENT);
 	if (reln->smgr_cached_nblocks[forknum] == InvalidBlockNumber ||
@@ -589,7 +572,6 @@ ApplyRecord(StringInfo input_message)
 	XLogRecPtr	lsn;
 	XLogRecord *record;
 	int			nleft;
-	XLogReaderState reader_state;
 
 	/*
 	 * message format:
@@ -608,20 +590,15 @@ ApplyRecord(StringInfo input_message)
 			 record->xl_tot_len, (int) sizeof(XLogRecord) + nleft);
 
 	/* FIXME: use XLogReaderAllocate() */
-	memset(&reader_state, 0, sizeof(XLogReaderState));
-	reader_state.ReadRecPtr = 0; /* no 'prev' record */
-	reader_state.EndRecPtr = lsn; /* this record */
+	XLogBeginRead(&reader_state, lsn);
 	reader_state.decoded_record = record;
-	reader_state.errormsg_buf = palloc(1000 + 1); /* MAX_ERRORMSG_LEN */
-
 	if (!DecodeXLogRecord(&reader_state, record, &errormsg))
 		elog(ERROR, "failed to decode WAL record: %s", errormsg);
 
 	/* Ignore any other blocks than the ones the caller is interested in */
 	redo_read_buffer_filter = redo_block_filter;
 
 	RmgrTable[record->xl_rmid].rm_redo(&reader_state);
-
 	redo_read_buffer_filter = NULL;
 
 	elog(TRACE, "applied WAL record with LSN %X/%X",
@@ -701,7 +678,7 @@ GetPage(StringInfo input_message)
 	} while (tot_written < BLCKSZ);
 
 	ReleaseBuffer(buf);
-	DropDatabaseBuffers(rnode.dbNode);
+	DropRelFileNodeAllLocalBuffers(rnode);
 	smgrinit(); //reset inmem smgr state
 
 	elog(TRACE, "Page sent back for block %u", blknum);