Lua弱引用table

时间:2023-03-08 17:15:42

弱引用table

与python等脚本语言类似地,Lua也采用了自动内存管理(Garbage Collection),一个程序只需创建对象,而无需删除对象。通过使用垃圾收集机制,Lua会自动删除过期对象。垃圾回收机制可以将程序员从C语言中常出现的内存泄漏、引用无效指针等底层bug中解放出来。

我们知道Python的垃圾回收机制使用了引用计数算法,当指向一个对象的所有名字都失效(超出生存期或程序员显式del了)了,会将该对象占用的内存回收。但对于循环引用是一个特例,垃圾收集器通常无法识别,这样会导致存在循环引用的对象上的引用计数器永远不会变为零,也就没有机会被回收。

一个在python中使用循环引用的例子:

class main1:
def __init__(self):
print('The main1 constructor is calling...')
def __del__(self):
print('The main1 destructor is calling....') class main2:
def __init__(self, m3, m1):
self.m1 = m1
self.m3 = m3
print('The main2 constructor is calling...')
def __del__(self):
print('The main2 destructor is calling....') class main3:
def __init__(self):
self.m1 = main1()
self.m2 = main2(self, self.m1)
print('The main3 constructor is calling...')
def __del__(self):
print('The main3 destructor is calling....') # test
main3()

输出内容为:

The main1 constructor is calling...
The main2 constructor is calling...
The main3 constructor is calling...

可以看出,析构函数(__del__函数)没有被调用,循环引用导致了内存泄漏。

垃圾收集器只能回收那些它认为是垃圾的东西,不会回收那些用户认为是垃圾的东西。比如那些存储在全局变量中的对象,即使程序不会再用到它们,但对于Lua来说它们也不是垃圾,除非用户将这些对象赋值为nil,这样它们才能被释放。但有时候,简单地清除引用还不够,比如将一个对象放在一个数组中时,它就无法被回收,这是因为即使当前没有其他地方在使用它,但数组仍引用着它,除非用户告诉Lua这项引用不应该阻碍此对象的回收,否则Lua是无从得知的。

table中有key和value,这两者都可以包含任意类型的对象。通常,垃圾收集器不会回收一个可访问table中作为key或value的对象。也就是说,这些key和value都是强引用,它们会阻止对其所引用对象的回收。在一个弱引用table中,key和value是可以回收的。

弱引用table(weak table)是用户用来告诉Lua一个引用不应该阻碍对该对象的回收。所谓弱引用,就是一种会被垃圾收集器忽视的对象引用。如果一个对象的引用都是弱引用,该对象也会被回收,并且还可以以某种形式来删除这些弱引用本身。

弱引用table有3种类型:

1、具有弱引用key的table;
2、具有弱引用value的table;
3、同时具有弱引用key和value的table;

table的弱引用类型是通过其元表中的__mode字段来决定的。这个字段的值应为一个字符串:
如果包含'k',那么这个table的key是弱引用的;
如果包含'v',那么这个table的value是弱引用的;

弱引用table的一个例子,这里使用了collectgarbage函数强制进行一次垃圾收集:

a = {,, name='cq'}

setmetatable(a, {__mode='k'})

key = {}
a[key] = 'key1' key = {}
a[key] = 'key2' print("before GC")
for k, v in pairs(a) do
print(k, '\t', v)
end collectgarbage() print("\nafter GC")
for k, v in pairs(a) do
print(k, '\t', v)
end

输出:

before GC

table: 0x167ba70                        key1
name cq
table: 0x167bac0 key2 after GC name cq
table: 0x167bac0 key2

在本例中,第二句赋值key={}会覆盖第一个key,当收集器运行时,由于没有地方在引用第一个key,因此第一个key就被回收了,并且table中的相应条目也被删除了。至于第二个key,变量key仍引用着它,因此它没有被回收。

注意,弱引用table中只有对象可以被回收,而像数字、字符串和布尔这样的“值”是不可回收的。

备忘录(memoize)函数是一种用空间换时间的做法,比如有一个普通的服务器,每当它收到一个请求,就要对代码字符串调用loadstring,然后再调用编译好的函数。不过,loadstring是一个昂贵的函数,有些发给服务器的命令有很高的频率,例如"close()",如果每次收到一个这样的命令都要调用loadstring,那还不如让服务器用一个辅助的table记录下所有调用loadstring的结果。

备忘录函数的例子:

local results = {}

setmetatable(results, {__mode='v'})

function mem_loadstring(s)

    local res = results[s]

    if res == nil then
res=assert(loadstring(s))
results[s]=res
end return res
end local a = mem_loadstring("print 'hello'")
local b = mem_loadstring("print 'world'") a = nil collectgarbage() for k,v in pairs(results) do
print(k, '\t', v)
end

例子中,table results会逐渐地积累服务器收到的所有命令及其编译结果。经过一定时间后,会耗费大量的内存。弱引用table正好可以解决这个问题,如果results table具有弱引用的value,那么每次垃圾收集都会删除所有在执行时未使用的编译结果。

lua元表一文中,提到过如何实现具有默认值的table。如果要为每一个table都设置一个默认值,又不想让这些默认值持续存在下去,也可以使用弱引用table,如下面的例子:

local defaults = {}

setmetatable(defaults, {__mode='k'})

local mt = {__index=function(t) return defaults[t] end}

function setDefault(t, d)
defaults[t] = d
setmetatable(t, mt)
end local a = {}
local b = {} setDefault(a, "hello")
setDefault(b, "world") print(a.key1)
print(b.key2) b = nil
collectgarbage() for k,v in pairs(defaults) do
print(k,'\t',v)
end