我正在尝试为pandoc写一个简单的lua过滤器,以便对ReST表中的元素进行一些宏扩展。
filter.lua
function tablelength(T)
local count = 0
for _ in pairs(T) do count = count + 1 end
return count
end
function Table(table)
elems=pandoc.Table(table)["rows"]
print(tablelength(table))
for v in pairs(elems) do
print(v) -- Prints nothings
end
return table
end
test.rst
======= =========
A B
======= =========
{{x}} {{y}}
======= =========
现在,如果我运行pandoc.exe -s --lua-filter filter.lua test.rst -t rst
,程序会说elems中有5个元素,但是for循环只是被跳过了,我真的不知道我在做什么错。
我对Lua并不陌生,也知道pandoc非常轻巧。如何遍历元素中的元素?
答案 0 :(得分:2)
Pandoc lua过滤器提供了方便的walk_block帮助器,该帮助器以递归方式遍历文档树并将其功能应用于与键匹配的元素。
在下面的示例中,我们仅使用一个键(键walk_block
)给Str
一个lua表(其他语言的映射或字典),该表的值为申请的功能。该功能检查括号,剥去括号并加上foo
。
function Table(table)
return pandoc.walk_block(table, {
Str = function(el)
if el.text:sub(1,2) == '{{' then
txt = 'foo' .. el.text:sub(3, -3)
else
txt = el.text
end
return pandoc.Str(txt)
end
})
end
答案 1 :(得分:1)
您的代码中有几个误区。首先,您需要记住lua中的所有内容都是一个表(实现为关联数组或字典),而数组只是表的一种特殊情况,其中键是整数。为避免混淆,在本答案的其余部分中,当我引用pandoc文档元素时,将使用Table;而当我引用lua数据结构时,将使用table。
您的tablelength函数仅计算代表表的pandoc表中的元素数。如果您查看https://www.pandoc.org/lua-filters.html#type-ref-Block,将会看到一个Table具有5个属性标题,对齐方式,宽度,标题和行。因此,此函数的返回值为5。如果在表长度内的循环中打印出值,则将对此进行确认。如果要计算行数,则需要将rows数组传递给函数,而不是表。
第二个问题是您要创建一个新表,而不是使用pandoc传递的表。除了使用elems=pandoc.Table(table)["rows"]
或等效的elems=table["rows"]
之外,不使用elems=table.rows
。函数pandoc.Table()
用于创建新元素。
此外,要遍历数组形式的表中的元素,可以使用ipairs函数-它会返回此处What is the difference of pairs() vs. ipairs() in Lua?中所述的数字索引值。
如预期的那样,行表是一个行数组,其中每一行又是一个元素数组。因此,要访问表中的元素,您将需要两个循环。
最后是pandoc对象模型的问题。因为表可以包含其他内容(图像,链接,粗体文本等),所以最终单元格值实际上是一个块列表。现在,根据您要对表执行的操作,可以用不同的方式来处理它。您可以使用mb21所引用的walk_block函数,但仅在单个单元格中循环遍历这些块。如果您的表格仅包含(未格式化的)文本,则可以使用stringify函数来简化操作,该函数将块列表折叠为单个字符串。
将所有这些放在一起会得到下面的代码修改版本。
local stringify=pandoc.utils.stringify
-- This function is no longer needed
function tablelength(T)
local count = 0
for e in pairs(T) do
count = count + 1
print(e) -- this shows the key not the value
end
return count
end
function Table(table)
rows=table["rows"]
print("TableLength="..#rows)
for rownum,row in ipairs(rows) do
for colnum, elem in ipairs(row) do
print(stringify(elem)) -- Prints cell text
end
end
return table
end
关于您的后续问题,如果要修改内容,则只需要替换单元格值,同时尊重pandoc的对象模型即可。您可以使用pandoc模块中的构造函数来构造pandoc使用的各种类型(例如上述的pandoc.Table)。最简单的表格单元将是具有单个Plain块的数组,而该Plain块又包含单个Str元素(块通常包含Inline元素列表)。
以下代码显示如何使用现有内容或行/列号修改表。请注意,我将Table函数的参数从table
更改为tableElem
,因为table
是lua中常用的类型,并且对其进行重写会导致难以跟踪错误。
local stringify=pandoc.utils.stringify
function makeCell(s)
return {pandoc.Plain({pandoc.Str(s)})}
end
function Table(tableElem)
rows=tableElem["rows"]
for rownum,row in ipairs(rows) do
for colnum, elem in ipairs(row) do
local elemText=stringify(elem)
if elemText=="{{x}}" then
row[colnum]=makeCell(elemText:gsub("x","newVal"))
end
if rownum==1 and colnum==2 then
row[colnum]=makeCell("Single cell")
end
end
end
local newRow={ makeCell("New A"), makeCell("New B")}
table.insert(rows,newRow)
return tableElem
end