我有一个嵌套列表(每个子元素都是pdfminer.LTPage),我想为初始嵌套列表的每个元素获取一个列表。
这是到目前为止的代码
def my_fun(nested_in):
List_out = []
List_out.append([x for n in range(len(nested_in))
for item in nested_in[n]
for x in item
if isinstance(x,pdfminer.layout.LTTextBoxHorizontal)])
return List_out
我得到的输出是一个嵌套列表,其中只有一个元素包含所需元素的总数作为子元素,但是我期望的是一个嵌套列表,其中每个项目都包含一个LTPage的所有LTTextBoxHorizontal。
答案 0 :(得分:1)
您的描述有点含糊。也许您可以尝试:
def my_fun(nested_in):
List_out = []
for ele in nested_in:
List_out.append([x for item in ele
for x in item
if isinstance(x,pdfminer.layout.LTTextBoxHorizontal)])
return List_out