使用perl将HTML表格转换为文本

时间:2014-03-25 06:20:17

标签: html perl html-treebuilder

我有一个html表格内容,我试图将其转换为具有相同结构的文本, 在perl的use HTML::TreeBuilderuse HTML::FormatText的帮助下。我试过这段代码

use strict;
use warnings;
use HTML::TreeBuilder;
use HTML::FormatText;
my $raw_html='';
my $tree = HTML::TreeBuilder->new_from_content($raw_html); 
print $tree->format(HTML::FormatText->new);

预期输出为:

data1            data1_value

data2            data2_value

data3            data3_value

但我得到的输出是:

data1

data1_value

data2

data2_vaue

data3

data3_value

我需要一些建议。

1 个答案:

答案 0 :(得分:1)

HTML::FormatText状态的文档“未实现HTML表格和表单的格式化。”

所以你需要找到另一种方法。 HTML::TableExtract可能是候选人。