我有一个html表格内容,我试图将其转换为具有相同结构的文本,
在perl的use HTML::TreeBuilder
和use HTML::FormatText
的帮助下。我试过这段代码
use strict;
use warnings;
use HTML::TreeBuilder;
use HTML::FormatText;
my $raw_html='';
my $tree = HTML::TreeBuilder->new_from_content($raw_html);
print $tree->format(HTML::FormatText->new);
预期输出为:
data1 data1_value
data2 data2_value
data3 data3_value
但我得到的输出是:
data1
data1_value
data2
data2_vaue
data3
data3_value
我需要一些建议。
答案 0 :(得分:1)
HTML::FormatText
状态的文档“未实现HTML表格和表单的格式化。”
所以你需要找到另一种方法。 HTML::TableExtract
可能是候选人。