如何将纯文本转换为HTML(最好使用Perl)?

时间:2010-10-19 16:06:42

标签: html perl

有没有办法获取纯文本文件并将其转换为简单的HTML?

一些非常棒的“复杂”东西

  • 识别超链接。
  • 识别(制表符分隔)表。

更新

我刚发现这个HTML::FromText。检查它是否符合我的需求......

3 个答案:

答案 0 :(得分:3)

Text::Markdown

Stack Overflow已经使用Markdown,因为它是针对一般文本到HTML转换的最佳标记语言。命名链接在editing help

中说明

答案 1 :(得分:2)

尝试HTML::TextToHTML

从命令行:

txt2html I<arguments>

来自脚本:

use HTML::TextToHTML;

# create a new object
my $conv = new HTML::TextToHTML();

# convert a file
$conv->txt2html(infile=>[$text_file],
                 outfile=>$html_file,
                 title=>"Wonderful Things",
                 mail=>1,
  ]);

# reset arguments
$conv->args(infile=>[], mail=>0);

# convert a string
$newstring = $conv->process_chunk($mystring)

答案 2 :(得分:0)

您可以将lynx与-dump选项一起使用来实现:

use File::Temp;

sub html2Txt {
    my $html = shift;
    my $html_file = File::Temp->new(SUFFIX => '.html');
    print $html_file $html;
    close $html_file;
    return scalar `lynx -dump $html_file 2> /dev/null`;
}

print html2Txt '<h1>Hi there!</h1> Testing <p>Testing</p>';