当我从浏览器运行程序时,我无法从.html文件中获取kannada文本

时间:2014-03-08 07:11:03

标签: perl

我有一个perl程序,使用shell的wget命令从web获取语料库,但是使用lynx -dump命令从html中提取数据但是这在命令提示符下正常工作但是当我想要运行时相同的程序形式浏览器文件中的kannada文本不从文件中提取我只能得到我的程序是这样的英文文本

$f.txt文件中的

我只能在浏览器中运行perl程序时获取英文文本,但my $f也有kannada文本。所以请帮帮我

foreach my $f(@files)
system("lynx -dump $f > $f.txt");

1 个答案:

答案 0 :(得分:1)

您必须使用带有for语句的块(花括号)(for和foreach是别名):

use strict;
use warnings;

foreach my $f (@files) {
    system("lynx -dump $f > $f.txt");
}

你也应该养成习惯,不要总是使用use strict; use warnings;。没有它们,编码似乎更容易,但这只是一种幻觉。