如何从MS DOC文件中检索PHP中的Bangla数据

时间:2009-06-21 05:46:55

标签: php unicode

我想检索使用UNICODE在MS word文件中编写的Bangla数据。如何使用PHP检索此数据?我可以使用Antiword从DOC文件中检索英文数据。但我无法找回孟加拉语。

2 个答案:

答案 0 :(得分:0)

我使用PHP和COM(仅在Windows服务器上)来读取文档文件。

通过PHP和COM从Word文档中提取文本

$word = new COM("word.application") or die ("Could not initialise MS Word object.");
$word->Documents->Open(realpath("Sample.doc")); 

# Extract content.
$content = (string) $word->ActiveDocument->Content; 

echo $content; 

$word->ActiveDocument->Close(false); 

$word->Quit();

$word = null; 

unset($word); 

我认为您必须使用Windows服务器才能正确完成此操作。或者您可以将文档转换为OpenOffice格式并开始使用吗?有关PHP COM的更多详细信息,请访问此处。 http://us3.php.net/manual/en/book.com.php

答案 1 :(得分:-1)

您可以使用 fopen()功能解决此问题。