我想检索使用UNICODE在MS word文件中编写的Bangla数据。如何使用PHP检索此数据?我可以使用Antiword从DOC文件中检索英文数据。但我无法找回孟加拉语。
答案 0 :(得分:0)
我使用PHP和COM(仅在Windows服务器上)来读取文档文件。
通过PHP和COM从Word文档中提取文本
$word = new COM("word.application") or die ("Could not initialise MS Word object.");
$word->Documents->Open(realpath("Sample.doc"));
# Extract content.
$content = (string) $word->ActiveDocument->Content;
echo $content;
$word->ActiveDocument->Close(false);
$word->Quit();
$word = null;
unset($word);
我认为您必须使用Windows服务器才能正确完成此操作。或者您可以将文档转换为OpenOffice格式并开始使用吗?有关PHP COM的更多详细信息,请访问此处。 http://us3.php.net/manual/en/book.com.php
答案 1 :(得分:-1)
您可以使用 fopen()功能解决此问题。