我正在尝试在MEAD(http://www.summarization.com/mead/)中解析自己的数据以创建自定义摘要。为此,最初的步骤是创建集群输入句子,然后调用MEAD来汇总给定的集群。我选择一个随机初始化,对于默认的GA3群集运行正常,但是当我尝试在我自己的数据上运行它时,
./mead.pl -RANDOM MS
即使我按照指南中的步骤逐步执行以下步骤,我也会收到错误:
Cluster /mead/bin/../data/MS/MS.cluster
not well-formed (invalid token) at line 6, column 6605, byte 6770 at
/usr/lib64/perl5/XML/Parser.pm line 187
FATAL: Feature Calculation returned 65280
no element found at line 1, column 0, byte 0 at
/usr/lib64/perl5/XML/Parser.pm line 187
我的群集文件MS.cluster看起来很好,我把它与GA3.cluster进行了比较,我没有发现任何奇怪的东西。什么可能导致此错误,是否有任何解决方案来解决它?提前谢谢!
更新:我在MS.cluster的前几行下面,包括它抱怨的第6行:
<?xml version='1.0'?>
<CLUSTER LANG="ENG">
<D DID="04f1e71d0354312875ccba519b579ff1" />
<D DID="c8dd3f087868f54efdfc0b7435d0d566" />
<D DID="a22ea8dc80a9473c3cf08ee10a47f90e" />
<D DID="ca59c46805a6d3e49ada0234a94a23dd" />
<D DID="8a44734a5ad627ba9805a7eb54258789" />
<D DID="3474786d45d62ecfa2e071b5466a05be" />
<D DID="9be575fde8254f2eb2a3f3bc2cbad245" />
<D DID="fa04771eaa1456e169450d376ae5f70f" />