将txt文件导入mallet时出错

时间:2014-01-28 21:59:02

标签: mallet

我在将一些txt文件转换为mallet时遇到了问题。我一直在说:

线程“main”中的异常java.lang.IllegalStateException:第39843行与正则表达式不匹配:

和#39843行读取: 24393584 |标题验证丹麦版多伦多肢体挽救评分问卷对四肢肉瘤患者的影响。多伦多肢体挽救评分(TESS)问卷是一种自我管理的问卷,旨在评估四肢手术患者的身体残疾。本研究的目的是验证丹麦语TESS的翻译。 TESS是根据国际准则翻译的。招募了总共22名参加常规门诊控制计划的患者进行研究。为了测试他们对问卷的理解,他们被要求描述来自TESS的五个随机选择的问题的含义。丹麦版TESS的心理测量属性进行了有效性和可靠性测试。为了评估测试可靠性,患者在完成第一次测试后一周填写了额外的TESS问卷。患者对问卷有很好的理解。通过Cronbach's alpha测量的上下问卷都具有良好的内部一致性。 BlandAltman图显示了对测试中的两份调查问卷的可接受的一致性限制。两份问卷都有良好的组内相关系数。对于上肢和下肢问卷,比较TESS和QLQC30的Spearman等级相关系数表示的有效性分别为0.89和0.90。丹麦TESS的心理测量属性显示出良好的有效性和可靠性。不相关。不相关。

这种情况发生在很多行中,当我删除该行时,文件的其余部分 被导入槌。这一行中的正则表达式可能是什么问题?

感谢, 普里亚

1 个答案:

答案 0 :(得分:0)

由于编程错误,Mallet在处理某些机器符号时遇到问题。尝试运行

tr -dc [:alnum:][\ ,.]\\n < ./inputfile.txt > ./inputfilefixed.txt

在运行槌之前。这将删除所有非字母数字符号,这通常可以解决我的问题。