如何在多行文档中查找字符的偏移量

时间:2012-10-03 10:27:14

标签: java

我需要在word文档中搜索字符串,然后返回第一个字符的“offset”。我不确定的是如何解释换行符。如果文件包含:

  

您好

     

世界。

'W'的偏移是什么 - 是2,因为'i'的偏移是1?或者它是3,因为隐藏的'\ n'可以被认为是一个角色?如果文档使用'\ r \ n'回车怎么办?有没有一种标准的方法来处理这个问题(Java)?

3 个答案:

答案 0 :(得分:2)

答案是正常化:

test.replaceAll("\r", "").indexOf('W')
3

答案 1 :(得分:0)

我认为首先你应该与最初定义任务的人讨论这个问题:返回第一个字符的“偏移量”。因为这一切都取决于你打算如何进一步使用偏移值。

另一方面,我将计算所有“特殊”字符,即我会计算\ r和\ n。

答案 2 :(得分:0)

\r\n也是字符,并且像其他字符一样增加索引,仅使用W\n的偏移量为3 如果你想确保新行字符在处理之前从你的文本中删除所有\r