我需要在word文档中搜索字符串,然后返回第一个字符的“offset”。我不确定的是如何解释换行符。如果文件包含:
您好
世界。
'W'的偏移是什么 - 是2,因为'i'的偏移是1?或者它是3,因为隐藏的'\ n'可以被认为是一个角色?如果文档使用'\ r \ n'回车怎么办?有没有一种标准的方法来处理这个问题(Java)?
答案 0 :(得分:2)
答案是正常化:
test.replaceAll("\r", "").indexOf('W')
3
答案 1 :(得分:0)
我认为首先你应该与最初定义任务的人讨论这个问题:返回第一个字符的“偏移量”。因为这一切都取决于你打算如何进一步使用偏移值。
另一方面,我将计算所有“特殊”字符,即我会计算\ r和\ n。答案 2 :(得分:0)
\r
和\n
也是字符,并且像其他字符一样增加索引,仅使用W
时\n
的偏移量为3
如果你想确保新行字符在处理之前从你的文本中删除所有\r