行结束问题DOS> Linux> Java的

时间:2013-06-20 19:03:33

标签: java linux newline dos

我有一个160.000行文件有点麻烦,这个文件是通过从xlsx文件导出生成的,它有.txt扩展名但是我担心它已经像DOS一样导出了文件,在每行的末尾它有DOS换行符。 我正在使用java编写的解析器,在Ubuntu环境中运行,当我运行解析器时我得到了这个(我无法编辑,因为它的一部分我无法访问源代码),我得到NumberFormatException其中一个数字是预期的,我的行结束如下:

4449

但解析器将其视为

For input string: "4449&#xd;"<

你有解决方案吗?再次,我无法自己访问解析器,我将不得不编辑“在我的Ubuntu机器上”文件并删除那些行结束。

2 个答案:

答案 0 :(得分:5)

尝试在该文件上使用dos2unix命令。这应该修复行终止符。

> dos2unix winfile.txt unixfile.txt

参考:
dos2unix man page

答案 1 :(得分:0)

解析器找到&#xd;,这是一个回车窗口;但是,它无法解析这些字符。转到该文件并运行快速命令tr -d '\15\32' < winfile.txt > unixfile.txt

参考: http://kb.iu.edu/data/acux.html