例如,我从文本文件中提取文本字符串,我需要这些字来形成一个数组。但是,当我做所有这些时,一些单词以逗号(,)或句号(。)结尾,或者甚至附加括号(这完全正常)。
我想要做的就是摆脱那些角色。我一直试图在Java中使用那些预定义的String方法来做到这一点,但我无法解决它。
答案 0 :(得分:181)
将变量重新分配给子字符串:
s = s.substring(0, s.length() - 1)
另一种解决问题的方法:您可能还想考虑使用StringTokenizer来读取文件,并将分隔符设置为您不希望成为单词的一部分的字符。
答案 1 :(得分:17)
使用:
String str = "whatever";
str = str.replaceAll("[,.]", "");
replaceAll需要regular expression。这样:
[,.]
...查找每个逗号和/或句号。
答案 2 :(得分:7)
要删除最后一个字符,请按Mark Byers说
s = s.substring(0, s.length() - 1);
此外,另一种删除您不想要的字符的方法是使用.replace(oldCharacter, newCharacter)
方法。
如:
s = s.replace(",","");
和
s = s.replace(".","");
答案 3 :(得分:4)
您无法在Java中修改字符串。他们是不变的。你所能做的就是创建一个新字符串,它是旧字符串的子字符串,减去最后一个字符。
在某些情况下,StringBuffer可能会帮助您。
答案 4 :(得分:3)
Mark Byers解释说,最好的方法是:
s = s.substring(0, s.length() - 1)
例如,如果我们想用ReplaceAll替换\“空格”,那就不能正常工作
String.replaceAll("\\", "");
或
String.replaceAll("\\$", ""); //if it is a path
答案 5 :(得分:0)
请注意,单词边界也取决于区域设置。我认为使用标准java.text.BreakIterator进行此操作的最佳方法。以下是java.sun.com教程中的一个示例。
import java.text.BreakIterator;
import java.util.Locale;
public static void main(String[] args) {
String text = "\n" +
"\n" +
"For example I'm extracting a text String from a text file and I need those words to form an array. However, when I do all that some words end with comma (,) or a full stop (.) or even have brackets attached to them (which is all perfectly normal).\n" +
"\n" +
"What I want to do is to get rid of those characters. I've been trying to do that using those predefined String methods in Java but I just can't get around it.\n" +
"\n" +
"Every help appreciated. Thanx";
BreakIterator wordIterator = BreakIterator.getWordInstance(Locale.getDefault());
extractWords(text, wordIterator);
}
static void extractWords(String target, BreakIterator wordIterator) {
wordIterator.setText(target);
int start = wordIterator.first();
int end = wordIterator.next();
while (end != BreakIterator.DONE) {
String word = target.substring(start, end);
if (Character.isLetterOrDigit(word.charAt(0))) {
System.out.println(word);
}
start = end;
end = wordIterator.next();
}
}
来源:http://java.sun.com/docs/books/tutorial/i18n/text/word.html
答案 6 :(得分:0)
您可以使用replaceAll()
方法:
String.replaceAll(",", "");
String.replaceAll("\\.", "");
String.replaceAll("\\(", "");
等。