我正在编写一个程序,该程序将读取文本文件,如果文本包含不是空格也不是字字符的任何字符,则会引发错误。正则表达式似乎正确,但是不起作用。
例如这些文本:
Harry Potter$
Harry Potter
&&&&&&&&&&&&&&&&&&uvuoyvouyvouyvouyvouyv78789******
显示在控制台中,没有错误
我也在https://regexr.com/上检查了正则表达式表达式
需要双\,因为否则我会得到一个错误非法转义符
import java.io.*;
public class DZ {
public static void main(String[] args) throws IOException {
try {
System.out.println(method());
} catch(Exception e){
System.out.println(e);
}
}
public static boolean compare(char wrt) {
String str = "[^\\s\\w]";
for (int i = 0; i < str.length(); i++) {
if (str.charAt(i) == wrt) {
return true;
}
}
return false;
}
public static StringBuilder method() throws Exception {
int data;
FileReader fr = new FileReader("/Users/rachel_green/Documents/1.txt");
StringBuilder str = new StringBuilder();
while ((data = fr.read()) != -1) {
if (compare((char)data)) {
throw new Exception("Wrong file format");
} else {
str.append((char) data);
}
}
return str;
}
}
答案 0 :(得分:1)
您正在将String
与char
进行比较,并且正在遍历保存RegEx的字符串-这没有意义:
public static boolean compare(char wrt){
String str = "[^\\s\\w]";
for(int i=0;i<str.length();i++){ //why are you diong this?
if(str.charAt(i) == wrt) //you are checking every char of the regex agains the input char!
return true;
}
return false;
}
相反,您可以这样做:
public static boolean compare(char wrt){
return (wrt + "").matches("[^\\s\\w]");
}
此外,最好是在第一次发现无效字符时停止读取文件。否则,检查每个char
而不是整个文件内容(例如content.matches(".*[^\\s\\w].*")
)并没有任何意义(只抛出一次Exception和break;
循环读取文件)然后!
答案 1 :(得分:1)
在上面的代码中,您要为每个字符进行迭代,而可以将输入文件中的每一行与模式匹配。
public static boolean compare(String wrt)
{
Pattern regex = Pattern.compile("[^\\s\\w]");
Matcher matcher = regex.matcher(wrt);
return matcher.find();
}
public static StringBuilder method() throws Exception
{
FileReader fr = new FileReader("/Users/rachel_green/Documents/1.txt");
BufferedReader bR = new BufferedReader(fr);
StringBuilder str = new StringBuilder();
String line;
while ((line = bR.readLine()) != null)
{
if (compare(line))
{
throw new Exception("Wrong file format");
}
else
{
str.append(line);
}
}
return str;
}
希望这会有所帮助。