你好有这样的文字:
你想吃什么?
شماچيميلداريد?
请给我一碗番茄汤。
لطفاييکاسهسوپگوجهفرنگيبرامبياريد
服务员似乎急于接受我们的订单。
گارسنبنظرميادخيليعجلهدارهکهسفارشماروبياره
我想检测并将英语句子放在一个数组中,将Persian Sentence放在另一个数组中
我该怎么办?
答案 0 :(得分:0)
假设您的所有文本都在文件中,并且英语和波斯语翻译在不同的行上。 您需要做的是从文件中读取每一行并检查它是否为ASCII。
你如何检查?
import java.nio.charset.Charset;
import java.nio.charset.CharsetEncoder;
public class StringUtils {
static CharsetEncoder asciiEncoder =
Charset.forName("US-ASCII").newEncoder(); // or "ISO-8859-1" for ISO Latin 1
public static boolean isPureAscii(String v) {
return asciiEncoder.canEncode(v);
}
public static void main (String args[])
throws Exception {
String test = " برام ";
System.out.println(test + " isPureAscii() : " + StringUtils.isPureAscii(test));
test = "Real";
System.out.println(test + " isPureAscii() : " + StringUtils.isPureAscii(test));
/*
* output :
* برام isPureAscii() : false
* Real isPureAscii() : true
*/
}
}