将String转换为java中的另一个语言环境

时间:2011-03-15 18:14:14

标签: java locale

您好
我需要将阿拉伯语/波斯语数字转换为英语相等(例如将“2”转换为“2”)
我怎么能这样做?

由于

13 个答案:

答案 0 :(得分:32)

我建议您使用十位数的查找字符串并一次替换所有数字。

public static void main(String... args) {
    System.out.println(arabicToDecimal("۴۲"));
}

private static final String arabic = "\u06f0\u06f1\u06f2\u06f3\u06f4\u06f5\u06f6\u06f7\u06f8\u06f9";
private static String arabicToDecimal(String number) {
    char[] chars = new char[number.length()];
    for(int i=0;i<number.length();i++) {
        char ch = number.charAt(i);
        if (ch >= 0x0660 && ch <= 0x0669)
           ch -= 0x0660 - '0';
        else if (ch >= 0x06f0 && ch <= 0x06F9)
           ch -= 0x06f0 - '0';
        chars[i] = ch;
    }
    return new String(chars);
}

打印

42

将字符串用作查找的原因是其他字符(例如. - ,)将保留原样。事实上,十进制数字将保持不变。

答案 1 :(得分:18)

我通过java.math.BigDecimal类获得了此功能,下面是代码段

String arabicNumerals = "۴۲۴۲.۴۲";
String englishNumerals = new BigDecimal(arabic).toString();
System.out.println("Number In Arabic : "+arabicNumerals);
System.out.println("Number In English : "+englishNumerals);

<强>结果

Number In Arabic : ۴۲۴۲.۴۲
Number In English : 4242.42

NB:如果在arabicNumerals中有除数字以外的任何字符,则上述代码将不起作用,例如:4,242.42将导致java.lang.NumberFormatException,因此您可以在另一个逻辑中使用Character.isDigit(char ch)删除其他字符并使用上面的代码。所有正常情况都很有效!!

美好的一天

答案 2 :(得分:9)

我发现了一种更简单,更快捷的方法,其中包括两个阿拉伯语代码页。

public static String convertToEnglishDigits(String value)
{
     String newValue = value.replace("١", "1").replace("٢", "2").replace("٣", "3").replace("٤", "4").replace("٥", "5")
             .replace("٦", "6").replace("7", "٧").replace("٨", "8").replace("٩", "9").replace("٠", "0")
             .replace("۱", "1").replace("۲", "2").replace("۳", "3").replace("۴", "4").replace("۵", "5")
             .replace("۶", "6").replace("۷", "7").replace("۸", "8").replace("۹", "9").replace("۰", "0");

     return newValue;
}

如果更改替换,它将以英文格式返回数字,反之亦然 (“0”,“0”)到(“0”,“0”)

答案 3 :(得分:7)

试试这个家伙:

/**
 * Utility class to detect arabic languages and convert numbers into arabic digits.
 *
 * @author Ahmed Shakil
 * @date 09-24-2012
 */
public final class ArabicUtil {

private static final char[] DIGITS = {'\u0660','\u0661','\u0662','\u0663','\u0664','\u0665','\u0666','\u0667','\u0668','\u0669'};

/**
 * Returns <code>true</code> if the provided language code uses arabic characters; othersise <code>false</code>.
 * @param lang ISO language code.
 * @return <code>true</code> if the provided language code uses arabic characters; othersise <code>false</code>
 */
public static boolean isArabic (String lang) {
    return "ar".equals(lang) || "fa".equals(lang) || "ur".equals(lang);
}

/**
 * Convert digits in the specified string to arabic digits.
 */
public static String convertDigits (String str) {
    if (str == null || str.length() == 0) return str;

    char[] s = new char[str.length()];
    for(int i =0;i<s.length;i++)
        s[i] = toDigit( str.charAt( i ) );

    return new String(s);
}

/**
 * Convert single digit in the specified string to arabic digit.
 */
public static char toDigit (char ch) {
    int n = Character.getNumericValue( (int)ch );
    return n >=0 && n < 10 ? ARABIC[n] : ch;
}

/**
 * Convert an int into arabic string.
 */
public static String toString (int num) {
    return convertDigits( Integer.toString( num ) );
}
}

BTW阿拉伯数字与urdu / farsi之间存在差异: 阿拉伯语:

private static final char[] ARABIC     = {'\u0660', '\u0661', '\u0662', '\u0663', '\u0664', '\u0665', '\u0666', '\u0667', '\u0668', '\u0669'};

乌尔都语或波斯语:

private static final char[] URDU_FARSI = {'\u06f0', '\u06f1', '\u06f2', '\u06f3', '\u06f4', '\u06f5', '\u06f6', '\u06f7', '\u06f8', '\u06f9'};

答案 4 :(得分:5)

首先让它工作,然后让它看起来不错; - )

public static char persianDigitToEnglish(char persianDigit) {
    return (char) (((int)persianDigit) - ((int)'۲' - (int)'2'));
}

适用于2,遗憾的是我不知道其他波斯数字,你可以尝试一下吗?

assertThat(persianDigitToEnglish('۲')).isEqualTo('2');

编辑 :(基于 Peter Lawrey 字符串版本,但使用StringBuilder

public static String persianDigitToEnglish(String persianNumber) {
    StringBuilder chars = new StringBuilder(persianNumber.length());
    for (int i = 0; i < persianNumber.length(); i++)
        chars.append(persianDigitToEnglish(persianNumber.charAt(i)));
    return chars.toString();
}

private static char persianDigitToEnglish(char persianDigit) {
    return (char) (((int)persianDigit) - ((int)'۲' - (int)'2'));
}

答案 5 :(得分:2)

  

它也可以使用小数点..

public class mainsupport {
public static void main(String args[]){
//  String Numtoconvert="15.3201" ;
//  String Numtoconvert="458" ;
    String Numtoconvert="٨٧٫٥٩٨" ; // integer value 87.598

      System.out.println(getUSNumber(Numtoconvert));
}
private static String getUSNumber(String Numtoconvert){

    NumberFormat formatter = NumberFormat.getInstance(Locale.US);
      try {
          if(Numtoconvert.contains("٫"))      
          Numtoconvert=formatter.parse(Numtoconvert.split("٫")[0].trim())+"."+formatter.parse(Numtoconvert.split("٫")[1].trim());
          else
              Numtoconvert=formatter.parse(Numtoconvert).toString();
      } catch (ParseException e) {
       // TODO Auto-generated catch block
       e.printStackTrace();
      }
      return Numtoconvert;
}

打印87.598

答案 6 :(得分:2)

如此微不足道的回答:

public static String convertNumbersToPersian(String str)
{
    String answer = str;
    answer = answer.replace("1","١");
    answer = answer.replace("2","٢");
    answer = answer.replace("3","٣");
    answer = answer.replace("4","٤");
    answer = answer.replace("5","٥");
    answer = answer.replace("6","٦");
    answer = answer.replace("7","٧");
    answer = answer.replace("8","٨");
    answer = answer.replace("9","٩");
    answer = answer.replace("0","٠");
    return answer;
}

public static String convertNumbersToEnglish(String str) {
    String answer = str;
    answer = answer.replace("١", "1");
    answer = answer.replace("٢", "2");
    answer = answer.replace("٣", "3");
    answer = answer.replace("٤", "4");
    answer = answer.replace("٥", "5");
    answer = answer.replace("٦", "6");
    answer = answer.replace("٧", "7");
    answer = answer.replace("٨", "8");
    answer = answer.replace("٩", "9");
    answer = answer.replace("٠", "0");
    return answer;
}

答案 7 :(得分:2)

我认为最好的方法是将Locale更改为您想要的,例如,
双号:

NumberFormat fmt = NumberFormat.getNumberInstance(Locale.US);
d = Double.parseDouble(s);

表示字符串:

NumberFormat.getNumberInstance(Locale.US).format(s);

或DecimalFormat:

double num;
DecimalFormat df = new DecimalFormat("###.###");
df.setDecimalFormatSymbols(new DecimalFormatSymbols(Locale.US));
String s = df.format(num);

答案 8 :(得分:1)

使用Locale类转换数字。

 Locale locale = new Locale("ar");
 String formattedArabic = format(locale, "%d", value));

答案 9 :(得分:1)

Character.getNumericValue(ch)挽救了我的生命,这是针对任何语言环境的通用解决方案。

static String replaceNonstandardDigits(String input) {
    if (input == null || input.isEmpty()) {
        return input;
    }

    StringBuilder builder = new StringBuilder();
    for (int i = 0; i < input.length(); i++) {
        char ch = input.charAt(i);
        if (Character.isDigit(ch) && !(ch >= '0' && ch <= '9')) {
            int numericValue = Character.getNumericValue(ch);
            if (numericValue >= 0) {
                builder.append(numericValue);
            }
        } else {
            builder.append(ch);
        }
    }
    return builder.toString();
}

答案 10 :(得分:0)

当我在寻找性能最高的解决方案时,我混合了Kishath和Sileria的答案,并得出了干净,快速的结果:

B

请注意,这里我们假设本地化是在英语和波斯语或阿拉伯语之间完成的,因此,如果您还需要在替换条件中包括另一种语言,则只需添加缺少的替换子句即可。

答案 11 :(得分:0)

以下对我来说似乎是简单而显而易见的解决方案。我不知道为什么以前没有发布它。

Cannot process argument transformation on parameter 'Links'. Cannot convert value "System.Collections.ArrayList" to type "Microsoft.Exchange.Configuration.Tasks.RecipientIdParameter[]". Error: "Cannot 
convert the "Mr User" value of type "Deserialized.Microsoft.Exchange.Data.Directory.Management.ReducedRecipient" to type "Microsoft.Exchange.Configuration.Tasks.RecipientIdParameter"."
    + CategoryInfo          : InvalidData: (:) [Remove-UnifiedGroupLinks], ParameterBindin...mationException
    + FullyQualifiedErrorId : ParameterArgumentTransformationError,Remove-UnifiedGroupLinks
    + PSComputerName        : outlook.office365.com

输出为:

21

如果我们有一个带有小数点的字符串(或者只是一个可能带有小数点的字符串),请使用 Locale persian = Locale.forLanguageTag("fa"); NumberFormat nf = NumberFormat.getIntegerInstance(persian); String persianIntegerString = "۲۱"; int parsedInteger = nf.parse(persianIntegerString).intValue(); System.out.println(parsedInteger); 而不是getInstance。同时,我这次使用阿拉伯字符串来证明这也是可行的。

getIntegerInstance

34.56

在许多情况下,数字格式还可以在其他语言环境中解析数字,但是我怀疑情况总是如此,因此我不想依赖它。

答案 12 :(得分:-3)

我认为不是逐个替换数字(只适用于十进制数),你应该用波斯数字形式将数字解析为数字,然后(如果需要)使用英文的NumberFormat再次格式化它