我对字符串中的下标字符有疑问。 假设我有以下字符串:O 2。
我希望该字符串的所有订阅字符都正常,因此字符串将如下所示: O2。(而不是O 2)
我不知道如何做到这一点我是C#。
答案 0 :(得分:0)
.NET中的所有上标和下标字符都有一般性的“分解”,如下所述:How to convert super- or subscript to normal text in C#。
但是,如果您想手动执行操作,并且只需要下标中的数字0-9,则可以在U + 2080 - U + 2089(http://en.wikipedia.org/wiki/Unicode_subscripts_and_superscripts)找到它们。
因此,您可以使用unicode字符的C#字符串表示\uXXXX
和'0'
的int值来帮助您。
数字下标的字符“数字”值与普通书写数字的区别在于:
(int) '\u2080' - (int) '0'
把它放在一起,以下内容可能会更好地解释它:
使用System.IO; 使用System;
class Program
{
static void Main()
{
var subscriptValue = (int) '\u2080';
var normalValue = (int) '0';
var diff = subscriptValue - normalValue;
Console.WriteLine("subscript value: {0}, normal value: {1}, difference: {2} ",
subscriptValue, normalValue, diff);
for (var i = normalValue; i <= (normalValue + 9); i++) {
char normal = (char) i;
char subscript = (char) (i + diff);
Console.WriteLine("Normal: {0}, subscript: {1}", normal, subscript);
}
}
}
答案 1 :(得分:0)
如果要转换标准的unicode下标块([0x2080..0x209F]符号) 你可以使用这段代码:
http://en.wikipedia.org/wiki/Unicode_subscripts_and_superscripts
/// <summary>
/// From subscript (standard subscript block [0x2080..0x209F] only) to normal
/// </summary>
public static String FromSubscript(String value) {
if (String.IsNullOrEmpty(value))
return value;
Char[] Symbols = new Char[] {
'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '-', '=', '(', ')', '?', // <- '?' unknown/not standard symbols
'a', 'e', 'o', 'x', '\u0259', 'h', 'k', 'l', 'm', 'n', 'p', 's', 't', '?', '?', '?' }; // <- u0259 - small latin shwa
StringBuilder result = new StringBuilder(value.Length);
foreach (Char ch in value) {
int v = (int) ch;
if ((v >= 0x2080) && (v <= 0x209F))
result.Append(Symbols[v - 0x2080]);
else
result.Append(ch);
}
return result.ToString();
}
...
String test = "O₂";
Debug.Assert(String.Equals(FromSubscript(test), "O2", StringComparison.Ordinal));