C# - 如何用“ - É”替换重音字符,即“-É”

时间:2016-03-09 01:08:54

标签: c# string replace diacritics non-ascii-characters

我正在使用Visual Studio和C#编写一个非常简单的Windows应用程序来编辑电影的字幕文件。我想要一个程序,在没有对话句时为对话句添加空格。例如:

- 嘿,怎么了?

没什么。

- 嘿,怎么了?

- 没什么。

我使用工具箱创建一个只有一个按钮的界面,用于选择正确的文件。这是我对此按钮的代码:

private void button1_Click(object sender, EventArgs e)
    {
        if (openFileDialog1.ShowDialog() == DialogResult.OK)
        {
            string text = File.ReadAllText(openFileDialog1.FileName, Encoding.GetEncoding("iso-8859-1"));
            text = text.Replace("-A", "- A");
            File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("iso-8859-1"));
        }
    }

这样做基本上用“ - A”替换“-A”,从而创造一个空间。这是我提出的解决方案,我计划用每个字母包括重音字母,例如À,Á,È,É等等来执行此操作。

这不起作用。如果我把 text = text.Replace(“ - É”,“ - É”); ,程序什么都不做。

我想知道的是如何解决这个问题。

感谢您阅读,如果您有更好的替代方案,请随时告诉我。

2 个答案:

答案 0 :(得分:5)

至于评论,请使用Regex。

        var rx = new System.Text.RegularExpressions.Regex("^-([^ ])");
        ... in your loop
        var text = rx.Replace(text, "- $1");

基本上它的作用是它在字符串的开头搜索一个破折号,但只有一个空格后面没有。 ()表示短划线后面的字符应该“保存”。 替换搜索提供的字符串,并用短划线,空格和之前匹配的相同字符替换(doh!)匹配的文本。不管它是什么。

来源:https://xkcd.com/208/

编辑:你没有循环,你有一个包含文件全部内容的字符串,其中每一行都应该包含一个字幕行(右边?)。 如果是这种情况,您可以配置正则表达式将字符串视为行列表,如下所示:

        var rx = new Regex("^-([^ ])", RegexOptions.Multiline);

看一下这个小提琴的例子: https://dotnetfiddle.net/ciFlAu

答案 1 :(得分:1)

对于重音字符,请考虑使用其Unicode表示:

string text = "-\u00C9"; //-É
text = text.Replace("-\u00C9", "- \u00C9"));

你也可以使用不间断空间进行空间更换,以防万一:

string text = "-\u00C9";
text = text.Replace("-\u00C9", "-\u00A0\u00C9"));

然后你可以使用UTF-8 / UTF-16进行编码:

File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("UTF-8"));