有没有更好的方法来替换字符串?
我很惊讶Replace不接受字符数组或字符串数组。我想我可以写自己的扩展,但我很好奇是否有更好的内置方式来执行以下操作?注意最后一个Replace是一个字符串而不是一个字符。
myString.Replace(';', '\n').Replace(',', '\n').Replace('\r', '\n').Replace('\t', '\n').Replace(' ', '\n').Replace("\n\n", "\n");
答案 0 :(得分:180)
您可以使用替换正则表达式。
s/[;,\t\r ]|[\n]{2}/\n/g
s/
表示搜索[
和]
之间的字符是要搜索的字符(按任意顺序)/
分隔搜索文本和替换文本用英文写的:
“搜索;
或,
或\t
或\r
或(空格)或恰好两个顺序
\n
并替换它与\n
“
在C#中,您可以执行以下操作:(导入System.Text.RegularExpressions
后)
Regex pattern = new Regex("[;,\t\r ]|[\n]{2}");
pattern.Replace(myString, "\n");
答案 1 :(得分:101)
如果您感觉特别聪明并且不想使用正则表达式:
char[] separators = new char[]{' ',';',',','\r','\t','\n'};
string s = "this;is,\ra\t\n\n\ntest";
string[] temp = s.Split(separators, StringSplitOptions.RemoveEmptyEntries);
s = String.Join("\n", temp);
您可以轻松地将此包装在扩展方法中。
编辑:或者等待2分钟,我最终还是会写它:)
public static class ExtensionMethods
{
public static string Replace(this string s, char[] separators, string newVal)
{
string[] temp;
temp = s.Split(separators, StringSplitOptions.RemoveEmptyEntries);
return String.Join( newVal, temp );
}
}
瞧......
char[] separators = new char[]{' ',';',',','\r','\t','\n'};
string s = "this;is,\ra\t\n\n\ntest";
s = s.Replace(separators, "\n");
答案 2 :(得分:52)
您可以使用Linq的聚合函数:
string s = "the\nquick\tbrown\rdog,jumped;over the lazy fox.";
char[] chars = new char[] { ' ', ';', ',', '\r', '\t', '\n' };
string snew = chars.Aggregate(s, (c1, c2) => c1.Replace(c2, '\n'));
这是扩展方法:
public static string ReplaceAll(this string seed, char[] chars, char replacementCharacter)
{
return chars.Aggregate(seed, (str, cItem) => str.Replace(cItem, replacementCharacter));
}
扩展方法用法示例:
string snew = s.ReplaceAll(chars, '\n');
答案 3 :(得分:17)
这是最短的方式:
myString = Regex.Replace(myString, @"[;,\t\r ]|[\n]{2}", "\n");
答案 4 :(得分:7)
public static class StringUtils
{
#region Private members
[ThreadStatic]
private static StringBuilder m_ReplaceSB;
private static StringBuilder GetReplaceSB(int capacity)
{
var result = m_ReplaceSB;
if (null == result)
{
result = new StringBuilder(capacity);
m_ReplaceSB = result;
}
else
{
result.Clear();
result.EnsureCapacity(capacity);
}
return result;
}
public static string ReplaceAny(this string s, char replaceWith, params char[] chars)
{
if (null == chars)
return s;
if (null == s)
return null;
StringBuilder sb = null;
for (int i = 0, count = s.Length; i < count; i++)
{
var temp = s[i];
var replace = false;
for (int j = 0, cc = chars.Length; j < cc; j++)
if (temp == chars[j])
{
if (null == sb)
{
sb = GetReplaceSB(count);
if (i > 0)
sb.Append(s, 0, i);
}
replace = true;
break;
}
if (replace)
sb.Append(replaceWith);
else
if (null != sb)
sb.Append(temp);
}
return null == sb ? s : sb.ToString();
}
}
答案 5 :(得分:5)
你只需要让它变得可变:
StringBuilder
unsafe
世界并玩指针(虽然危险) 并尝试以最少的次数遍历字符数组。注意这里的HashSet
,因为它避免遍历循环内的字符序列。如果您需要更快的查找,可以使用HashSet
的优化查找替换char
(基于array[256]
)。
使用StringBuilder的示例
public static void MultiReplace(this StringBuilder builder,
char[] toReplace,
char replacement)
{
HashSet<char> set = new HashSet<char>(toReplace);
for (int i = 0; i < builder.Length; ++i)
{
var currentCharacter = builder[i];
if (set.Contains(currentCharacter))
{
builder[i] = replacement;
}
}
}
修改 - 优化版
public static void MultiReplace(this StringBuilder builder,
char[] toReplace,
char replacement)
{
var set = new bool[256];
foreach (var charToReplace in toReplace)
{
set[charToReplace] = true;
}
for (int i = 0; i < builder.Length; ++i)
{
var currentCharacter = builder[i];
if (set[currentCharacter])
{
builder[i] = replacement;
}
}
}
然后你就这样使用它:
var builder = new StringBuilder("my bad,url&slugs");
builder.MultiReplace(new []{' ', '&', ','}, '-');
var result = builder.ToString();
答案 6 :(得分:2)
您也可以简单地编写这些string extension methods,并将它们放在解决方案中的某个位置:
using System.Text;
public static class StringExtensions
{
public static string ReplaceAll(this string original, string toBeReplaced, string newValue)
{
if (string.IsNullOrEmpty(original) || string.IsNullOrEmpty(toBeReplaced)) return original;
if (newValue == null) newValue = string.Empty;
StringBuilder sb = new StringBuilder();
foreach (char ch in original)
{
if (toBeReplaced.IndexOf(ch) < 0) sb.Append(ch);
else sb.Append(newValue);
}
return sb.ToString();
}
public static string ReplaceAll(this string original, string[] toBeReplaced, string newValue)
{
if (string.IsNullOrEmpty(original) || toBeReplaced == null || toBeReplaced.Length <= 0) return original;
if (newValue == null) newValue = string.Empty;
foreach (string str in toBeReplaced)
if (!string.IsNullOrEmpty(str))
original = original.Replace(str, newValue);
return original;
}
}
像这样打电话给他们:
"ABCDE".ReplaceAll("ACE", "xy");
xyBxyDxy
这个:
"ABCDEF".ReplaceAll(new string[] { "AB", "DE", "EF" }, "xy");
xyCxyF
答案 7 :(得分:1)
使用RegEx.Replace,如下所示:
string input = "This is text with far too much " +
"whitespace.";
string pattern = "[;,]";
string replacement = "\n";
Regex rgx = new Regex(pattern);
的更多信息
答案 8 :(得分:1)
性能 - 明智这可能不是最好的解决方案,但它有效。
var str = "filename:with&bad$separators.txt";
char[] charArray = new char[] { '#', '%', '&', '{', '}', '\\', '<', '>', '*', '?', '/', ' ', '$', '!', '\'', '"', ':', '@' };
foreach (var singleChar in charArray)
{
str = str.Replace(singleChar, '_');
}
答案 9 :(得分:1)
.NET Core版本,用于将已定义的字符串字符集替换为特定字符。它利用了最近引入的Span
类型和string.Create
方法。
这个想法是准备一个替换数组,因此对于每个字符串char都不需要实际的比较操作。因此,替换过程提醒了状态机的工作方式。为了避免初始化替换数组的所有项目,让我们在其中存储oldChar ^ newChar
(XOR'ed)值,这样做有以下好处:
ch ^ ch = 0
-无需初始化不变的项目ch ^ repl[ch]
:
ch ^ 0 = ch
-大小写不变ch ^ (ch ^ newChar) = newChar
-替换为字符因此,唯一的要求是确保替换数组在初始化时为零。每次调用ArrayPool<char>
方法时,我们将使用ReplaceAll
来避免分配。并且,为了确保在不花费大量调用Array.Clear
方法的情况下将数组归零,我们将维护一个专门用于ReplaceAll
方法的池。在将替换数组返回池之前,我们将清除替换数组(仅精确项目)。
public static class StringExtensions
{
private static readonly ArrayPool<char> _replacementPool = ArrayPool<char>.Create();
public static string ReplaceAll(this string str, char newChar, params char[] oldChars)
{
// If nothing to do, return the original string.
if (string.IsNullOrEmpty(str) ||
oldChars is null ||
oldChars.Length == 0)
{
return str;
}
// If only one character needs to be replaced,
// use the more efficient `string.Replace`.
if (oldChars.Length == 1)
{
return str.Replace(oldChars[0], newChar);
}
// Get a replacement array from the pool.
var replacements = _replacementPool.Rent(char.MaxValue + 1);
try
{
// Intialize the replacement array in the way that
// all elements represent `oldChar ^ newChar`.
foreach (var oldCh in oldChars)
{
replacements[oldCh] = (char)(newChar ^ oldCh);
}
// Create a string with replaced characters.
return string.Create(str.Length, (str, replacements), (dst, args) =>
{
var repl = args.replacements;
foreach (var ch in args.str)
{
dst[0] = (char)(repl[ch] ^ ch);
dst = dst.Slice(1);
}
});
}
finally
{
// Clear the replacement array.
foreach (var oldCh in oldChars)
{
replacements[oldCh] = char.MinValue;
}
// Return the replacement array back to the pool.
_replacementPool.Return(replacements);
}
}
}
答案 10 :(得分:0)
string ToBeReplaceCharacters = @"~()@#$%&+,'"<>|;\/*?";
string fileName = "filename;with<bad:separators?";
foreach (var RepChar in ToBeReplaceCharacters)
{
fileName = fileName.Replace(RepChar.ToString(), "");
}
答案 11 :(得分:0)
我知道这个问题太老了,但是我想提供2个更有效的选择:
首先,Paul Walls发布的扩展方法很好,但是可以通过使用StringBuilder类来提高效率,该类类似于字符串数据类型,但是特别适用于您将多次更改字符串值的情况。这是我使用StringBuilder编写的扩展方法的版本:
public static string ReplaceChars(this string s, char[] separators, char newVal)
{
StringBuilder sb = new StringBuilder(s);
foreach (var c in separators) { sb.Replace(c, newVal); }
return sb.ToString();
}
我运行了100,000次此操作,使用StringBuilder花费了73ms,而使用string花费了81ms。因此,除非您正在运行许多操作或使用巨大的字符串,否则差异通常可以忽略不计。
第二,这是您可以使用的1个班轮循环:
foreach (char c in separators) { s = s.Replace(c, '\n'); }
我个人认为这是最好的选择。它非常高效,不需要编写扩展方法。在我的测试中,仅用63毫秒就运行了100k次迭代,这使其效率最高。 这是上下文示例:
string s = "this;is,\ra\t\n\n\ntest";
char[] separators = new char[] { ' ', ';', ',', '\r', '\t', '\n' };
foreach (char c in separators) { s = s.Replace(c, '\n'); }
在此示例中,前两行向Paul Walls致谢。
答案 12 :(得分:0)
我也摆弄过这个问题,发现这里的大多数解决方案都很慢。最快的实际上是 dodgy_coder 发布的 LINQ + Aggregate 方法。
但我想,根据有多少旧字符,内存分配可能也很繁重。所以我想出了这个:
这里的想法是为当前线程缓存旧字符的替换映射,以安全分配。除此之外,只是使用输入的字符数组,稍后再次作为字符串返回。而字符数组的修改则尽可能少。
[ThreadStatic]
private static bool[] replaceMap;
public static string Replace(this string input, char[] oldChars, char newChar)
{
if (input == null) throw new ArgumentNullException(nameof(input));
if (oldChars == null) throw new ArgumentNullException(nameof(oldChars));
if (oldChars.Length == 1) return input.Replace(oldChars[0], newChar);
if (oldChars.Length == 0) return input;
replaceMap = replaceMap ?? new bool[char.MaxValue + 1];
foreach (var oldChar in oldChars)
{
replaceMap[oldChar] = true;
}
try
{
var count = input.Length;
var output = input.ToCharArray();
for (var i = 0; i < count; i++)
{
if (replaceMap[input[i]])
{
output[i] = newChar;
}
}
return new string(output);
}
finally
{
foreach (var oldChar in oldChars)
{
replaceMap[oldChar] = false;
}
}
}
对我来说,这最多是两个用于实际输入字符串的分配。由于某些原因,StringBuilder
对我来说要慢得多。它比 LINQ 变体快 2 倍。