正则表达式将驼峰案例字符串拆分为单独的单词

时间:2016-01-30 00:00:14

标签: javascript regex camelcasing

function hyphenate(str) {

  var replace = "-";
  str = str.toLowerCase().replace(/[\s_\b]/g, replace);

  console.log(str);
  return str;
}

hyphenate("This Is Hyphenate"); // this-is-hyphenate
hyphenate("camelCaseString");   // camel-case-string

我试图让我的代码产生第二个函数调用的结果,但是没有找到可以做到这一点的模式。非常感谢任何帮助。

4 个答案:

答案 0 :(得分:4)

请注意,\b中的[\s_\b]表示退格符。不确定你真的需要这个。

我使用了一个不同的逻辑:在单词中的每个大写字母前添加一个连字符,然后替换并转为小写:



var re = /[\s_]+|([a-z0-9])(?=[A-Z])/g; 
var str = 'camelCaseString<br/>This      Is Hyphenate<br/>This_Should_Hyphenate';
var result = str.replace(re, "$1-").toLowerCase();
document.body.innerHTML += result;
&#13;
&#13;
&#13;

<强>解释

  • [\s_]+ - 一个或多个空格或下划线
  • | - 或......
  • ([a-z0-9]) - (第1组)小写字母或数字(因为\B不允许我们在_后匹配大写字母,如果您愿意,请添加A-Z在每个大写字母前添加-
  • (?=[A-Z]) - 对大写ASCII字母的测试(由于(?=[A-Z])是前瞻,零宽度断言而未被消耗)。

答案 1 :(得分:1)

在小写之前尝试前瞻:

function hyphenate(str) {
  return str.split(/[\s_\b]|(?=[A-Z])/).join('-').toLowerCase();
}

答案 2 :(得分:1)

您可以使用捕获组获取小写,后跟大写字母,然后将整个字符串转换为小写:

str.replace(/([a-z])([A-Z])/g,"$1-$2").toLowerCase();

答案 3 :(得分:0)

这可能对您的要求有些过分,但是希望此答案对尝试将(几乎)任何字符串转换为烤肉串的人有帮助:

const convertStringToKebebCase = str => str && str
  .match(/[0-9]{1,}(?=\b)|[A-Z]{2,}(?=[A-Z][a-z]+|[0-9]|\b|_)|[A-Z]?[a-z]+|[A-Z]|[0-9]+/g)
  .map(x => x.toLowerCase())
  .join('-')

以下是上述功能的测试,因此您可以弄清楚其功能(我将功能重命名为toKebeb只是为了便于在此处阅读):

// Lowercase
expect(toKebeb('path')).toEqual('path')
expect(toKebeb('PATH')).toEqual('path')

// Spaces
expect(toKebeb('path route')).toEqual('path-route')
expect(toKebeb('path route 0')).toEqual('path-route-0')
expect(toKebeb('123 path 4 route 567')).toEqual('123-path-4-route-567')

// Kebab
expect(toKebeb('path-route')).toEqual('path-route')
expect(toKebeb('PATH-ROUTE')).toEqual('path-route')
expect(toKebeb('path-route0')).toEqual('path-route-0')
expect(toKebeb('path-route-0')).toEqual('path-route-0')
expect(toKebeb('123-path-4-route-567')).toEqual('123-path-4-route-567')
expect(toKebeb('123-path-4-route-567')).toEqual('123-path-4-route-567')

// Snake
expect(toKebeb('path_route')).toEqual('path-route')
expect(toKebeb('PATH_ROUTE')).toEqual('path-route')
expect(toKebeb('path_route0')).toEqual('path-route-0')
expect(toKebeb('path_route_0')).toEqual('path-route-0')
expect(toKebeb('123_path_4_route_567')).toEqual('123-path-4-route-567')
expect(toKebeb('123_path_4_route_567')).toEqual('123-path-4-route-567')

// Camel
expect(toKebeb('pathRoute')).toEqual('path-route')
expect(toKebeb('pathROUTE')).toEqual('path-route')
expect(toKebeb('pathRoute0')).toEqual('path-route-0')
expect(toKebeb('pathROUTE0')).toEqual('path-route-0')
expect(toKebeb('123path4Route567')).toEqual('123-path-4-route-567')
expect(toKebeb('123path4ROUTE567')).toEqual('123-path-4-route-567')
expect(toKebeb('pathRouteA')).toEqual('path-route-a')
expect(toKebeb('pathRouteABC')).toEqual('path-route-abc')
expect(toKebeb('pathIsARoute')).toEqual('path-is-a-route')

// Other
expect(toKebeb('path-route0')).toEqual('path-route-0')
expect(toKebeb('path-route123')).toEqual('path-route-123')
expect(toKebeb('path1route')).toEqual('path-1-route')
expect(toKebeb('path123route')).toEqual('path-123-route')
expect(toKebeb('123pathRoute')).toEqual('123-path-route')
expect(toKebeb('123PATHRoute')).toEqual('123-path-route')
expect(toKebeb('123pathROUTE')).toEqual('123-path-route')

我提到这个函数几乎可以转换 任何字符串,这是因为每种情况下处理数字的方式可能不同。例如,期望3dPrinter返回3d-printer是完全合理的。可以对正则表达式进行调整以支持此功能,但会引发其他问题,例如如何处理3dPrinter12my3dPrinterse7en(即,应遵循哪些数字字符串顺序组合)。支持此类规则将大大增加所需测试的数量,并且总会有例外。

要支持3dPrinter示例,可以在正则表达式的开头(在“ /”之后)添加[0-9]{1,}[a-z]{1,}(?=[A-Z]+)|,但这会破坏一些早期的规则。

要了解此正则表达式的工作原理,请检查regexr上的模式。