需要一个不关心字符串

时间:2016-01-31 17:39:39

标签: javascript regex string substring

我有这个html字符串x:

Michelle Brook
<br></br>
The Content Mine
<br></br>
michelle@contentmine.org

取自http://www.dlib.org/dlib/november14/brook/11brook.html

的第一行

我想获得x.substring(0,14)=Michelle Brook。 问题是在M之前,有两个特殊字符(unicode代码= 10)使x.substring(0,14)=Michelle Bro

事实上,使用x.split("")我可以看到{" "," ","M",.....}

我不会删除这些字符。 我想让substring做正确的事情“牢记”特殊字符。我怎么办?是否有不同的javascript函数可以做到这一点?

3 个答案:

答案 0 :(得分:0)

你不能在函数中修改这个strimg并修剪String的开始和结束。

答案 1 :(得分:0)

使用.trim删除\n(代码10)

  

trim()方法从字符串的两端删除空格。   在这种情况下的空白是所有的空白字符(空间,   选项卡,不间断空格等)和所有行终止符(LF,   CR等。)。

x.trim().substring(0,14);

或使用正则表达式:

var match = x.match(/[\w ]{14}/);
console.log(match[0]);

答案 2 :(得分:0)

从您的网页:

window.onload = function() {
  var arrStr = document.getElementsByClassName('blue')[0].innerHTML.replace(/[^A-Za-z0-9 <>]/g, '').split('<br>');
   alert(arrStr[0].trim());
}
<p class="blue">

    Michelle Brook<br>
    The Content Mine<br>
    michelle@contentmine.org<br><br>

    Peter Murray-Rust<br>
    University of Cambridge<br>
    pm286@cam.ac.uk<br><br>

    Charles Oppenheim<br>
    City, Northampton and Robert Gordon Universities<br>
    c.oppenheim@btinternet.com

    <br><br>doi:10.1045/november14-brook
</p>

使用替换功能,您可以删除任何不符合您兴趣的角色: 在你的情况下,我认为你正在寻找字母(大写,小写),数字和空格。您可以添加要删除的其他字符。