javascript:查找/替换正则表达式帮助 - 粗体,斜体和特定字符

时间:2012-08-28 18:45:57

标签: javascript regex replace bold italic

HTML /概念:

    <textarea id="input"></textarea>        
    <button onclick="format()">submit</button>
    <textarea id="output"></textarea>

我经常需要将文档转换为客户端的html,而且我已经厌倦了必须查找/替换+手动更改/添加适当的HTML。所以我寻找了我的梦想格式化器,但找不到任何东西(如果你知道一个适合的话请发帖),所以我想我只是用javascript来自己。这是非常直接的,但我不熟悉正则表达式和遇到麻烦,这是我用其他帖子中找到的regexp拼凑起来的东西:

    var email = /(\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,6})/gim;
    var url = /(\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/ig;
    var br = /(\r\n|\n|\r)/gm;

    function format() {

        var input = $('#input').val();

        var check1 = input.replace(br,"<br>");
        var check2 = check1.replace(url,'<a href="$1" target="blank">$1</a>');
        var check3 = check2.replace(email, '<a href="mailto:$1">$1</a>' );
        var check4 = check3.replace(etc, ...);

        var output = check4;
        $('#output').val(output);
    }

还有一些我想做的事情,但似乎无法找到/写出正确的正则表达式,这些是:

  1. 找到任何粗体字符,并用适当的html / css
  2. 替换它们
  3. 找到任何斜体字符,并用适当的html / css
  4. 替换它们
  5. 找到特定字符(©,“,”,ñ等)并用适当的字符/实体替换它们,即:

     [&#169; , " , " , &ntilde; , etc]
    
  6. 我很抱歉,如果这已得到回答,但我似乎无法找到这些位(也许我问的是错误的问题?),任何找到粗体/斜体以及替换特定字符/实体的帮助都会很棒!另外,如果我以错误的方式解决这个问题,请打电话给我。太多了!

1 个答案:

答案 0 :(得分:0)

好吧,看起来像@sourcejedi指出的粗体/斜体不是一个真正的选择。但我想出了如何使用正则表达式查找/替换我需要的所有其他内容。同样,这是一个非常具体的任务,我碰巧经常做(通常很长[通常用西班牙语/重音字符] google doc文件转换成html),如果其他人在同一个/类似的船,这是我最终得到的:

HTML:

    <textarea id="input" cols="50" rows="10"></textarea><br>
    <button onclick="format()">format!</button><br>
    <textarea id="output" cols="50" rows="10"></textarea><br>

使用Javascript:

    function format() {

        var input = document.getElementById('input').value; // get input txt 
        var output = document.getElementById('output');     //target ouput txt box
        var i = input;                                      

        var email = /(\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,6})/gim;
        var url = /(\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/ig;
        var br = /(\r\n|\n|\r)/gm;

        i = i.replace(br, '<br>'+'\n'); 
        i = i.replace(url, '<a href="$1" target="blank">$1</a>'); 
        i = i.replace(email, '<a href="mailto:$1">$1</a>' );
        i = i.replace( /\u2018|\u2019|\u201A|\uFFFD/g, "'" );
        i = i.replace( /\u201c|\u201d|\u201e/g,  '"' );
        i = i.replace( /\u02C6/g, '^' );
        i = i.replace( /\u2039/g, '<' );
        i = i.replace( /\u203A/g, '>' );
        i = i.replace( /\u2013/g, '-' );
        i = i.replace( /\u2013/g, '-' ); 
        i = i.replace( /\u2022/g, '<span style="padding-left:15px;">&#38;'+'#8226;</span>' ); 
        i = i.replace( /\u00C9/g, '&#38;'+'Eacute;' ); // E w/accent
        i = i.replace( /\u00CD/g, '&#38;'+'Iacute;' ); // I w/accent
        i = i.replace( /\u00D3/g, '&#38;'+'Oacute;' ); // O w/accent
        i = i.replace( /\u00DA/g, '&#38;'+'Uacute;' ); // U w/accent
        i = i.replace( /\u00DD/g, '&#38;'+'Yacute;' ); // Y w/accent
        i = i.replace( /\u00D1/g, '&#38;'+'Ntilde;' ); // Nye
        i = i.replace( /\u00E1/g, '&#38;'+'aacute;' ); // a w/accent
        i = i.replace( /\u00E9/g, '&#38;'+'eacute;' ); // e w/accent
        i = i.replace( /\u00ED/g, '&#38;'+'iacute;' ); // i w/accent
        i = i.replace( /\u00F3/g, '&#38;'+'oacute;' ); // o w/accent
        i = i.replace( /\u00FA/g, '&#38;'+'uacute;' ); // u w/accent
        i = i.replace( /\u00FD/g, '&#38;'+'yacute;' ); // y w/accent
        i = i.replace( /\u00F1/g, '&#38;'+'ntilde;' ); // nye
        i = i.replace( /\u2014/g, '&#38;'+'#8212;' );  // mdash
        i = i.replace( /\u2026/g, '...' );      // elipses
        i = i.replace( /\u00A9/g, '&#38;'+'#169;' );   // copyright logo
        i = i.replace( /\u00AE/g, '&#38;'+'#174;' );      // restricted logo
        i = i.replace( /\u2122/g, '&#38;'+'#8482;' );  // trade mark logo
        i = i.replace( /\u00BC/g, '&#38;'+'#188;' );   // 1/4
        i = i.replace( /\u00BD/g, '&#38;'+'#189;' );   // 1/2
        i = i.replace( /\u00BE/g, '&#38;'+'#190;' );   // 3/4
        i = i.replace(/[\u02DC|\u00A0]/g, " "); // speacial spaces characters            

        output.innerHTML = i;
    }

...对于那些真正感兴趣的人,这里有一个可调节参数的版本(预加载电子邮件,添加包含自定义CSS的包装div,target =空白切换,mailto切换,缩小等) http://jsfiddle.net/N4vrE/