PageDown通过ScriptEngine错误地解析Markdown

时间:2015-09-09 13:04:49

标签: javascript java markdown scriptengine pagedown

我试图在客户端使用PageDown作为编辑器,然后在服务器端将Markdown解析为HTML。

它似乎在客户端工作正常,但在服务器端,tickmarks只是“编码”后面的字符,而不是它包装的单词。所以,如果我这样做:

test `test` test

我期待这一点,这确实是我在客户端得到的:

test <code>test</code> test

但是在服务器端,我最终得到了这个:

test <code>t</code>est<code> </code>test

我创建了一个名为pageDown.js的文件,它只是Markdown.Converter.jsMarkdown.Sanitizer.js合并为一个文件,添加了此功能:

function getSanitizedHtml(pagedown){
    var converter =  new Markdown.getSanitizingConverter();
    return converter.makeHtml(pagedown);
}

在客户端,我可以像这样使用这个文件:

<!DOCTYPE html>
<html>
<head>
<script src="pageDown.js"></script>
<script>
function convert(){

    var html = getSanitizedHtml("test `test` test");

    console.log(html);

    document.getElementById("content").innerHTML = html;
}

</script>
</head>

<body onload="convert()">
<p id="content"></p>
</body>
</html>

正确显示:<p>test <code>test</code> test</p>

在(Java)服务器端,我通过Java的ScriptEngineManagerInvocable使用同一个完全相同的文件:

import java.io.InputStreamReader;
import javax.script.Invocable;
import javax.script.ScriptEngine;
import javax.script.ScriptEngineManager;

public class PageDownTest{

    public static void main(String... args){

        try{
            ScriptEngineManager manager = new ScriptEngineManager();
            ScriptEngine engine = manager.getEngineByName("JavaScript");
            engine.eval(new InputStreamReader(PageDownTest.class.getResourceAsStream("pageDown.js")));
            Invocable inv = (Invocable) engine;
            String s = String.valueOf(inv.invokeFunction("getSanitizedHtml", "test `test` test"));
            System.out.println(s);
        }
        catch(Exception e){
            e.printStackTrace();
        }
    }
}

该程序打印出这个:<p>test <code>t</code>est<code></code>test</p>

我看到与其他降价相似的问题:test **test** test只是忽略了**部分。但是,##test正确返回为<h2>test</h2>

如果我直接通过HTML转到JavaScript,这一切都可以正常工作,但是当我通过Java时却不行。这里发生了什么?我应该以不同的方式处理服务器上的Markdown吗?

1 个答案:

答案 0 :(得分:4)

我设法将问题减少到以下代码:

function getSanitizedHtml(text)
{
    return text.replace(/(a)(?!b)\1/gm, 'c');
}

在浏览器中调用时

getSanitizedHtml('aa');

它返回:

c

从Nashorn引擎调用时

String s = String.valueOf(inv.invokeFunction("getSanitizedHtml", "aa"));

它返回:

cc

对我而言,这看起来像反向引用\1,它应该指向(a),而不是指向(?!b),其捕获的内容为零长度,因此匹配任何内容。

Java中的等效代码:

System.out.println(("aa").replaceAll("(a)(?!b)\\1", "c"));

返回正确的结果:

c

结论

我很确定这是Nashorn引擎中的一个错误 我提交了一份错误报告,并在此处公布其ID,如果它公开的话。

至于你的问题,我认为你唯一的选择是切换到不同的JavaScript环境,至少是暂时的。

最小的,可运行的示例

浏览器中的

JS:

&#13;
&#13;
function x(s){return s.replace(/(a)(?!b)\1/gm, 'c');}
document.write(x('aa'));
&#13;
&#13;
&#13;

Nashorn引擎中的JS:

[Ideone]

Pure Java:

[Ideone]

可能的修复

正如已经指出的,您唯一的选择(此时)是切换到另一个JavaScript环境 有很多可用的,维基百科有a comparison page。对于此示例,我选择了io.js(我相信您已经设法自行安装)。

如果你想使用你的pageDown.js文件,你首先需要注释掉exports检查并使用普通的旧变量,如下所示:

/*if (typeof exports === "object" && typeof require === "function") // we're in a CommonJS (e.g. Node.js) module
    Markdown = exports;
else*/
    Markdown = {};

/*if (typeof exports === "object" && typeof require === "function") { // we're in a CommonJS (e.g. Node.js) module
    output = exports;
    Converter = require("./Markdown.Converter").Converter;
} else {*/
    output = Markdown;
    Converter = output.Converter;
//}

(请注意,我也将output = window.Markdown;更改为output = Markdown; - 你必须做同样的事情(否则Nashorn会给你一个错误),但在你的问题中忘记提及。)< / p>

或者,您当然可以使用导出系统和单独的文件,但我没有相关经验,所以我会这样做。

现在,io.js接受来自stdin的JavaScript代码,你可以通过process.stdout.write()写入stdout,所以我们可以执行以下操作(在命令行上):

{ cat pageDown.js; echo 'process.stdout.write(getSanitizedHtml("test `test` test"));'; } | iojs;

我们得到以下回复:

<p>test <code>test</code> test</p>

如果你需要从Java那里做到这一点,你可以这样做:

import java.io.*;

class Test
{
    public static void main(String[] args) throws Exception
    {
        Process p = Runtime.getRuntime().exec("/path/to/iojs");
        OutputStream stdin = p.getOutputStream();
        InputStream stdout = p.getInputStream();
        File file = new File("/path/to/pageDown.js");
        byte[] b = new byte[(int)file.length()];
        FileInputStream in = new FileInputStream(file);
        for(int read = 0; read < b.length; read += in.read(b, read, b.length - read)); // <-- note the semicolon
        stdin.write(b);
        stdin.write("process.stdout.write(getSanitizedHtml('test `test` test'));".getBytes());
        stdin.close(); // <-- important to close
        p.waitFor();
        b = new byte[stdout.available()];
        stdout.read(b);
        System.out.println(new String(b));
    }
}

for之后直接注意分号(因此每次只执行read += in.read(b, read, b.length - read),而不是其他任何内容)并且还注意到在流上调用.close()时通常是可选的,如它将在对象超出范围时自动完成,此处必须调用stdin.close(),或iojs将继续等待输入,p.waitFor()将永远不会返回。