带有中文unicode的HTML到png?

时间:2018-02-25 19:30:31

标签: javascript node.js fonts non-ascii-characters wkhtmltoimage

我尝试使用npm包./tagslegend.html呈现此html文档wkhtmltox

<!doctype html>
<html>
  <head>
    <style>
      .cmn {
        font-family: 'WenQuanYi Micro Hei';
      }
    </style>
  </head>
  <body>
    <dl>
      <dt class="cmn">中文</dt><dd>In mandarin language.</dd>
    </dl>
  </body>
</html>

这是javascript:

const express = require('express');
const fs = require('fs');
const wkhtmltox = require('wkhtmltox');

const app = express();
const converter = new wkhtmltox();

app.get('/tagslegend.png', (request, response) => {
  response.status(200).type('png');
  converter.image(fs.createReadStream('tagslegend.html'), { format: "png" }).pipe(response);
});

var listener = app.listen(process.env.PORT, function () {
  console.log('App listening on port ' + listener.address().port);
});

我希望它能像我的浏览器一样呈现相同的html:

enter image description here

但是我得到了这样一个png:

enter image description here

如何修复此问题并使其像第一张图像一样呈现?

我在服务器上安装了该字体:

$ fc-list | grep 'Wen'
/app/.fonts/WenQuanYi Micro Hei.ttf: WenQuanYi Micro Hei,文泉驛微米黑,文泉驿微米黑:style=Regular

1 个答案:

答案 0 :(得分:0)

这看起来像是一个字符编码问题。似乎fs.createReadStream()正在将您的HTML读作ISO-8859-1,当它真的应该将其读作UTF-8时 - 这很奇怪,因为UTF-8是默认编码。

我确保将tagslegend.html正确保存为UTF-8文件。明确宣布:

是不会有害的
<meta charset="utf-8">

...也在HTML的<head>部分。