如何将pdf上下文转换为html?

时间:2016-06-12 10:56:20

标签: javascript html pdf

好几天我现在正在学习HTML,CSS和现在的javascript。我需要的是一种将pdf文档的信息放入我的html网页的方法。

我现在尝试了几件事,无法找到我需要的正确答案或信息。所以这里有一个用例:

  1. 将.pdf文档放入文件夹
  2. 获取目标文件夹的所有.pdf文档的信息(具有完全相同的格式)
  3. 将这些信息转换为html上下文
  4. 获取此html上下文以显示在网页上(图片和文字)
  5. 1是微不足道的,我可以拖放我的文件

    2我正在考虑类似数组的东西,然后调用该文件夹将数据输入其中。

    为此,我找到了:

    'use strict';
    function getFiles(dir) {
      fileList = [];
    
      var files = fs.readdirSync(dir);
      for (var i in files) {
        if (!files.hasOwnProperty(i)) continue;
        var name = dir + '/' + files[i];
        if (!fs.statSync(name).isDirectory()) {
            fileList.push(name);
        }
      }
      return fileList;
    }
    console.log(getFiles('pathtodirectory'));
    

    这里我总是得到一个引用错误,无论路径是什么,我现在只能在我的电脑上使用本地路径。我不是百分之百确定一切都有,但我认为到目前为止我做得很好。这个函数只给我一个要处理的文档列表。

    3现在这对我来说更加棘手,但我认为如果我得到数据,我可以解决一些问题。

    4我想我可以通过一些研究来做到这一点

    我很高兴任何提示或解决方案,因为我说我对所有这些都很新:)

    的问候,

    帕斯卡

1 个答案:

答案 0 :(得分:0)

'use strict';
function getFiles(dir) {
  fileList = []; // <- This becomes a global variable

应该是:

'use strict';
function getFiles(dir) {
  var fileList = []; // <- Now it's local to this scope

因为在严格模式下不允许创建隐式全局变量。

同样getDirSync返回一个数组,所以你应该这样对待它:

function getFiles(dir) {
  fileList = [];

  var files = fs.readdirSync(dir);
  for (var i = 0; i < files.length; i++) {
    var name = dir + '/' + files[i];
    if (!fs.statSync(name).isDirectory()) {
        fileList.push(name);
    }
  }
  return fileList;
}

.reduce

function getFiles(dir) {
  return fs.readdirSync(dir).reduce(function(arr, file) {
    var name = dir + '/' + file;
    if (!fs.statSync(name).isDirectory()) {
        arr.push(name);
    }
    return arr;
  }, []);
}