如何使用TensorFlow JS为CSV数据集创建模型并计算预测结果

时间:2019-02-20 11:16:17

标签: tensorflow tensor tensorflow.js

我是TensorFlow JS的新手。 我遵循TensorFlow JS文档来创建模型,并对其进行训练以从创建的模型计算预测结果。

但是我不知道如何训练已创建的CSV文件模型并计算CSV文件中两列或更多列的预测结果。

有人可以指导我使用一个示例来创建,训练带有CSV文件的模型并计算预测结果吗?

const csvUrl = 'https://storage.googleapis.com/tfjs-examples/multivariate-linear-regression/data/boston-housing-train.csv';

function save(model) {
    return model.save('downloads://boston_model');
}

function load() {
    return tf.loadModel('indexeddb://boston_model');
}

async function run() {
  // We want to predict the column "medv", which represents a median value of a
  // home (in $1000s), so we mark it as a label.
  const csvDataset = tf.data.csv(
    csvUrl, {
      columnConfigs: {
        medv: {
          isLabel: true
        }
      }
    });
  // Number of features is the number of column names minus one for the label
  // column.
  const numOfFeatures = (await csvDataset.columnNames()).length - 1;

  // Prepare the Dataset for training.
  const flattenedDataset =
    csvDataset
    .map(([rawFeatures, rawLabel]) =>
      // Convert rows from object form (keyed by column name) to array form.
      [Object.values(rawFeatures), Object.values(rawLabel)])
    .batch(10);

  // Define the model.
  const model = tf.sequential();
  model.add(tf.layers.dense({
    inputShape: [numOfFeatures],
    units: 1
  }));
  model.compile({
    optimizer: tf.train.sgd(0.000001),
    loss: 'meanSquaredError'
  });

  // Fit the model using the prepared Dataset
  model.fitDataset(flattenedDataset, {
    epochs: 10,
    callbacks: {
      onEpochEnd: async (epoch, logs) => {
        console.log(epoch, logs.loss);
      }
    }
  });

  const savedModel=save(model);
}

run().then(() => console.log('Done'));

1 个答案:

答案 0 :(得分:0)

使用tf.data.csv可以使用csv文件训练模型。

但是,浏览器无法直接读取文件。从此以后,您必须在本地服务器上提供csv文件

更新

您的模型仅使用一个感知器。使用多个感知器可以帮助提高模型的准确性,即增加多层。您可以查看here的完成方式。