Tensorflow高级估算器的预处理数据集

时间:2018-04-25 06:05:04

标签: numpy tensorflow scikit-learn

我来自Scikit Learn背景。 我很难理解如何为Tensorflow预处理数据集。

我正在尝试使用iris数据集实现svm。 如果我有两个numpy数组,一个包含功能列表,另一个包含标签列表,我将使用哪些函数来创建分类器?

estimator = SVM(
    example_id_column='example_id',
    feature_columns=[real_feature_column, sparse_feature_column],
    l2_regularization=10.0)

我假设example_id_column是

example_id_column  = '0,1,2'

我不确定如何获得feature_columns

1 个答案:

答案 0 :(得分:0)

我认为最有效的方法是使用TFRecords文件。有一个comprehensive tutorial可用仍然是最相关的。这样做的另一个好处是,您可以将更多的管道定义为图形的一部分,能够从源文件执行并发读取,而不需要将数据集放入内存中。这绝对是值得的。