在TabularDataBunch.from_df()中寻找有关“ path”参数的文档

时间:2019-01-15 15:26:38

标签: python-3.x categorical-data embedding fast-ai

我不确定我是否了解Python 3.6中fast.ai库的pathTabularDataBunch.from_df(path=path,df=df,...)(强制性)参数的用途。

我检查了documentation,但似乎找不到那里的详细信息。 特别是,我有一个pd.DataFrame,它在磁盘上没有关联的CSV文件。我该如何应用.from_df方法?

有人有更多信息或参考链接吗?

1 个答案:

答案 0 :(得分:0)

找到了一个路径值为'output'的{​​{3}}。另外,example here that helpedpath定义为输出结果的输出位置。

df = pd.DataFrame({'A': list('aabbccabca'), 'B': np.random.normal(size=10).round(2), 'Y': list('aabbccabca')})
tfms = [Categorify]
tblrData = TabularDataBunch.from_df('output', df, dep_var='Y', valid_idx=[7,8], procs=tfms, cat_names=['A'], bs=4)
(cat_x,cont_x),y = next(iter(tblrData.train_dl))
for o in (cat_x, cont_x, y): print(to_np(o[:5]))

bs是此处的批次大小参数。