我不确定我是否了解Python 3.6中fast.ai库的path
中TabularDataBunch.from_df(path=path,df=df,...)
(强制性)参数的用途。
我检查了documentation,但似乎找不到那里的详细信息。
特别是,我有一个pd.DataFrame
,它在磁盘上没有关联的CSV文件。我该如何应用.from_df
方法?
有人有更多信息或参考链接吗?
答案 0 :(得分:0)
找到了一个路径值为'output'
的{{3}}。另外,example here that helped将path
定义为输出结果的输出位置。
df = pd.DataFrame({'A': list('aabbccabca'), 'B': np.random.normal(size=10).round(2), 'Y': list('aabbccabca')})
tfms = [Categorify]
tblrData = TabularDataBunch.from_df('output', df, dep_var='Y', valid_idx=[7,8], procs=tfms, cat_names=['A'], bs=4)
(cat_x,cont_x),y = next(iter(tblrData.train_dl))
for o in (cat_x, cont_x, y): print(to_np(o[:5]))
bs
是此处的批次大小参数。