Luigi LocalTarget二进制文件

时间:2016-08-27 09:33:49

标签: python-3.x luigi

我在项目中的Luigi管道中编写二进制LocalTarget时遇到了麻烦。我在这里解决了这个问题:

class LuigiTest(luigi.Task):
    def output(self):
        return luigi.LocalTarget('test.npz')

    def run(self):
        with self.output().open('wb') as fout:
            np.savez_compressed(fout, array=np.asarray([1, 2, 3]))

我尝试以'w''wb'开放,但我一直收到以下错误:

TypeError: write() argument must be str, not bytes

我使用的是python 3.5.1,我的luigi版本是2.1.1

2 个答案:

答案 0 :(得分:8)

问题在于LocalTarget的格式。将其更改为:

return luigi.LocalTarget('test.npz', format=luigi.format.Nop)

解决了这个问题。但是文档中没有任何相关内容。

答案 1 :(得分:1)

它解决了我在Hadoop中编写实木复合地板文件的问题。 format=luigi.format.Nop成功了。谢谢!

import luigi
import pandas as pd
import luigi.contrib.hdfs as hdfs

class Hdfs(luigi.Task):
    """
    Writes files into output.
    """
    def __init__(self, *args, **kwargs):
        super(Hdfs, self).__init__( *args, **kwargs)

    def output(self):
        fname_template = f'/data/some_directory/test_luigi.parq'
        return luigi.contrib.hdfs.HdfsTarget(fname_template, format=luigi.format.Nop)

    def run(self):
        with self.output().open('w') as f:
            print(f.path)
            d = pd.DataFrame({'sim_id':[1,2,3]})
            d.to_parquet(f)