AttributeError:'str'对象没有属性'show'PySpark

时间:2018-11-09 09:02:41

标签: python python-2.7 dataframe pyspark

AttributeError:'str'对象没有属性'show'

我正在尝试将任何测试json文件作为命令行参数的一部分传递。这样做时,它将其视为字符串,我不希望将其视为DataFrame,以便它可以使用df.show()显示该数据帧。我在终端上收到此错误消息,提示AttributeError:'str'对象没有属性'show'。

df = sqlContext.read.json(“tester.json")

def show_data(df):
      df.show()

parser = argparse.ArgumentParser()
parser.add_argument(‘-I’, ‘—inputfile', required=True , default =df)
args = parser.parse_args()
show_data(args.parameterfile)

1 个答案:

答案 0 :(得分:0)

问题在于您正在将 string 传递给show_data函数。

工作代码:

import argparse

def show_data(input_filename):
    df = sqlContext.read.json(input_filename)
    df.show()


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("filename", help="path of the file of interest")
    args = parser.parse_args()
    show_data(args.filename)

希望这会有所帮助