用于命令行脚本和导入模块

时间:2018-03-27 16:57:28

标签: python json module argparse

我想编写一个python“模板”模块,以便为我的所有脚本提供相同的行为。

行为如下:

  • 如果脚本在命令行中运行,则它接受使用argparse处理的参数。这些论点基本上是:
    • 从stdin,文件或字符串参数输入json;
    • 在stdout或文件中输出json
  • 如果脚本作为模块导入,则它具有管理以下情况的类/函数:
    • 从谁调用它来输入一个对象;
    • 输出一个对象,以便调用它的人可以使用它。

我做了什么:

“模板”部分template.py

由于这些建议,它完全符合我的命令行: Python argparse mutually exclusive with stdin being one of the options

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import json,sys,argparse,os

def main():

    parser = argparse.ArgumentParser(description='Template for python script managing JSON as input/output format. \
                                                  A JSON file can be [], {}, "string", 123, true, false, null.')

    infile=['-i','--input-file']
    kwinfile={'type':argparse.FileType('r'), 'help':'Input file name containing a valid JSON. Default and priority: standard input.'}

    jstring=['-j','--json']
    kwjstring={'type':str,  'nargs':'?', 'help':'Input file name containing a valid JSON. Default and priority: standard input.'}

    outfile=['-o','--output-file']
    kwoutfile={'type':argparse.FileType('w'), 'help':'Output file name. Default: standard output.', 'default':sys.stdout}

    pretty=['-p','--pretty']
    kwpretty={'action':'store_true', 'help':'If set, JSON output  will be formatted in pretty print.'}

    group = parser.add_mutually_exclusive_group()

    group.add_argument(*infile, **kwinfile)
    group.add_argument(*jstring, **kwjstring)
    parser.add_argument(*outfile, **kwoutfile)
    parser.add_argument(*pretty, **kwpretty)

    args = parser.parse_args()

    return(args)

def input(*data):
    args=main()

    # if data :
    #     datain=data[0]

    # else :
    if not sys.stdin.isatty(): # pipe
        data=sys.stdin.read()
    else:  # no pipe
        if not len(sys.argv) > 1 or (args.input_file == None and args.json == None) : # no arguments or no input
            data='null'
        else :
            data = args.json or args.input_file.read()

    try:
        datain = json.loads(data)
    except:
        output({'script_name':(sys.argv[0]),
                'error': 'Input is not a valid JSON.',
                'data': data})
        sys.exit(0)

    return(datain)


def output(*datain) :
    args=main()
    if datain :
        datain=datain[0]

    indent = 2 if args.pretty else None

    dataout = json.dumps(datain, indent=indent, ensure_ascii=False)
    args.output_file.write(dataout+os.linesep)

    return(dataout)

if __name__ == "__main__":
    main()

我希望这是实现它的最佳方式。

示例“calculate_area”

现在,如果我使用

在脚本中导入它
import template as t

def main():

    inp=t.input() # {"x":8, "y":2}

    out={'area' : inp['x'] * inp['y'] }

    return(t.output(out))

if __name__ == "__main__":
    main()

脚本按照我的意愿在命令行中执行:

$ echo '{"x":8, "y":2}' | ./calculate_area.py -p
{
  "area": 16
}

“calculate_sqrt”脚本将其作为模块

进行测试

现在我想要第三个脚本将其作为模块导入。

import template as t
import calculate_area as i
import numpy as np
import json

def main():

    inp=json.loads(i.main())

    out={'sqrt of area' : np.sqrt(inp['area']) }

    return(t.output(out))

if __name__ == "__main__":
    main()

这里的问题开始了:

$ echo '{"x":8, "y":2}' | ./calculate_sqrt.py -p
{
  "area": 16
}
{
  "sqrt of area": 4.0
}
  • 为什么我获得两个输入而不是最后一个?

此外:

  • 如何避免在json中输入?换句话说:“如果模块是通过import调用的,那么输入/输出将通过对象,否则它将通过命令行中的json”?

我在这里保存了我的代码: https://github.com/orsa-unige/python-templates/tree/simplified-example

1 个答案:

答案 0 :(得分:1)

在我看来,这是一个好的大纲,基本脚本:

import json,sys,argparse,os

def parser(argv=None):
    # if argv is None, uses the sys.argv[1:]
    parser = argparse.ArgumentParser(....)
    ...
    args = parser.parse_args(argv)
    return(args)

def input(args, *data):

    # if data :
    #     datain=data[0]

    if args.input_file is not None: 
        # input_file might be sys.stdin (if '-')   
        data = args.input_file.read()
    # stdin should work for < redirection
    # I don't know if works for pipe
    ...
    return(datain)

def output(args, *datain) :
    if datain :
        datain=datain[0]
    # output_file might be stdout
    ....
    return(dataout)

def main(args):
    datain = input(args, [])
    dataout = output(args, datain)
    return dataout

if __name__ == "__main__":
    args = parser()
    main(args)

如果作为脚本调用,它只运行一次解析器。如果导入,则由导入器脚本决定是否运行此解析器。

parser可以多次运行,但通常不需要 - 至少在Namespace可以传递的情况下不行。但每次调用解析器都会打开输入/输出文件。由于在写入模式下打开了一个文件,可能会导致重叠打开。

解析器可能会测试:

args = parser(['-i', 'inputfile.py', ....]

另一个脚本可以做

from template import parser, input, output
def main(args):
    ... input
    # do its own thing
    ... output
# etc