在Python中解析HTML上传的CSV文件

时间:2013-02-01 17:25:05

标签: python csv html-parsing

我使用GAE来托管需要CSV文件输入的网站。上传此csv文件后,我将其转换为表格。但是,我遇到了有关Mac和Windows兼容性问题的问题。在Mac中生成的CSV文件将无法识别,我收到错误:

new-line character seen in unquoted field - do you need to open the file in universal-newline mode?

这是我的 Python代码

def loop_html(thefile):
    reader = csv.reader(thefile.file)   
    header = reader.next()
    i=1
    iter_html=""
    for row in reader:
        iter_html = iter_html +html_table(row,i)  #generate inputs table
        i=i+1

def html_table(row_inp,iter):
    mai_temp=float(row_inp[0])

    Input_header="""<table border="1">
                        <tr><H3>Batch Calculation of Iteration %s</H3></tr><br>
                        <tr>
                            <td><b>Input Name</b></td>
                            <td><b>Input value</b></td>
                            <td><b>Unit</b></td>
                        </tr>"""%(iter)
    Input_mai="""<tr>
                    <td>Mass of Applied Ingredient Applied to Paddy</td>
                    <td>%s</td>
                    <td>kg</td>
                </tr>""" %(mai_temp) 
    Inout_table = Input_header+Input_mai
    return Inout_table  

后来我将代码'reader = csv.reader(thefile.file)'更改为 'reader = csv.reader(open(thefile.file,'U'))'给了我不同类型的错误:

TypeError: coercing to Unicode: need string or buffer, cStringIO.StringO found

任何人都可以查看我的代码并给我一些建议吗?谢谢!

1 个答案:

答案 0 :(得分:1)

我刚刚找到了解决方案。 'splitlines()'将处理新的行问题。这是source

reader = csv.reader(thefile.file.read().splitlines())