csv.writer在单独的列/单元格中写入单词的每个字符

时间:2013-02-28 07:08:25

标签: python csv web-scraping

目标:从models中所有行内的锚标记中提取文本,并将其放在csv中。

我正在尝试这段代码:

with open('Sprint_data.csv', 'ab') as csvfile:
  spamwriter = csv.writer(csvfile)
  models = soup.find_all('li' , {"class" : "phoneListing"})

  for model in models:

      model_name = unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip()
      spamwriter.writerow(unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip())

除了csv中的每个单元格只包含一个字符外,它工作正常。

像这样:

|  S  |  A  |   M  |   S  |   U   |  N  |   G   |

而不是:

|SAMSUNG|

当然我错过了一些东西。但是什么?

4 个答案:

答案 0 :(得分:64)

.writerow()需要一个序列(''()[])并按顺序将每个索引放入其自己的行列中。如果您所需的字符串不是序列中的项目,writerow()将遍历字符串中的每个字母,并且每个字母将在单独的单元格中写入您的CSV。

之后import csv

如果这是您的清单:

myList = ['Diamond', 'Sierra', 'Crystal', 'Bridget', 'Chastity', 'Jasmyn', 'Misty', 'Angel', 'Dakota', 'Asia', 'Texxxas', 'Desiree', 'Monique', 'Tatiana']


listFile = open('Strippers.csv', 'wb')
writer = csv.writer(listFile)
for item in myList:
    writer.writerow(item)

以上脚本将生成以下CSV: strippers.csv

D,i,a,m,o,n,d
S,i,e,r,r,a
C,r,y,s,t,a,l
B,r,i,d,g,e,t
C,h,a,s,t,i,t,y
J,a,s,m,y,n
M,i,s,t,y
A,n,g,e,l
D,a,k,o,t,a
A,s,i,a
T,e,x,x,x,a,s
D,e,s,i,r,e,e
M,o,n,i,q,u,e
T,a,t,i,a,n,a

如果您希望其中的每个名称都有自己的单元格,那么解决方案就是简单地将您的字符串(item)放入序列中。这里我使用方括号[]。 :

listFile2 = open('Strippers2.csv', 'wb')
writer2 = csv.writer(listFile2)
for item in myList:
    writer2.writerow([item])

带有.writerow([item])的脚本会产生所需的结果: Strippers2.csv

Diamond
Sierra
Crystal
Bridget
Chastity
Jasmyn
Misty
Angel
Dakota
Asia
Texxxas
Desiree
Monique
Tatiana

答案 1 :(得分:12)

writerow接受一个序列。你给它一个字符串,所以它将它视为一个序列,字符串就像字符序列一样。

这一排你还想要什么?没有?如果是这样,请将其列为一个项目列表:

spamwriter.writerow([u' '.join(model.a.stripped_strings).encode('utf8').strip()])

(顺便说一句,unicode()调用是完全没必要的,因为你已经加入了unicode分隔符。)

答案 2 :(得分:3)

用一个列表符号(即 []

包围它
writer.writerow([str(one_column_value)])

答案 3 :(得分:0)

这通常是我使用的解决方案:

import csv
    with open("output.csv", 'w', newline= '') as output:
        wr = csv.writer(output, dialect='excel')
        for element in list_of_things:
            wr.writerow([element])
        output.close()

这应该在单列而不是单行中为您提供所有列表元素的输出。

关键是要遍历列表,并使用“ [list]”来避免csvwriter排序问题。

希望这是有用的!