Question

我最近尝试抓取http://quotes.toscrape.com/引号（仅在第一页上）并将其保存到csv文件中。我得到了一个很奇怪的结果。仅逗号用作分隔符。请参见下面的屏幕截图和代码：

from bs4 import BeautifulSoup
from urllib.request import urlopen
import csv

csvfile = open('quotes.csv', 'w')
writer = csv.writer(csvfile)
writer.writerow(('text'))


def parse():
    html = urlopen('http://quotes.toscrape.com/page/1/')
    bs = BeautifulSoup(html, 'lxml')
    quotes = bs.findAll('div', class_='quote')
    for quote in quotes:
        try:
            text = quote.find('span', class_='text').getText(
            ).replace(',', '|').replace('"', '')
            print(text)
            writer.writerow((text))
        except UnicodeEncodeError:
            break

parse()
csvfile.close()

Answer 1

您试图将写入行与元组一起使用，但是（奇怪的怪癖）实际上并没有使用元组。

请参阅我的示例：

some_num = (1)
some_tuple = (1,)

更改此行：

        writer.writerow((text))

到

        writer.writerow((text,))

请注意逗号:)

但是为什么会发生这种情况？

而不是破坏它，而是像对待单个字符的元组一样遍历字符串，例如

>>> for character in "this string":
...     print(character)
t
h
i
s

s
t
r
i
n
g

使用python的奇怪的csv输出

1 个答案: