csv.writing从beautifulsoup表/行格式化

时间:2017-05-03 17:29:11

标签: python python-3.x csv beautifulsoup

所以我有一个工作代码可以从域上的30个网站中提取数据。

with open("c:\source\list.csv") as f:
  for row in csv.reader(f):
    for url in row:
      r = requests.get(url)
      soup = BeautifulSoup(r.content, 'lxml')
      tables = soup.find('table', attrs={"class": "hpui-standardHrGrid-table"})
      for rows in tables.find_all('tr', {'releasetype': 'Current_Releases'})[0::1]:
        item = []
        for val in rows.find_all('td'):
          item.append(val.text.strip())
      with open('c:\source\output_file.csv', 'w', newline='') as f:
        writer = csv.writer(f)
        writer.writerow({url})
        writer.writerows(item)

当我打开CSV文件时,我会看到每个字符都来自'项目'变量存储在自己的单元格中。我似乎无法弄清楚这是怎么回事以及如何解决它。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

我通过更改

来修复此问题
    writer.writerows(item)

    writer.writerow(item)