所以我有一个工作代码可以从域上的30个网站中提取数据。
with open("c:\source\list.csv") as f:
for row in csv.reader(f):
for url in row:
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
tables = soup.find('table', attrs={"class": "hpui-standardHrGrid-table"})
for rows in tables.find_all('tr', {'releasetype': 'Current_Releases'})[0::1]:
item = []
for val in rows.find_all('td'):
item.append(val.text.strip())
with open('c:\source\output_file.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow({url})
writer.writerows(item)
当我打开CSV文件时,我会看到每个字符都来自'项目'变量存储在自己的单元格中。我似乎无法弄清楚这是怎么回事以及如何解决它。
有什么想法吗?
答案 0 :(得分:1)
我通过更改
来修复此问题 writer.writerows(item)
到
writer.writerow(item)