我有问题。我使用python 2.7.13从网页收集一些数据。 我尝试从多篇文章中收集数据。
我使用下面的脚本来收集我想要的数据。
import urllib2
i=0
line = open("artikelen.csv", "r").readlines()[i]
url = 'http://shop.niemann-frey.de/cshop/product.html?SID='
SID = '1cfbf44f2a062d40b1d8dd3fd9c434ff'
curl = '&art_nr='
artnr = line
response = urllib2.urlopen(url+SID+curl+artnr)
webContent = response.read()
for item in webContent.split("</title></head>"):
if "<html><head><title>" in item:
artikel = item [ item.find("<html><head><title>")+len("<html><head><title>") : ]
print "artikelnummer is: " + artikel
import csv
with open(artikel + '.csv', 'w') as fw:
writer = csv.writer(fw, delimiter=',')
f = open(artikel+'.csv','wb')
for item in webContent.split("&mode=thumb&dbname=bilder"):
if "https://shop.niemann-frey.de/cshop/lib/progs/getmedia.php?id=" in item:
nummer = item [ item.find("https://shop.niemann-frey.de/cshop/lib/progs/getmedia.php?id=")+len("https://shop.niemann-frey.de/cshop/lib/progs/getmedia.php?id=") : ]
print nummer
f.write(nummer+";")
f.close
i+=1
我使用的列表看起来或多或少像这样
产品编号:
1B000928
1B001279
1B001114
1B001271
等
我想将这些值用作&#34; artnr&#34;我想为列表中的所有值预先形成我的脚本。我该如何处理?
提前谢谢大家!
答案 0 :(得分:0)
简单如下:
with open("artikelen.csv", "r") as csv:
for artnr in csv:
# your code here