我想从网站上提取数据。我什么都有,但是我需要清理数据。
我已经尝试过该脚本,但是在我的for循环中添加了“!= column_List”,但是我不知道它是如何完成的。
import urllib
import urllib.request
from bs4 import BeautifulSoup
def make_soup(url):
thepage = urllib.request.urlopen(url)
soupdata = BeautifulSoup(thepage,"html.parser")
return soupdata
column_List = ['Name','Symbol','Currency','ISIN','Sector','ICB Code','Fact Sheet']
soup = make_soup("https://www.nasdaqomxnordic.com/aktier/listed-companies/nordic-large-cap")
for record in soup.findAll('tr')!=column_List: ##(comment I added !=)
print(record.text)
我将提取股票报价数据,对其进行格式化,并使用货币信息添加正确的yah * o标签。 .st用于瑞典股票,.co用于丹麦哥本哈根等