从空单元格读取数据帧并启动数据初始化

时间:2019-11-22 13:04:47

标签: python pandas dataframe web-scraping

我有一个siret列中缺少值的数据库。我想阅读并附加从Google抓取的数据。看起来像:

yth

我有一个for循环,我想在其中读取Nom列,然后将其与complement_word串联;这会给我keyword。 我将在Google上搜索此关键字,然后提取一个特定的数字以添加到siret列(results[0]['siret'])中。

我尝试了这不起作用。

start_time = time.time()

compt = 0
for i, keyword in enumerate(liste_partenaire.Partenaire):
    if liste_partenaire.siret[i] == '':   # here I want to start reading and adding data
        keyword = keyword+ ' ' + 'infogreffe '+ str(liste_partenaire.complement_word[i])
        compt+=1
        print('loading... ',round(compt/len(liste_partenaire.Partenaire)*100, 2), '%',end="\r")
        try:
            results = scrape_google(keyword, 1, "fr")
            for result in results:
                if results:
                    liste_partenaire['siret'][i] = results[0]['siret']
                else:
                    liste_partenaire['siret'][i] = ''
        except Exception as e:
            print('Error in results:: [ {} ]'. format(e))
    finally: 
        time.sleep(2)

print("--- %s seconds d'éxecution ---" % (time.time() - start_time)) 

0 个答案:

没有答案