Question

我有一个包含3个不同列的pandas文件，我将其转换为带有to_dict的字典，结果是一个字典列表：

df = [
{'HEADER1': 'col1-row1', 'HEADER2: 'col2-row1', 'HEADER3': 'col3-row1'},
{'HEADER1': 'col1-row2', 'HEADER2: 'col2-row2', 'HEADER3': 'col3-row2'}
]

现在我的问题是我需要＆＃39; col2-rowX＆＃39;和＆＃39; col3-rowX＆＃39;构建一个URL并使用请求和bs4来抓取websties。

我需要的结果如下：

requests.get("'http://www.website.com/' +  row1-col2 + 'another-string' + row1-col3 + 'another-string'")

我需要为列表中的每个字典执行此操作。

我尝试使用for循环迭代字典。类似的东西：

import pandas as pd
import os

os.chdir('C://Users/myuser/Desktop')

df = pd.DataFrame.from_csv('C://Users/myuser/Downloads/export.csv')

#Remove 'Code' column
df = df.drop('Code', axis=1)

#Remove 'Code2' as index
df = df.reset_index()

#Rename columns for easier manipulation
df.columns = ['CB', 'FC', 'PO']

#Convert to dictionary for easy URL iteration and creation
df = df.to_dict('records')

for row in df:
    for key in row:
        print(key)

Answer 1

每次执行时都只需要迭代两次，并且短路从嵌套的for循环中执行return语句。从字典中查找必要的信息将允许您建立您的网址。一个可能的例子：

def get_urls(l_d):
    l=[]
    for d in l_d:
        l.append('http://www.website.com/' +  d['HEADER2'] + 'another-string' + d['HEADER3'] + 'another-string')
    return l

df = [{'HEADER1': 'col1-row1', 'HEADER2': 'col2-row1', 'HEADER3': 'col3-row1'},{'HEADER1': 'col1-row2', 'HEADER2': 'col2-row2', 'HEADER3': 'col3-row2'}]
print get_urls(df)
>>> ['http://www.website.com/col2-row1another-stringcol3-row1another-string', 'http://www.website.com/col2-row2another-stringcol3-row2another-string']

迭代dicts列表以创建不同的字符串

1 个答案: