我有一个巨大的CSV文件,其中包含多列,希望在天列与今天的日期匹配时创建一个列表,它应该读取用户代理列并创建一个列表。
UserAgentsToday = {}
for row in df:
print((df.Day == "05/21/2019"))
if row.["Day"]=="05/21/2019":
UserAgentsToday.add(row["User Agent"])
print(UserAgentToday)
TypeError:字符串索引必须为整数
UserAgentsToday = {}
for row in df:
if df["Day"]=="05/21/2019":
UserAgentsToday.add(row["User Agent"])
print(UserAgentToday)
系列的真值不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()。
答案 0 :(得分:0)
将df.loc
与unique()
一起使用
例如:
import pandas as pd
df = pd.DataFrame({"Day": ["05/21/2019", "05/21/2019", "05/21/2019"], "User Agent": ["Hello", "World", "Hello"]})
print(df.loc[df["Day"] == "05/21/2019", "User Agent"].unique())
输出:
['Hello' 'World']