提高在datalab中运行两个循环的速度

时间:2018-11-15 22:13:29

标签: google-cloud-datalab

我想比较两个字符串列表,并返回数据实验室中每个比较的相似性得分。 但是,运行代码需要很长时间。有什么想法可以提高跑步速度吗? 我正在使用Fuzzywuzzy进行字符串比较,下面是示例代码。 list1的长度为34323,list2的长度为49057。

`for j in range(1,len(list1)):         
print(j)
str1=str(list1.iloc[j]['Q_NoProductClick'])
print(str1)
for l in range(1,len(list2)):
  #print(l)
  str2=str(list2.iloc[l]['Q_ClickedProd'])
  #print(str2)
  a=fuzz.ratio(str1,str2)`

0 个答案:

没有答案