如何请求输入以切片熊猫数据框

时间:2019-12-04 11:46:56

标签: python pandas

我已经列出了我需要检查的10,000个URL,并且正在自动打开这些URL。

到目前为止,我已经做到了,并且有效:

import webbrowser
import pandas as pd

urls  = pd.read_csv('urls.csv', delimiter='\'')

urls = urls['urls']

for url in urls[:100]:
    webbrowser.open_new(url)

现在,问题在于,每次我需要打开新的URL时,我都必须转到代码处并更改切片。 您认为可以请求用户输入以自行选择切片范围吗?

我已经尝试过了:

for url in urls[{''}:{''}].format(input('Enter first line:  '), input('Enter last line:   ')):
    webbrowser.open_new(url)

我收到此错误:

TypeError: cannot do slice indexing on <class 'pandas.core.indexes.range.RangeIndex'> with 
these indexers [{''}] of <class 'set'>

有想法吗?

2 个答案:

答案 0 :(得分:1)

如果限制要检查的URL数量并且该库不是强制性的,则可以尝试请求库。

类似的东西:

import requests
import pandas as pd

urls  = pd.read_csv('urls.csv', delimiter='\'')

urls = urls['urls']

results = []

for url in urls:

    request = requests.get(url)

    if request.status_code == 200:
        results.append(url) 

请记住,通过此方法,URL应在csv文件中包含http://。例如http://www.someweb.com

答案 1 :(得分:0)

使用

slice_idx = int(input('Enter index to slice at: '))

获取要切片的索引,然后

urls.loc[:slice_idx, 'urls']

获取一系列切片的网址。