我有一个关于URL的系列文章,我需要复制如下。
https://wipp.edmundsassoc.com/Wipp/?wippid=*1205*
1205是可变的,最终输出需要看起来像
"https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage1"
................................................#taxpage2"
................................................#taxpage3
................................................#taxpage4
等等。我有一个没有"#taxpage"
部分的URL列表,以及每个应该有多少个税页的列表。我想生成每个URL的所有可能页面的列表。感谢您的帮助......对编码完全陌生,非常感谢任何帮助。
答案 0 :(得分:1)
您可以使用str.format
在列表理解中添加#taxpage
号码
>>> s = r'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage{}'
>>> [s.format(i) for i in range(1, 5)]
['https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage1',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage2',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage3',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage4']
答案 1 :(得分:0)
您可以使用列表理解来完成此操作:
In [1]: urls = ['https://wipp.edmundsassoc.com/Wipp/?wippid=1205',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1206']
In [2]: ["{}#taxpage{}".format(url, page_num) for page_num in xrange(1, 4) for url in urls]
Out[2]:
['https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage1',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1206#taxpage1',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage2',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1206#taxpage2',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1205#taxpage3',
'https://wipp.edmundsassoc.com/Wipp/?wippid=1206#taxpage3']