我想从网页上提取统计数据

时间:2014-02-09 23:26:23

标签: python

我想创建一个简单的python脚本,让我使用'urlopen'命令打开这个url。 http://ffc.coinz.pw/index.php?page=statistics&action=pool

当您访问该网页时,您会看到“常规统计信息”框。 我想使用python脚本只显示“当前难度”旁边的数字

我该怎么做?

2 个答案:

答案 0 :(得分:1)

这需要大约15分钟的研究时间:

import urllib
import re

url = "http://ffc.coinz.pw/index.php?page=statistics&action=pool"
source = urllib.urlopen(url)
regexp = r">(\d+(?:\.\d*)?)<"
found = 0

for line in source.readlines():
    if found:
            match = re.search(regexp,line)
            break
    if "Current Difficulty" in line:
            found = 1

print match.groups()

您可以自己解决此问题的页面:

  

http://docs.python.org/2/library/re.html

     

http://docs.python.org/2/library/urllib.html

使用正则表达式的说明:

  

http://regex101.com/r/kX9jU6

答案 1 :(得分:-1)

  

我想使用python脚本只显示“当前难度”旁边的数字

     

我该怎么做?

  1. 将页面作为原始字符串
  2. 使用正则表达式匹配单词“Current Difficulty”,然后使用下一个合适的数字/字符串/模式。
  3. 这是一种方法。


    如zord所述,请在发布StackOverflow中的问题之前阅读这些内容:

      

    How do I ask a good question?

         

    What topics can I ask about here?