如何从当前查看的网站解析HTML标签?

时间:2016-12-29 14:23:04

标签: javascript python html

请原谅我一篇很长的帖子,但是我需要在任何人盲目地点击下选按钮之前清楚地解释我的问题。

我从事过Java / Android / Python / C / C ++,但我现在的技术堆栈似乎并没有帮助我解决当前的问题,因为我没有太多的网络技术经验,所以我在寻求帮助。 / p>

我有一个来自网站的网页(必须登录并且它为每次登录生成令牌)我在那里做一些数据输入,我想解析我正在查看的网页的HTML代码&根据网页中存在的少数标签的值进行一些计算。

我尝试过python的beautifulsoup,但我无法登录网站(我尝试过机械化)。

我试图在python中使用OCR但是没有给出期望的结果。

所以我需要帮助/建议我应该选择哪种语言组合,以便我可以刮掉&处理当前查看的网页的HTML标签&显示结果。

def count_pokemon_total():
    f = open("s.txt")
    types = {"pikachu:-":0,"raichu:-":320,'Pichu:-': 470}
    pokemon=[]
    contents = f.read()
    for t in types:
        if t in contents:
            print "Number of ",t,"are",contents.count(t)
            pokemon.append(contents.count(t)*types[t])

    print "total pokemon values are is",sum(pokemon),"Rs."
    f.close()

count_pokemon_total()

P.S。: - 附上我试过的代码&它有效,但我不想使用这种方法。

P.P.S。 : - 附带的代码只是为了理解我想要实现的目标,无论如何它都与口袋妖怪无关。

0 个答案:

没有答案