使用beautifulsoup进行解析以获取准确的单词

时间:2019-04-12 17:16:27

标签: python beautifulsoup

我想使用beautifulsoup提取所需的单词。对于我的应用程序,我使用arxiv API来获取相关论文搜索的总数。对于我的查询,我使用电子进行搜索。 API返回大约144055作为总搜索结果。我要提取这个总数。

import urllib.request as ur
from bs4 import BeautifulSoup

url = 'http://export.arxiv.org/api/query?search_query=all:electron' # arxiv:api
s = ur.urlopen(url)
sl = s.read()
soup = BeautifulSoup(sl, 'html.parser')
print(soup.prettify('latin-1'))
desire_word=soup.find('opensearch:totalresults')
print(desire_word)

我打印了愿望词。但是我是全文来的。

<opensearch:totalresults xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">144055</opensearch:totalresults>

如何仅获取总数(144055)?

2 个答案:

答案 0 :(得分:1)

你很近

print(desire_word.text)

答案 1 :(得分:0)

没有足够的声誉进行评论,但是当您不确定返回的内容时要注意一些事情:

print(type(desire_word))
print(dir(desire_word))

这样,您将能够看到

1)wish_word不是字符串,而是元素

2)wish_word具有一个名为“文本”的属性,并且“听起来很有用,让我尝试desire_word.text