Question

我想使用beautifulsoup提取所需的单词。对于我的应用程序，我使用arxiv API来获取相关论文搜索的总数。对于我的查询，我使用电子进行搜索。 API返回大约144055作为总搜索结果。我要提取这个总数。

import urllib.request as ur
from bs4 import BeautifulSoup

url = 'http://export.arxiv.org/api/query?search_query=all:electron' # arxiv:api
s = ur.urlopen(url)
sl = s.read()
soup = BeautifulSoup(sl, 'html.parser')
print(soup.prettify('latin-1'))
desire_word=soup.find('opensearch:totalresults')
print(desire_word)

我打印了愿望词。但是我是全文来的。

<opensearch:totalresults xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">144055</opensearch:totalresults>

如何仅获取总数（144055）？

Answer 1

你很近

print(desire_word.text)

Answer 2

没有足够的声誉进行评论，但是当您不确定返回的内容时要注意一些事情：

print(type(desire_word))
print(dir(desire_word))

这样，您将能够看到

1）wish_word不是字符串，而是元素

2）wish_word具有一个名为“文本”的属性，并且“听起来很有用，让我尝试desire_word.text”

使用beautifulsoup进行解析以获取准确的单词

2 个答案: