我想使用beautifulsoup提取所需的单词。对于我的应用程序,我使用arxiv API来获取相关论文搜索的总数。对于我的查询,我使用电子进行搜索。 API返回大约144055作为总搜索结果。我要提取这个总数。
import urllib.request as ur
from bs4 import BeautifulSoup
url = 'http://export.arxiv.org/api/query?search_query=all:electron' # arxiv:api
s = ur.urlopen(url)
sl = s.read()
soup = BeautifulSoup(sl, 'html.parser')
print(soup.prettify('latin-1'))
desire_word=soup.find('opensearch:totalresults')
print(desire_word)
我打印了愿望词。但是我是全文来的。
<opensearch:totalresults xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">144055</opensearch:totalresults>
如何仅获取总数(144055)?
答案 0 :(得分:1)
你很近
print(desire_word.text)
答案 1 :(得分:0)
没有足够的声誉进行评论,但是当您不确定返回的内容时要注意一些事情:
print(type(desire_word))
print(dir(desire_word))
这样,您将能够看到
1)wish_word不是字符串,而是元素
2)wish_word具有一个名为“文本”的属性,并且“听起来很有用,让我尝试desire_word.text
”