这可能是一个愚蠢的问题,但它让我发疯。我有一篇由8807篇文章组成的语料库:
print(type(doc_set))
class 'pandas.core.series.Series'
print(len(doc_set))
8807
从这个列表中,我只想选择第一个。我试过doc_set[1]
,但它检索了46篇文章。有关如何选择特定文章的想法吗?感谢
答案 0 :(得分:1)
尝试使用iloc定位器:
doc_set.iloc[0]
文档[iloc
]:
纯粹基于整数位置的索引,用于按位置选择。
.iloc []主要是基于整数位置(从0到长度-1) ()),但也可以与布尔数组一起使用。
允许的输入是:
整数,例如5.整数列表或数组,例如[4,3,0]。一个 具有整数的切片对象,例如1:7。布尔数组。可调用的函数 有一个参数(调用Series,DataFrame或Panel)和那个 返回索引的有效输出(上面的一个).iloc将引发 如果请求的索引器超出限制,则为IndexError,但slice除外 允许越界索引的索引器(符合 python / numpy slice语义)。
或iat定位器:
doc_set.iat[0]
文档[iat
]:
与快速整数位置标量访问器。
与iloc类似,iat提供基于整数的查找。你也可以 使用这些索引器设置。
iat
相比,PS iloc
应该更快,因为后者会有一些开销
答案 1 :(得分:1)
我认为你在Database Server Host:localhost
Database Server Host:root //phpmyadmin username
Database Server Password:password //phpmyamdin password
Database Name: magento//database name as enter in phpmyadmin
Table prefix: //empty
中存在两面性。
如果您需要选择index
的第一个值
iat
Series