我刚接触python甚至是编码。 这是我的Python代码:
>>> import xlrd
>>> file_name = "D:/Uber/reviews"
>>> workbook = xlrd.open_workbook(file_name)
>>> sheet = workbook.sheet_by_index(0)
>>> for row in range(sheet.nrows):
print(sheet.cell_value(row, 1)
我得到了“print”命令的输出。但是,我不知道如何为该输出创建一个变量(我需要nltk tokenize的变量)
感谢您的帮助。
答案 0 :(得分:0)
您可以直接在课堂上重复使用它:
>>> import xlrd
>>> from nltk.tokenize import TweetTokenizer
>>> tknzr = TweetTokenizer()
>>> file_name = "D:/Uber/reviews"
>>> workbook = xlrd.open_workbook(file_name)
>>> sheet = workbook.sheet_by_index(0)
>>> for row in range(sheet.nrows):
data =sheet.cell_value(row, 1)
print(data)
tknzr.tokenize(data)
答案 1 :(得分:0)
我认为你想要的是分配线:
sheet.cell_value(row, 1)
变量。例如:
my_row_value = sheet.cell_value(row, 1)
然后您可以根据需要使用 my_row_value 和nltk tokenize。更好的是,如果你希望这个程序在退出python解释器后增长并使用它,那么最好的办法是将代码放在脚本中,例如:
myscript.py
然后你可以使用python解释器简单地运行它,或者你只是在linux上运行它:
python myscript.py
如果我有帮助,请告诉我。
答案 2 :(得分:0)
我不确定你在寻找什么,但如果你想捕捉打印输出,那就
for row in range(sheet.nrows):
string = str(sheet.cell_value(row, 1))
print (string)