UnicodeDecodeError:' ascii'编解码器不能解码位置284中的字节0x93:序数不在范围内(128)

时间:2017-05-29 05:00:07

标签: python nltk textblob

from textblob import TextBlob as tb
from sqlalchemy import create_engine
import pandas as pd

首先我使用sqlalchemy创建引擎engine=create_engine("mysql+mysqldb://root:ja@localhost:3306/listing")

然后我使用pandas read_sql命令从数据库中读取数据。

df=pd.read_sql('select locationId,text from location_reviews',engine)

尝试将文本列从字符串转换为textblob UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 284: ordinal not in range(128)时出现此错误 我使用sqlalchemy和df = pd.read_sql(query,engine)来从sql读取数据。 然后我尝试使用

转换textblob中的文本列
df['text']=df.text.apply(lambda x: tb(x))

并收到上述错误。

1 个答案:

答案 0 :(得分:0)

这意味着您在文本中有一个unicode字符,您尝试将其转换为TextBlob。你可能想要确保没有unicode角色偷偷靠近。

尝试% read image reg_maxdist = 0.2; I = im2double(imread('lena.jpg')); subplot(121); imshow(I); % let the user pick one point [x,y] = ginput(1); % round to integer to match required input by regiongrowing function x = round(x); y = round(y); % plot point on original image hold on; plot(x,y,'xg','MarkerSize',20,'LineWidth',2); hold off; % get region from seed point J = regiongrowing(I,y,x,reg_maxdist); % plot region subplot(122); imshow(J); ,其中包含以下内容:

unidecode