我的问题无法理解将句子视为字符序列而不是单词的好处。
答案 0 :(得分:2)
如果需要,您可以这样做:
str = "this is string example....wow!!!"
print (str.split( ))
输出:
['this', 'is', 'string', 'example....wow!!!']
来自https://www.tutorialspoint.com/python3/string_split.htm
例如,当您需要检查输入中的拳头字符时
答案 1 :(得分:0)
在Python中没有称为word
的数据类型,甚至没有character
,我们只有字符串数据类型:https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str
字符是从C语言派生的,它是一种在C中占1个字节空间的数据类型:Why char is of 1 byte in C language
但是,仍然可以将字符串视为这样的字符列表。
In [3]: s = 'hello world'
In [4]: list(s)
Out[4]: ['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']
单词实际上不是编程语言的结构,而是英语之类的口语,但是您可以像这样用string.split
从字符串中提取单词
In [5]: s = 'hello world i am john'
In [6]: s.split()
Out[6]: ['hello', 'world', 'i', 'am', 'john']
在这里我们知道列表中的所有单词都是可识别的,但是如果字符串是s = 'photospork', it can be split as
[照片,猪肉] or
[照片,猪肉] , but Python as a language cannot identify it easily, unless we use a NLP library like NLTK for it! But we can idenfity individual characters easy which are
['p ','h','o','t','o','s','p','o','r','k']`,因此将字符串视为一个单词的顺序,而不是字符!