为什么python为什么将句子视为字符而不是单词的序列?

时间:2019-05-02 05:36:29

标签: python python-3.x string

我的问题无法理解将句子视为字符序列而不是单词的好处。

2 个答案:

答案 0 :(得分:2)

如果需要,您可以这样做:

str = "this is string example....wow!!!"
print (str.split( ))

输出:

['this', 'is', 'string', 'example....wow!!!']

来自https://www.tutorialspoint.com/python3/string_split.htm

例如,当您需要检查输入中的拳头字符时

答案 1 :(得分:0)

在Python中没有称为word的数据类型,甚至没有character,我们只有字符串数据类型:https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str

字符是从C语言派生的,它是一种在C中占1个字节空间的数据类型:Why char is of 1 byte in C language

但是,仍然可以将字符串视为这样的字符列表。

In [3]: s = 'hello world'                                                                                
In [4]: list(s)                                                                                          
Out[4]: ['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']

单词实际上不是编程语言的结构,而是英语之类的口语,但是您可以像这样用string.split从字符串中提取单词

In [5]: s = 'hello world i am john'                                                                      

In [6]: s.split()                                                                                        
Out[6]: ['hello', 'world', 'i', 'am', 'john']

在这里我们知道列表中的所有单词都是可识别的,但是如果字符串是s = 'photospork', it can be split as [照片,猪肉] or [照片,猪肉] , but Python as a language cannot identify it easily, unless we use a NLP library like NLTK for it! But we can idenfity individual characters easy which are ['p ','h','o','t','o','s','p','o','r','k']`,因此将字符串视为一个单词的顺序,而不是字符!