我正在尝试从数据框中获取特定的列,但是由于Python如何处理字符串,我无法这样做。我的问题是Python会在逗号前自动删除空格。例如,我要获取的列是“侵袭性肺炎球菌病,年龄LT 5†,可能”,但Python会将其处理为“侵袭性肺炎球菌病,年龄LT 5†,可能”,以致于我无法访问给定的列。由于其他复杂性,我不能简单地更改列名。有没有一种方法可以强制Python将String保留为原样而不删除该空格?
输入:
df["Invasive Pneumococcal Disease, Age LT 5† , Probable"]
输出:
'Invasive Pneumococcal Disease, Age LT 5†, Probable'
答案 0 :(得分:0)
我刚刚发现我可以使用replace()
>>>sample = "Invasive Pneumococcal Disease, Age LT 5† , Probable"
>>>sample = sample.replace('†', '† ')
答案 1 :(得分:0)
(([^\x00-\x7F]|\w)+),将找到所有Unicode和ASCII词。
逻辑是,找到所有用文字替换掉第一个捕获的组后,找到所有具有文字空白Oracle_home
,后跟逗号,然后再是文字空白\s
的ASCII / Unicode单词。逗号后跟一个空格。
The regex用于查找以上内容。
代码如下:
\s