在python对象中用数字替换字母

时间:2019-10-02 13:35:56

标签: python python-3.x string pandas

我试图在Pandas DataFrame中用数字替换python对象的所有字母。

示例:我有一列3000个课程代码,例如。 A0101P。我正在尝试将课程代码中的所有字母替换为相应的数字(A = 1,B = 2等),因此输出看起来像这样的“ 1010116”(最重要的是,它是一个整数,而不是对象/字符串) )

该课程代码最初是一个python对象。所以我用过

course.to_string()

将其更改为字符串值。

然后,我创建了一个映射,然后使用str.replace替换了值。

mapping = {"A": 1, "B": 2, "C": 3, "D": 4, "E": 5, "F": 6, "G": 7, "H": 8, "I": 9, "J": 10, "K": 11, "L": 12, "M": 13, "N": 14, "O": 15, "P": 16, "Q":17,"R":18, "S": 19, "T": 20,"U": 21, "V": 22, "W": 23, "X": 24, "Y": 25, "Z":26}

courseDone = course.str.replace(course["Cursus code"], mapping)

它引发错误

AttributeError: 'str' object has no attribute 'str'

我也尝试过

for key, value in mapping.items():
    course = course.replace(key, value)

并引发错误

TypeError: replace() argument 2 must be str, not int

即使数据类型是字符串。

示例数据:

1       A0101P
2       A0111P
3       A0200P
4       A0201P
5       A0202P

所需的输出:

1       1010116
2       1011116
3       1020016
4       1020116
5       1020216

我也尝试过使用str()更改数据类型,并且结束错误是相同的。

当我使用

for key, value in mapping.items():
    course["Cursus code"] = course["Cursus code"].replace(key, value)

我没有收到任何错误,但是输出保持不变。

我是python的新手,我已尽力找到解决方案,但似乎无济于事。 有人可以帮我吗?

4 个答案:

答案 0 :(得分:1)

字符串在大熊猫中保留为“对象”。您可以使用数据框的info()方法查看哪些列是整数,对象(用于字符串),时间戳等,例如:

const all = reduce(and, true)

对于您的问题,您可以使用apply方法并将字符串替换为所需的映射,如下所示:

df.info()

答案 1 :(得分:1)

一个愚蠢的解决方案是用一个字母替换一个字母,类似于您的字母,但是必须将数字映射到字符串:

for k,v in mapping.items():
    v = str(v)
    course["Cursus code"] = course["Cursus code"].str.replace(k,v)

输出:

0    1010116
1    1011116
2    1020016
3    1020116
4    1020216

答案 2 :(得分:0)

您还可以使用map来用dict替换值,这很干净。 那么关于字符串问题,是因为您没有分配结果吗?

like: course = course.to_string() courseDone = course.str.replace(course["Cursus code"], mapping)

courseDone = course.to_string().str.replace(course["Cursus code"], mapping)

答案 3 :(得分:0)

以下示例类似于您当前的结构。但是有很多方法可以做到这一点。根据需要展开映射。还要注意,遍历字典的方式在Python 2/3中是不同的。注意,键和值都是字典中的字符串。

string_to_change = 'abc123'
mapping_dict = dict(zip(['a','b','c'],['1','2','3']))
for k, v in mapping_dict.iteritems():
    string_to_change = string_to_change.replace(k,v)
'''