我有这样的结构;用于创建熊猫数据框:
my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas"],
'age' : [20,27, 35, 55, 18, 21, 35],
'designation': ["VP", "CEO", "CFO", "VP", "VP", "CEO", "MD"]}
我通过df = pd.DataFrame(my_dict)
创建一个数据框;到目前为止一切都很好。
现在,我想创建此CSV的变体,比如说更改名称或年龄;或者可能有一些变体,例如还包括薪水。
我确实通过创建全新的字典来解决问题,然后直接将它们导出为CSV,但是我想使用pandas数据框,因此我可以从CSV文件中读取数据,在数据框中进行更改,然后将其导出为已加载的csv。因为我可以创建并以CSV格式导出字典,所以我在浪费时间做熊猫吗?
编辑: 例如,我想更改年龄和名称,就像原始词典中一样。因此,我想提取这2列中的每个值,并用新值替换它们(例如,我已经有2个具有新名称的列表,两个列表都具有与原始字典相同的元素数)
newname = ["Mike", "Frank", "Andrew", "Marge", "Alphonse","Roy", "Albert"]
newage = [22,32,34,43,21,55,66]
另一个变体可能是在添加或替换列及其数据时,例如,如果我想用designation
替换salary
列;我将传递带有该字段的新字段以及相关数据的新字典,如下所示:
newfield = {"Salary": [22, 32, 21, 14, 55, 34, 66]}