使用Pandas DataFrame在CSV中修改数据

时间:2019-07-14 22:10:43

标签: python pandas csv

我有这样的结构;用于创建熊猫数据框:

my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas"],
                   'age' : [20,27, 35, 55, 18, 21, 35],
                   'designation': ["VP", "CEO", "CFO", "VP", "VP", "CEO", "MD"]}

我通过df = pd.DataFrame(my_dict)创建一个数据框;到目前为止一切都很好。

现在,我想创建此CSV的变体,比如说更改名称或年龄;或者可能有一些变体,例如还包括薪水。

我确实通过创建全新的字典来解决问题,然后直接将它们导出为CSV,但是我想使用pandas数据框,因此我可以从CSV文件中读取数据,在数据框中进行更改,然后将其导出为已加载的csv。因为我可以创建并以CSV格式导出字典,所以我在浪费时间做熊猫吗?

编辑: 例如,我想更改年龄和名称,就像原始词典中一样。因此,我想提取这2列中的每个值,并用新值替换它们(例如,我已经有2个具有新名称的列表,两个列表都具有与原始字典相同的元素数)

newname = ["Mike", "Frank", "Andrew", "Marge", "Alphonse","Roy", "Albert"]
newage = [22,32,34,43,21,55,66]

另一个变体可能是在添加或替换列及其数据时,例如,如果我想用designation替换salary列;我将传递带有该字段的新字段以及相关数据的新字典,如下所示:

newfield = {"Salary": [22, 32, 21, 14, 55, 34, 66]}

1 个答案:

答案 0 :(得分:1)

如果只想对初始数据集进行一些修改/变体,则可以使用pandas使其保存为另一个csv文件(或附加到原始csv文件中)。但是正如其他人提到的那样,我们可能需要更详细地了解您想要完成什么。

1将字典转换成数据框,然后将其另存为csv文件: enter image description here

2更改数据框并另存为其他csv enter image description here

在您其中一个方差中的3个更改列中包括新的薪水并删除指定。

您还可以自动执行更多操作,并在每次运行文件时根据需要创建任意数量的变体。我们只需要更详细地了解您想要完成什么。

enter image description here