导入带有R中列标题间距的.txt文件

时间:2017-06-22 06:08:13

标签: r

company name    person  Salary Of Person
ITC     Jacob   10000
TCS     Ash 20000
Google      Jim 40000
GS      Mark    50000

由于"公司名称和#34;之间的间距,R认可"公司"作为单独的列和"名称"作为单独的列。我该怎么编码才能解决这个问题。 PS:这只是我文件的一小部分。

1 个答案:

答案 0 :(得分:0)

解决问题的最佳方法是修复源数据,以便引用列名。然后你可以使用以下内容阅读:

import wx
class MyForm(wx.Frame):
    def __init__(self):
        wx.Frame.__init__(self, None, wx.ID_ANY, "Molecules")
        panel = wx.Panel(self, wx.ID_ANY)
        self.index = 0
        self.list_ctrl = wx.ListCtrl(panel, size=(-1,100),
                         style=wx.LC_REPORT
                         )
        self.list_ctrl.InsertColumn(0, 'Number')
        self.list_ctrl.InsertColumn(1, 'Element')
        self.list_ctrl.InsertColumn(2, 'Make up')

        btn = wx.Button(panel, label="Add data")
        btn.Bind(wx.EVT_BUTTON, self.add_lines)
        btn2 = wx.Button(panel, label="Append data")
        btn2.Bind(wx.EVT_BUTTON, self.app_lines)
        sizer = wx.BoxSizer(wx.VERTICAL)
        sizer.Add(self.list_ctrl, 0, wx.ALL|wx.EXPAND, 5)
        sizer.Add(btn, 0, wx.ALL|wx.CENTER, 5)
        sizer.Add(btn2, 0, wx.ALL|wx.CENTER, 5)
        panel.SetSizer(sizer)

    def add_lines(self, event):
        data = [[7, 'GLUCOSE', 'C6H1206'],[8,'SUCROSE', 'C12H22O11']]
        index = 0
        for j in data:
            self.list_ctrl.InsertStringItem(index, str(j[0]))
            self.list_ctrl.SetStringItem(index, 1, j[1])
            self.list_ctrl.SetStringItem(index, 2, j[2])
            index += 1
    def app_lines(self, event):
        data = [[7, 'GLUCOSE', 'C6H1206'],[8,'SUCROSE', 'C12H22O11']]
        for j in data:
            self.list_ctrl.Append((j[0],j[1],j[2]))

if __name__ == "__main__":
    app = wx.App(False)
    frame = MyForm()
    frame.Show()
    app.MainLoop()

要快速解决方法,您可以尝试在没有标题的情况下阅读CSV文件:

read.csv(file, header = TRUE, sep = "", quote = "\"")

然后您可以通过以下方式手动分配列名称:

df <- read.csv(file, header = FALSE, sep = "", quote = "\"")

此变通方法假设您的其余数据表现良好,即您在其他任何位置都不会有多个条目。如果你这样做,那么你唯一的选择就是引用/逃避一切。