我有一个由8列整数组成的数据文件(ordered_data.txt),最后一列是一个字符串。它长2912行。我输入的数据如下:
data = np.genfromtxt(('ordered_data.txt'), invalid_raise = False)
这显然将最后一列转换为所有'nan'。这对于运行我的代码来说很好,因为我只需要整数就可以了。我的代码的输出基本上是采用原始文本文件并根据某些参数将其拆分为两个不同的文件。问题是,现在我创建的两个新文件都有'nan'作为第9列,当我需要原始字符串仍然存在时。
我曾尝试输入这样的数据:
data = np.genfromtxt(('ordered_data.csv'), invalid_raise = False, delimiter = ',',
dtype = [('Glong', float), ('Glat', float), ('Rgal', float),
('Radius', float), ('Velocity', float),
('Second Velocity', (str,10)),
('Distance', float), ('Distance_Error', float),
('Name', (str,16))])
这产生了以下输出:
(0.279081,-0.481935,0.392097,60.0,20.0,'18 .5; 12.6',0.0,0.0,'G000.284-00.478')
第6列在技术上也应该是一个字符串,但是现在可以忽略它,它并不重要。这与我认为的第9列完全相同。
现在,我现在将整行划分为一列,而不是有9列值,而最后一个是字符串。
我尝试使用vstack,hstack和连接列表重新组织数据,但我相信应该有一个简单的解决方案,而且我使它变得比它需要的更难。我需要一双新的眼睛告诉我我的错误是什么,因为我已经太过介入了。如果有人能告诉我如何制作一个可用的数组或字符串和整数列表,我将永远感激不尽!