Matlab:如何读取带有许多分隔符的.txt文件

时间:2017-03-09 16:53:17

标签: matlab floating-point

这是我在stackoverflow上的第一个问题。我在使用textread使用 Matlab 读取.txt文件时遇到问题。 .txt,真的很乱,结构如下。

 "ALMEMO";"BEREICH:";"L420";"DIGI";"DIGI";"DIGI";"DIGI";;;;;;;"DIGI";"DIGI";"DIGI";"DIGI";;;;;;;"DIGI";"DIGI";"DIGI";"DIGI";;;;;;;"DIGI";"DIGI";"DIGI";"DIGI";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;"CoCo";"CoCo";"CoCo";"CoCo";"CuCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";;;;;;;;;;;"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo";"CoCo"
"5690-2";"KOMMENTAR:";"";"T,t       ";"T,t       ";"Temperatur";"T,t       ";;;;;;;"RH,Uw     ";"RH,Uw     ";"Feuchte   ";"RH,Uw     ";;;;;;;"DT,td      ";"DT,td     ";"Taupunkt  ";"DT,td     ";;;;;;;"MH,r g/kg ";"MH,r g/kg ";"Mischung  ";"MH,r g/kg ";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;"";"";"";"";"";"";"";"";"";"";;;;;;;;;;;"";"";"";"";"";"";"";"";"";""
"SD3.10";"GW-MAX:";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
"ALMEMO.001";"GW-MIN:";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
"DATUM:";"ZEIT:";"M00: ms";"M01: øC";"M02: øC";"M03: øC";"M04: øC";;;;;;;"M11: %H";"M12: %H";"M13: %H";"M14: %H";;;;;;;"M21: øC";"M22: øC";"M23: øC";"M24: øC";;;;;;;"M31: gk";"M32: gk";"M33: gk";"M34: gk";;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;"M70: øC";"M71: øC";"M72: øC";"M73: øC";"M74: øC";"M75: øC";"M76: øC";"M77: øC";"M78: øC";"M79: øC";;;;;;;;;;;"M90: øC";"M91: øC";"M92: øC";"M93: øC";"M94: øC";"M95: øC";"M96: øC";"M97: øC";"M98: øC";"M99: øC"
07.03.21;11:29:24;0,;22,91;23,15;23,68;22,75;;;;;;;38,3;74,1;70,;38,8;;;;;;;8,;18,3;17,8;8,1;;;;;;;6,6;13,2;12,8;6,6;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-
;11:30:24;0,;22,9;23,14;23,69;22,82;;;;;;;38,4;72,6;71,9;38,5;;;;;;;8,;18,;18,3;8,;;;;;;;6,6;12,9;13,2;6,6;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-
;11:31:24;0,;22,94;23,14;23,68;22,88;;;;;;;38,3;75,4;71,5;38,5;;;;;;;8,;18,6;18,2;8,1;;;;;;;6,6;13,4;13,1;6,6;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-
;11:32:24;0,;23,;23,13;23,68;22,95;;;;;;;38,2;73,;72,3;38,5;;;;;;;8,;18,1;18,4;8,1;;;;;;;6,6;13,;13,3;6,7;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-;;;;;;;;;;;-;-;-;-;-;-;-;-;-;-

六行标题后跟实际数据,用';'分隔并使用逗号而不是点格式化浮点数。我需要的数据不是由整行代表,而是仅由前九个元素(日期,小时,9个浮点数)表示。

我编写的用于阅读文件的代码,有点天真,看着其他代码,如下:

[date1, hour1, V0, Temp1, Temp2, Temp3, Temp4, RH1, RH2, RH3, RH4] = textread('file.txt', '%c %c %f %f %f %f %f %c* %c* %c* %c* %c* %c* %f %f %f %f', 'headerlines', 7, 'delimiter', ';');

显然它不起作用。我认为应该在我的代码版本中跳过标题,因此,总结一下,仍然存在以下问题:

  • 如何将多个分隔符视为一个? (或者忽略它们,正如我在我的代码中所做的那样)
  • 如何在标题后面的第一行显示的日期出现在整个代码中? (我想我可以用一个for循环填充输出矩阵的第一列)
  • 如何剪切文本文件的行,忽略第九个浮点数后面的所有内容? - 我如何读取昏迷分离的浮点数? (我试着用记事本“替换”功能将它们转换成点,这在我的情况下是一个有效的解决方案,但仍然无法解决问题)

提前感谢所有愿意回答的人,保重 朱塞佩

1 个答案:

答案 0 :(得分:0)

您可以利用textscan的内置参数来正确处理标题行并解析出多个分隔符。然后使用strrep处理用逗号替换点的逗号。最后,您可以将字符串的单元格数组转换为str2double的数字数组。

fid  = fopen('foo.txt');
C    = textscan(fid, repmat('%s',1,9), 'Headerlines', 6, 'Delimiter', ';', 'MultipleDelimitersAsOne', 1);
col1 = str2double( strrep(C{1}, ',', '.') );

完成任务的非常迂回的方式,但文本处理并不是matlab的强项。