在我的文本文件中,我有以下格式的几行输入
Arun 3 4.0 Text
其中Text可以是由空格分隔的多个单词的字符串。
我想把它读到MATLAB中,这样我得到一个4xn矩阵,其中Arun,3,4.0,Text应该是结果矩阵中每个条目的四个字段。
我尝试使用fscanf
,但fscanf
假设不同的术语是空格分隔的。
所以在上面的例子中,如果Text说“Hello World”,那么fscanf
会返回5个项目
[Arun, 3, 4.0, Hello, World]
但我想要的是
[Arun, 3, 4.0, Hello World]
那么,我如何在Hadoop中实现这一目标?
答案 0 :(得分:3)
尝试使用文本扫描功能(http://www.mathworks.com/help/matlab/ref/textscan.html):
C = textscan(fileID, '%s %d %f %[^\n]')