如何在Matlab中检索PostgreSQL列名并导入到struct数据

时间:2017-01-26 12:38:28

标签: java c matlab postgresql struct

我正在做一个关于在Matlab上查询PostgreSQL的关系数据的项目。我已经按照这个例子连接了Matlab和PostgreSQL。

% Add jar file to classpath (ensure it is present in your current dir)
javaclasspath('postgresql-9.0-801.jdbc4.jar');

% Username and password you chose when installing postgres
props=java.util.Properties;
props.setProperty('user', '<your_postgres_username>');
props.setProperty('password', '<your_postgres_password>');

% Create the database connection (port 5432 is the default postgres chooses
% on installation)
driver=org.postgresql.Driver;
url = 'jdbc:postgresql://<yourhost>:<yourport>/<yourdb>';
conn=driver.connect(url, props);

% A test query
sql='select * from <table>'; % Gets all records
ps=conn.prepareStatement(sql);
rs=ps.executeQuery();

% Read the results into an array of result structs
count=0;
result=struct;
while rs.next()
    count=count+1;
    result(count).var1=char(rs.getString(2));
    result(count).var2=char(rs.getString(3));
    ...
end

我可以使用ResultSetMetaData

从PgResultSet中获取列名
rsmd = rs.getMetaData();
columnsNumber = rsmd.getColumnCount();
name1 = rsmd.getColumnName(1);
name2 = rsmd.getColumnName(2);

但我无法将其设置为查询结果

while rs.next()
    count=count+1;
    result(count).var1=char(rs.getString(2));
    result(count).var2=char(rs.getString(3));
    ...
end

var1和var2显示为struct data结果中列的名称,当我分配变量name1和name2时,它仍然显示“name1”和“name2”替换为“var1”和“var2”在struct结果而不是我在变量name1和name2中设置的PostgreSQL的列名。

先谢谢你了!

1 个答案:

答案 0 :(得分:4)

您的代码有什么问题,只需要稍微修复一下即可。更正后的代码如下:

while rs.next()
    count=count+1;
    result(count).(name1)=char(rs.getString(2));
    result(count).(name2)=char(rs.getString(3));
    ...
end

问题出在动态字段引用中,即当您通过字符串变量中的名称引用某个字段时,这由符号.()完成。有关动态字段引用的更多详细信息,请参阅Loren Shure在博客“Loren on the Matlab”上的“使用动态字段引用”一文。

但是我想要注意的是,据我所知,使用JDBC作为PostgreSQL的连接器只适用于这种情况 当你必须导入/导出只有标量类型(标量数字,逻辑,字符串,时间戳等)的相当有限的数据量时。如果你必须处理更复杂的类型(例如数组)或者数据量相当大(大约1Gb),JDBC就不再有效(在某些情况下几乎不可能使用)。恕我直言,对于这种情况,有一种更有效和方便的方法来解决你的问题(检索列名和以Matlab结构的形式导入数据)。也就是说,您可以将PgMex用于这些目的。您的代码可以通过这种方式进行转换(我们假设下面标有<>符号的所有参数都已正确填充,相应的表存在于相应的数据库中):

% Create the database connection
dbConn=com.allied.pgmex.pgmexec('connect',[...
    'host=<yourhost> dbname=<yourdb> port=<yourport> '...
    'user=<your_postgres_username> password=<your_postgres_password>']);

% A test query
sql='select * from <table>'; % Gets all records
pgResult=com.allied.pgmex.pgmexec('exec',dbConn,sql); % Perform this test query

要获取列名,您需要执行以下代码:

nFields=com.allied.pgmex.pgmexec('nFields',pgResult);
fieldNameCVec=cell(nFields,1);
for iField=1:nFields
    fieldNameCVec{iField}=com.allied.pgmex.pgmexec('fName',pgResult,iField-1);
end

最后,要将这些结果放在一个结构中,您需要执行以下操作:

% Read the results
outCVec=cell(nFields,1);
fieldSpecStr='%<field_type_1> %<field_type_2> ...';
inpCVec=num2cell(0:nFields-1);
[outCVec{:}]=com.allied.pgmex.pgmexec('getf',pgResult,...
    fieldSpecStr,inpCVec{:});
% Get only values ignoring NULLs (if NULLS are not to be ignored, the code
% should be improved by taking into accout not only valueVec, but
% also isNullVec and isValueNull being indicators of NULLs)
fieldValCVec=cellfun(@(SFieldValInfo)SFieldValInfo.valueVec,...
    outCVec,'UniformOutput',false);
SResult=struct(transpose([fieldNameCVec(:) fieldValCVec(:)]));

该命令的输入和输出参数的格式有何关系 getf(包括fieldSpecStr)请参阅PgMex网站上的文档。 应该注意,检索所有元组的字段值 一次调用命令(而不是你在自己的代码中使用的循环) 它完成得非常快(大约3.5倍 通过Matlab数据库工具箱完成更快而不是相同的操作 通过直接JDBC连接工作,如最后提到的那样 "Performance comparison of PostgreSQL connectors in Matlab" article)。 并且您不需要以某种方式转换这些值,所有这些都是以Matlab友好和本机方式完成的(以矩阵的形式, 多维数组,结构和任意其他Matlab格式)。

每个特定字段的所有值都由上面的代码放入 SResult结构的相应字段简单地作为具有沿第一维度的大小与元组的数量一致的数组 检索。如果您希望在单独的元组中获得每个单独元组的结果 结构,您可以使用以下代码:

fieldValCVec=cellfun(@(valueVec)num2cell(valueVec,[2 ndims(valueVec)]),...
    fieldValCVec,'UniformOutput',false);
tupleFieldValCMat=transpose(horzcat(fieldValCVec{:}));
SResultCVec=cellfun(@(tupleFieldValCVec)struct(...
    transpose([fieldNameCVec(:) tupleFieldValCVec(:)])),...
    num2cell(tupleFieldValCMat,1),'UniformOutput',false);
SResultVec=vertcat(SResultCVec{:});

编辑:PgMex的学术许可是免费的。