我目前正在研究自动报告生成案例研究,其中的任务是使用CNN-LSTM注意模型预测给定图像的文本。 有两个文件夹即 1)NLMCXR_png包含图片和 2)NLMCXR_reports包含文本,即发现和印象。 我们的任务是预测每个图像的发现和印象。
我正在研究colab,给出的数据为.xml格式。我以.csv格式修改了相同的数据,然后以pandas数据框进行了修改。现在,数据框具有四列图像1,图像2,结果和印象。图像1和图像2是同一患者的两个不同视图。我们要为图像1和图像2生成结果和印象。
由于数据框已经具有文本格式的图像信息,并且原始的.png图像存在于NLMCXR_png中,所以我不知道该如何开始。因为我是深度学习的新手,所以实际上我需要逐步的过程以及代码参考,这是我的第一个案例研究。有人请帮忙.. !!