应用错误收集

我正在尝试实现和复制纸上的联邦Bert结果 Federated pretraining and fine-tuning of BERT using clinical notes from multiple silos。

我更喜欢使用TensorFlow Bert预训练代码。

为了以联合方式进行培训，最初，我将数据集分为3个不同的筒仓（使用mim-3数据，每个筒仓包含50名患者的出院摘要）。然后使用TensorFlow对每个数据集的Bert模型进行预训练从Bert正式发布开始实施Bert预培训。

现在我有三种不同的模型，它们是从不同的数据集中进行预训练的。对于模型聚合，我需要取所有三个模型的平均值。由于每个筒仓中的笔记数量相等，因此为了求平均，我需要对所有模型求和并除以三。 如何像本文中那样获取平均模型？，请给我一些见解，以正确地对此进行编码。平均模型权重的想法来自论文FEDERATED LEARNING: STRATEGIES FOR IMPROVING COMMUNICATION EFFICIENCY 。

我对deep learning很陌生和TensorFlow 。所以有人请帮助我找出问题并为TensorFlow建议一些阅读材料

在本文中，提到在共享临床数据时克服隐私和监管问题是一个不错的选择。我的问题是

是否可以从此model.ckpt文件中获取敏感数据？那又如何？

任何帮助将不胜感激。谢谢...

张量流模型保存和模型平均计算

1 个答案: