给出以下数据:
provider_name, feature A, feature B, feature C..., Label
provider_A , 0.5 , 0.3 , 0.8 , 1
provider_A , 0.5 , 0.2 , 0.1 , 1
...
provider_B , 0.9 , 0.8 , 0.1 , 0
provider_B , 0.5 , 0.3 , 1.8 , 0
...
我想构建一个Attention神经网络,该神经网络将整体处理每个提供者数据,然后预测其标签。
请注意,数据为每个提供商仅提供一个标签。
我已阅读this article,描述了注意的好处,并希望使用 Keras 来实现它。
很高兴听到您对网络体系结构的想法,并可能会获得一些代码参考。
谢谢:)
修改
由于每个提供者的批次大小都不同,如何每次都以正确的批次大小训练模型?