标签: pytorch tensor
在将第二和第三维中具有 4 个维度 [4, 5, 129, 24] 的张量 A 填充到 [4, 6, 136, 24],我如何生成它的“注意力掩码”?
我想出了两个解决方案:
有什么方法可以在填充后更有效地生成注意力掩码?有API吗?
非常感谢。
答案 0 :(得分:0)
您可以尝试使用 Hugging Face 中的 Transformers 库,它提供了一个非常有用的 tokenizer。
我建议您阅读整个快速入门,但原则上,this is the part 您感兴趣。