在 Transformer 中, Q = (1, 1) 、 K = (3, 4) 的注意力得分是 Q * K / \sqrt 2 。