在 Transformer(注意力机制)中,得分 = Q * K / \sqrt d 。对 Q = (1, 2), K = (3, 4), d = 2 ,计算。