En Transformer, score de atención para Q = (1, 1) , K = (3, 4) es Q * K / \sqrt 2