正在加载图片...
位置编码 ·假设嵌入Ⅹ∈Rxd输出的形状(序列长度 Transformer ,嵌入维度) State ·创建P∈Rxd P,2j=sin(i/100002j/a) P,2j+1=c0s(i/100002ja) ·输出X+P D2L.ai 位置编码 • 假设嵌入 𝑋 ∈ ℝ 𝑙×𝑑 输出的形状(序列长度 ,嵌入维度) • 创建 𝑃 ∈ ℝ 𝑙×𝑑 • 输出 X + P 𝑃𝑖,2𝑗 = sin(𝑖/100002𝑗/𝑑 ) 𝑃𝑖,2𝑗+1 = cos(𝑖/100002𝑗𝑑)
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有