正在加载图片...
位置前馈网络 Dense 将输入(批量大小,序列长度,特征集大小) Transformer Add Nomm Position- 重新整形为(批量*序列长度,特征集大小) wise FFN Add &Norm ·用两层MLP ·转换为3-D形态 。 等于应用两(1,1)个卷积层 Embedding D2L.ai 位置前馈网络 • 将输入(批量大小,序列长度,特征集大小) 重新整形为(批量*序列长度,特征集大小) • 用两层 MLP • 转换为 3-D 形态 • 等于应用两(1,1)个卷积层
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有