Skip to content

Transformer 架构详解

🚧 本文档正在编写中,敬请期待...

概述

本文将深入讲解 Self-Attention、位置编码、多头注意力等核心机制。


如果你希望贡献此文档,欢迎提交 PR!

Released under the MIT License.