Transformer-StubbornHuang Blog

Transformer原理

转载自Transformer原理，如侵联删 Transformer由论文Attention is All You Need提出，本文大部分内容来源于Transformer模型详解（图解最完整版），对于不理解的地方，我会加上个人注解。 1 Attention简介 1.1 Attention注意力机制 …

StubbornHuang
Transformer
2024-03-20
558
3

理解Transformer

本文来自于知乎：为什么我还是无法理解Transformer的高赞回答要理解和熟悉一个新的技术/新模型，比较好的方式是通过以下框架结构来熟悉：为什么：一个新模型的诞生，一般是解决了现有的模型不能解决的一些问题。因此需了解该技术提出的背景和创新点。是什么：熟悉这个模型的内容和架构、训练过程等。 …

StubbornHuang
Transformer
2024-03-12
494
0

Transformer的结构

以下内容摘自：https://transformers.run/back/transformer/，里面”原始结构“部分的内容对我自己理解Transformer结构有很大的帮助。 1 Transformer的结构 1.1 注意力层 Transformer 模型的标志就是采用了注意力层 (Attent…

StubbornHuang
Transformer
2024-03-11
468
0

Seq2Seq模型和Attention机制

转载自：Seq2Seq模型和Attention机制，如侵联删 pdf: NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE 1 RNN的多种结构首先从RNN的结构说起，根据输出和输入序列不同数量RNN可以有多种…

StubbornHuang
Transformer
2024-03-08
552
0

Attention和Self-Attention的区别

1 Attention和Self-Attention的区别 Attention：以Encoder-Decoder框架为例，输入Source和输出Target内容是不一样的，比如对于英-中机器翻译来说，Source是英文句子，Target是对应的翻译出的中文句子，Attention发生在Target的…

StubbornHuang
Transformer
2024-03-08
979
0

Transformer – 理解Transformer必看系列之，2 Positional Encoding位置编码与Transformer编码解码过程

转载自：链接：https://www.ylkz.life/deeplearning/p10770524/ 作者：空字符少量行文修改 1 引言经过此系列上一篇文章Transformer - 理解Transformer必看系列之，1 Self-Attention自注意力机制与多头注意力原理的介绍，…

StubbornHuang
Transformer
2022-08-02
3,079
1

Transformer – 理解Transformer必看系列之，1 Self-Attention自注意力机制与多头注意力原理

转载自：链接：https://www.ylkz.life/deeplearning/p10553832/ 作者：空字符修改文章少量行文 1 引言今天要和大家介绍的一篇论文是谷歌2017年所发表的一篇论文，名字叫做Attention is all you need，当然，网上已经有了大量的关于这…

StubbornHuang
Transformer
2022-08-01
1,767
0

深度学习 – 以一个极简单的中英文翻译Demo彻底理解Transformer

转载自：原文链接：https://zhuanlan.zhihu.com/p/360343417 作者：Algernon 少量行文修改。 Transformer并没有特别复杂，但是理解Transformer对于初学者不是件容易的事，原因因在于Transformer的解读往往没有配套的简单的demo，…

StubbornHuang
Transformer
2022-07-29
2,639
0

深度学习 – 从矩阵运算的角度理解Transformer中的self-attention自注意力机制

转载自https://zhuanlan.zhihu.com/p/410776234 之前我对Transformer中的Self-Attention的机制也是看了很多遍论文，看了很多博文的解读，直到看到了这篇博文，让我醍醐灌顶，打通了任督二脉，果然将复杂问题讲复杂每个人都会，但是从基础的角度将复杂问题…

StubbornHuang
Transformer
2022-07-20
3,764
0

深度学习 – Transformer详解

转载自：链接：https://wmathor.com/index.php/archives/1438/ 作者：wmathor Transformer 是谷歌大脑在2017年底发表的论文Attention Is All You Need中所提出的 seq2seq 模型。现在已经取得了大范围的应用和扩…

StubbornHuang
Transformer
2022-07-16
2,025
0

深度学习 – Transformer详细注释

译自： https://nlp.seas.harvard.edu/2018/04/03/attention.html http://nlp.seas.harvard.edu/annotated-transformer/ 在过去的五年里，Transformer一直被很多多关注。本篇文章以逐行实现并详细…

StubbornHuang
Transformer
2022-07-15
1,402
0

深度学习 – 图解Transformer，小白也能看懂的Transformer处理过程

译自：https://jinglescode.github.io/2020/05/27/illustrated-guide-transformer/ 1 前言 Transformer是encoder-decoder架构的进一步演变，其在论文Attention is All You Need中提出。虽…

StubbornHuang
Transformer
2022-06-29
2,478
0

联系我

资助我们