NLP学习笔记

Transformer神经机器翻译

正在初始化搜索引擎

NLP-Learning-Notes

NLP学习笔记

NLP-Learning-Notes

前言
How to Research
How to Research
学术论文技巧
学术论文技巧
- 学术论文分类
- 学术论文写作
  学术论文写作
  - Cover Letter
  - Revising
自然语言处理
自然语言处理
统计机器学习
统计机器学习
深度学习算法
深度学习算法
- BERT
- LSTM
- RNNs
- CNN
- Transformer
知识图谱技术
知识图谱技术
机器翻译
机器翻译
- 机器翻译概述
- 非自回归模型机器翻译
- RNN神经机器翻译
- CNN神经机器翻译
- Transformer神经机器翻译 Transformer神经机器翻译
  目录
  - 1 Transformer和机器翻译
  - 参考
- 无监督机器翻译
- 多语言机器翻译
- 多模态机器翻译
- 篇章机器翻译
- 领域自适应
- 知识图谱增强的机器翻译
- BPE编码
- 机器翻译预训练模型
立场检测研究
立场检测研究
- 立场检测笔记
- 数据集
  数据集
  - NLPCC2016-Task4
经验笔记
经验笔记
- PyTorch安装
- Fairseq框架

目录

1 Transformer和机器翻译
参考

Transformer神经机器翻译

1 Transformer和机器翻译

2017年，Vaswani等人提出了完全基于注意力机制的Transformer模型，该模型创新性地使用了自注意力机制来对序列进行编码，其编码器和解码器均由注意力模块和前向神经网络构成。
Transformer模型具有高度并行化的模型结构，因此在训练速度上远超循环神经网络，且在翻译质量上也有大幅提升。
Transformer已成为神经机器翻译研究中的主流模型。

NAT

参考

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.

最后更新: January 18, 2023

回到页面顶部

上一页 CNN神经机器翻译

下一页无监督机器翻译

Copyright © 2022-present WU,Junchao

Made with Material for MkDocs