跳转至

机器翻译概述

1 什么是机器翻译?

机器翻译是指通过计算机将源语言句子翻译到与之语义等价的目标语言句子的过程,是自然语言处理领域的一个重要研究方向

2 机器翻译的大事件

  • 1949年,Warren Weaver在《翻译》中提出了使用机器进行翻译的思想,自此引发了该方向的研究热潮。
  • 2013年,Kalchbrenner和Blunsom提出利用神经网络进行机器翻译,随后一两年内,Sutskever、Cho、Bahdanau等人提出了基于编码器 — 解码结构的神经机器翻译模型,标志着机器翻译进入深度学习的时代。
  • 2016年,Junczys Dowmunt等人在30多个语言对上对神经机器翻译和统计机器翻译进行对比,神经机器翻译在27个任务上超过了基于短语的统计机器翻译,这展现了神经机器翻译的强大能力。
  • 2016年,Wu等人公布了谷歌的神经机器翻译模型,该模型通过在层之间引入残差连接解决了深度模型梯度消失的问题,将模型层数堆叠到了8层,使机器翻译的水平提升到了一个新的台阶。随后,facebook的Gehring等人提出了基于卷积神经网络的编码器—解码器模型,在准确度上超越了谷歌的模型,并大幅提升了翻译速度。
  • 2017年,Vaswani等人提出了基于注意力机制的Transformrr模型,在模型的训练速度和翻译质量上都取得了大幅提升 。
  • 2018年,Hassan等人将多种算法结合,并在翻译评价中引入人工评测,首次宣布模型在新闻领域的翻译上达到了人类水平。

3 机器翻译面临的研究现状和问题

  • 神经机器翻译模型存在训练和测试时行为不一致的问题,该问题被称为“曝光偏差”,引发了研究者的广泛关注;
  • 在同声传译的场景下,为了降低翻译的延迟,模型需要在输入语句不完整的情况下输出译文,使用户能低延迟地收到高质量的翻译结果;
  • 除文本外,有时也存在图像、视频等其他模态的数据可供翻译模型使用,翻译系统可以融入这些信息以进一步地提高翻译质量;
  • 为了提升翻译速度,非自回归模型对翻译概率独立建模,因此能够并行解码出整句译文,但也会出现严重的漏译、过译现象;
  • 在对篇章文本进行翻译时,为了保证译文的一致性,模型在翻译时也需同时考虑上下文的信息;
  • 存在低资源的领域内数据和高资源的领域外数据时,为了提升模型在领域内的翻译质量,需要对领域外数据也进行合理利用;
  • 当需要在多个语言之间进行翻译时,训练多语言翻译模型可以大幅减少所需的翻译模型数目,同时提升低资源语言的翻译质量。

最后更新: January 18, 2023
回到页面顶部