论文阅读笔记 (LS导致隐式长度惩罚) 通过数学推导在理论上说明训练时采用标签平滑会隐式地导致beam search解码机器翻译任务时存在长度惩罚,使得解码倾向于给出较短的结果,且理论上,标签平滑的模型会使得解码的长度存在与输入无关的常数上界。作者在实验中也发现了上述现象,并提出了修正方法。 2022-08-24 论文笔记 > 解码方法 #NLP #解码方法
Hello World Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Quick 2022-08-23 #Genesis