ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

《机器翻译 统计建模与深度学习方法》 __肖桐 学习第六天 【机器翻译基础】

2020-08-11 20:31:40  阅读:240  来源: 互联网

标签:__ 概率 语言 平滑 建模 机器翻译 生成 肖桐 模型


1、建模

  语言模型的目的是描述文字序列出现的规律,这个对问题建模的过程被称作是语言建模;

  

 

   n-gram只和它前面的n-1个词相关,根据这n-1生成第n个词;

  

 

   n-gram在分词、文本生成、信息检索、摘要等NLP任务中都有着举足轻重的地位,包括与训练模型本质上也是统计语言模型;

  强调:统计语言模型为解决NLP问题提供了非常好的思路,即:将整个序列生成的问题转化为逐个生成单词的问题;

2、未登录词

  未出现在过语料中的词。为解决未登录词引起的零概率问题,通常对模型进行平滑处理,即给出可能情况一个非零的概率。“劫富济贫”,即从高概率的部分分配一部分到概率,从而达到平滑的目的。

  平滑算法:

  (1)加法平滑方法:即给词出现的次数加上一个固定数;优点:简单;

  (2)古德-图灵估计法:(没学会)

  (3)Kneser-Ney平滑方法:(没学会)

 

标签:__,概率,语言,平滑,建模,机器翻译,生成,肖桐,模型
来源: https://www.cnblogs.com/xiaonezhaya/p/13480157.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有