ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Transformer XL源码实现

2021-11-14 17:33:17  阅读:183  来源: 互联网

标签:Transformer XL Language 源码 Model 调试


1,人工智能中最重要的公式之一MLE数学本质剖析及代码实战

2,Language Model的数学原理、Chain Rule剖析及Sparsity问题

3,Markov Assumption:first order、second order、third order剖析

4,Language Model:unigram及其问题剖析、bigram及依赖顺序、n-gram

5,使用Unigram训练一个Language Model剖析及实践

6,使用Bigram训练一个Language Model剖析及实践

7,使用N-gram训练一个Language Model剖析及实践

8,拼写纠错案例实战:基于简化后的Naive Bayes的纠错算法详解及源码实现

9,使用基于Average Log Likelihood的PPL(Perplexity)来评估Language Model

10,Laplace Smoothing剖析及基于PPL挑选最优化K的具体方法分析

11,Interpolation Smoothing实现解析:加权平均不同的N-gram概率

12,Good-Turning Smoothing算法解析

13,Vallina Transformer language model处理长文本架构解析

14, Vallina Transformer Training Losses:Multiple Postions Loss、Intermediate Layer Losses、Multiple Targets Losses

15,Vallina Transformer的三大核心问题:Segment上下文断裂、位置难以区分、预测效率低下

16,Transformer XL:Attentive Language Models Beyond a Fixed-Length Context

17,Segment-level Recurrence with State Reuse数学原理及实现分析

18,Relative Positional Encoding算法解析

19,Transformer XL 中降低矩阵运算复杂度的Trick解析

20,缓存机制在语言模型中的使用思考

21,Transformer XL之数据预处理完整源码实现及调试

22,Transformer XL之MemoryTransformerLM完整源码实现及调试

23,Transformer XL之PartialLearnableMultiHeadAttention源码实现及调试

24,Transformer XL之PartialLearnableDecoderLayer源码实现及调试

25,Transformer XL之AdaptiveEmbedding源码实现及调试

26,Transformer XL之相对位置编码PositionalEncoding源码实现及调试

27,Transformer XL之Adaptive Softmax解析及源码完整实现

28,Transformer XL之Training完整源码实现及调试

29,Transformer XL之Memory更新、读取、维护揭秘

30,Transformer XL之Unit单元测试

31,Transformer XL案例调试及可视化

标签:Transformer,XL,Language,源码,Model,调试
来源: https://blog.csdn.net/chu227/article/details/121320359

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有