Memory Networks
Memory Networks
Weston J, Chopra S, Bordes A. Memory networks[J]. arXiv preprint arXiv:1410.3916, 2014.
传统的机器学习模型都没有记忆模块,像RNN这样的模型虽然有一定的记忆能力,但是长期记忆能力仍然很弱
Memory networks首次提出了具有记忆模块的模型
该模型的记忆模块
模型由
- I:input feature map,将输入转换为内部特征表示,记为
- G:generalization,根据新的输入更新
,即 - O:output feature map,根据
和当前输入产生输出的特征表示 - R:response,将output feature转换为期望的输出形式
显然这样的模型难以端到端训练
End-to-End Memory networks
这篇论文对Memory Network进行了End-to-End拓展
以QA为例,设记忆模块中存储了知识集合
模型首先通过模块
之后模型通过模块
最终输出通过同时处理
整个模型其实可以看做具有显式记忆存储的attention
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.