第16章这些不是很简单吗？（1/2）

好书推荐：

林枫当然知道，自己正在改变世界。

甚至于一开始林枫也有点激动。

不过很快林枫也就恢复平常心了。

因为较真地讲，从林枫重生的的时候，人的大脑并不会对每个单词都投入相同的注意力，某些词或句子对理解整个文章的意义更为关键。‘注意力机制’的核心思想就是类似的，它让网络学会‘关注’输入信息中的重要部分，而不是每个部分都平等对待。”

马库斯眉头微蹙，似懂非懂。

林枫也没有催促，姑且留待马库斯思考。

过了一会，马库斯若有所得，但依然还是有困惑，马库斯问道：“这跟我们现在使用的网络结构有什么本质区别呢？毕竟网络权重也是在调整不同的输入节点，按理说它也能‘选择性地关注’重要的信息。”

林枫点了点头，继续解释道：“是的，当前的网络权重确实会根据数据自动调整，但问题在于它们的调整方式太过机械。

网络层层堆叠后，很容易出现‘信息稀释’的现象，尤其是在处理长序列数据时，早期输入的信息可能会在网络的深层逐渐被削弱，甚至丢失。而‘注意力机制’则不同，它会在每一步都重新评估所有输入的影响力，并动态调整每个输入的权重，保证关键的信息不会因为层数的增加而被遗忘。”

马库斯若有所思地反复琢磨着林枫的话：“动态调整……你的意思是说像是一个随时监控并修正网络学习方向的系统？”

“可以这么理解，”林枫笑了笑，“尤其是在处理自然语言时，你会发现信息的相关性是动态变化的。句子开头的某个词，可能会对后面一句话的解释至关重要，甚至决定整段话的含义。

这个时候我们就需要引入注意力机制了，如果没有这种‘注意力机制’，网络可能很难处理这种长距离依赖。”

“长距离依赖……”

马库斯嘴里嘟囔着，心中反复琢磨。

良久，眼中闪过一丝明悟。

在人工智能的自然语言处理中的确有这种问题，网络在处理长文本时常常会因为距离太远而丢失关键信息。这也是为什么传统的rnn和lst虽然能解决一部分问题，但它们的记忆能力仍然有限，尤其在处理长文本或复杂句子时，模型的性能往往不尽如人意。

本章未完，点击下一页继续阅读。

第16章 这些不是很简单吗？（1/2）