概览

1D-CNN 就像是有很多的扫描器同时扫过一个单词一样,扫描的时候他就是一个个字符去扫描。这些个扫描器可以同时聚焦在好几个字符串。当这些扫描器扫描完之后,他们从这些扫描过得字符串上抽取信息。在所有的扫描之后,这些从不同扫描器上拿到的信息,就变成了每个单词的表示。

启发

使用 1D-CNN 的动机是,不仅仅一整个单词是有含义的,每个字符都是有一定的含义的。

比如说,如果我们知道 "underestimate" 这个单词的时候,你同样也能够明白 "misunderestimate",虽然后面的这个单词并不是一个真正的单词。这是为什么呢?

这是因为,从你之前的英语知识中,你会知道 "mis-" 经常表示的意思是 "mistaken",这些知识就是你能够推断出 "misunderestimate" 大概是 "mistakenly underestimate" 这样的意思。

1D-CNN

1D-CNN 这种算法就是模拟人类理解这种字符级的能力;**更广义上来说,1D-CNN 是一种能够从比较长的序列中,抽取较短语义片段的算法。**这些输入的序列可以是音乐、DNA、语音录音、网络日志等等。在BiDAF中,长的序列代表了很多单词,短的片段表示这些字符组合起来的片段。

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/1cce5014-2826-4511-b980-30142dd27ba5/Untitled.png