我假装使用Tensorflow(Python)来实现一个小系统,它必须从给定的文本(1-20个单词)返回语言。
我知道Multilayer Perceptron适用于分类问题,我认为这是一个很好的网络拓扑结构。
我将不得不决定每层中有多少层和多少个节点,但我不知道我的网络应该如何输入鬃毛。
有人可以帮我解决这类问题的网络输入吗?
答案 0 :(得分:1)
您不清楚输入的含义。
但是在这个问题中,输入是您要分类的文本。因此,给定一些文本“我想将其归类为英语”,您可以使用char n-gram编码,例如
if n = 2, ==> 'I ', ' w', 'wa', 'an' etc.
然后,您必须使用n-gram字典将这些n-gram映射到索引。这会将文本矢量化为例如
{1 : 'I ', 2: 'En', ... }
您可以使用sklearn的库spacy来帮助构建它 或者你可以自己编写代码。
“我想把它归类为英语”可能会映射到索引的载体
[1, 17, 45, 7, 9, 10, 5, 4, ...]
然后可以作为嵌入层的输入,然后可以将其输入到MLP。