我想拍摄一个视频,并根据视频中发生的话题标记部分视频。 假设我的语料库中的主题数是3 [汽车,自行车,飞机]。现在,我想标记视频的不同部分(假设视频是关于运输历史的,上面讨论了所有主题,但是由于时间长短不一,在最初的10分钟内讨论示例汽车,在接下来的25分钟内讨论飞机等) )
我的方法是这样的:
1. Get many articles just about each topic [cars, bikes , planes]
2. Run a word level RNN or LSTM and tag each sentence according to the topics above.(Many to one model)
3. But the problem I am facing is, I can do this on sentences ie. predict what topic the sentence belongs to . But I want the RNN to clam together multiple sentences into a group or topic. ( example. like first 5 sentences are about cars, next 20 sentences are about planes etc)
有很多方法可以用实体,词性等标记句子中的每个单词。但是我认为这种方法在这种情况下行不通吗?
在pytorch中执行此操作的最佳方法是什么?