确定srt文件中视频中讨论的概念

时间:2019-04-27 11:19:12

标签: python machine-learning keras nlp nltk

情况

  • 您与其他谈论同一主题的人下载了YouTube视频。
  • 您下载了每个视频的srt文件(一个包含自动转录的文件)

您如何确定哪个视频包含新的concepts?在哪里?

concepts是指用单词描述的想法,而不是单词本身,即

  

用户x使用了单词y 1次,因此是新的

太容易了。关于

  

与其他所有srt文件相比,用户x使用了不寻常的句子/单词星座,因此它是一个新的   timestamp

中的概念

请记住,转录是自动完成的,因此其中包含错误,但YouTube仍然做得很好。

0 个答案:

没有答案