这是一个纯粹的编程问题。我有一系列的话。这些词在他们之后有不同的长度(大多数为零)暂停。每个单词也都有一定的分数。我想从先行窗口中选择最佳单词范围。
Nota bene,这是在JavaScript中,所以我买不起支持向量机等。 :-)对于表现想法,它可能会在2分钟长度(250字左右)的窗口上每分钟计算一次。
对于那些感兴趣的人来说,第二个好处是:这是为手动转录(主动学习)选择自动语音识别生成的单词范围。
你会怎么做?
答案 0 :(得分:0)
夜晚的睡眠为这个问题带来了光明。实际上需要很少的魔法。由于候选跨度的数量非常有限(在最坏的情况下窗口中单词数量的平方 - 250 ^ 2),我可以简单地评估每个跨度的适合度并选择具有最佳分数的那个。
嗯,为什么我昨天没看到这个?