文本分段数据集

时间:2015-03-27 17:05:24

标签: dataset text-segmentation

我想知道是否有人可以帮助我获取数据集来测试我开发并想要测试的文本分割方法。

我找了Freddy Choi的数据集,我找不到它。我特意需要这个数据集。

如果有人拥有它或知道我可以获得它,请提供建议。

如果有人对同一任务的其他数据集有建议,请提供建议。

由于

2 个答案:

答案 0 :(得分:2)

Freddy Choi似乎已经消失,但我已经将他的源代码和数据导入了一些GitHub存储库:

答案 1 :(得分:1)

我找到了。这有些棘手,但我找到了。 此链接包含Choi的软件和数据集。 我在web.archive.org找到了Choi的页面

http://web.archive.org/web/20040810103924/http://www.cs.man.ac.uk/~mary/choif/software.html