无法从斯坦福NER服务器收到完整的回复

时间:2016-03-09 10:40:31

标签: python sockets stanford-nlp named-entity-recognition

我需要从Python中的数千篇维基百科文章中提取命名实体。我为此设置了一个Stanford NER服务器,并使用Pyner模块中的SocketNER与服务器进行通信。如果文章不太长,一切都很好。但如果它们太长,响应就会碎片化,PyNER中的实现只接受第一个数据包(单个socket.recv调用)。我试图修改代码以接收更多数据包,但我无法确定哪个数据包是最后一个。我想我应该在每个接收到的数据包的末尾查找换行符,但显然换行符的出现频率比最后一个数据包的末尾更多。

我也尝试过HttpNER,但是当文本很长时它也会失败。

如何从NER服务器检索完整的回复?

0 个答案:

没有答案