特别是,我希望能够提取人物,地点,电影,音乐等实体,并在广泛使用的链接数据ID(如DBpedia,Freebase或OpenCyc)中提供实体。
答案 0 :(得分:2)
Extractiv是一项类似的服务,它将80legs的网络抓取工具与Language Computer Corporation(LCC)的自然语言处理功能相结合。此服务目前提供超过150种实体类型,例如您列出的实体类型,以及links them到DBpedia。
虽然尚未将Extractiv部署为Web服务,但LCC的CiceroLite命名实体标记器同时支持中文和日文。这可以作为独立应用程序购买。另一个这样的公司是Basis Technology,虽然我不知道这些实体是联系在一起的。