应用错误收集

Microsoft自然语言列表：是否相当于“无语言”或“原始unicode”或“语言中立”？

时间：2018-04-24 14:04:22

标签： sql-server nlp full-text-search tokenize

Microsoft自然语言列表中是否存在等同于“非语言”或“原始”的内容，这会导致分词（即标记化）算法仅使用空格作为分隔符？< / p>

编辑：或者有没有办法告诉微软的技术只有在附加到词汇时才将句号用作标记分隔符？

特定问题（对我们而言）是SQL Server中的全文搜索在对文本进行标记时使用句点作为分隔符。但是我们的文本包含有意义的“非词汇”字符串，如JC7D.14GR.2345DG，我们希望在不搜索每个块(JC7D and 14GR and 2345DG)或(JC7D NEAR 14GR NEAR 2345DG)的情况下进行搜索，因为单独的块方法可能会产生错误当这些值出现在彼此非常接近的列表中时为正数。

0 个答案:

没有答案

相关问题

有一个很好的自然语言处理库

是否有自然语言Web应用程序框架？

是否有JSTL EL（表达式语言）等同于<c：url> </c：url>

QT是否等同于Microsoft Blend或Adobe工具？

在gcc中是否有一个等同于__cxa_demangle的Microsoft VC ++？

为什么没有向左指向的unicode“箭头指向右然后向上弯曲”？

在Go中是否有与wcwidth（）函数相同的功能？

R语言是否有等效的doEvents（）

Microsoft自然语言列表：是否相当于“无语言”或“原始unicode”或“语言中立”？

Microsoft Edge中是否有与window.clipboardData等效的文件？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？