SSIS术语提取非英语文本

时间:2011-03-10 15:41:52

标签: sql-server-2008 data-mining ssis

我开始使用SQL Server学习数据挖掘,我很好奇SQL Server Integration Services能够从英文文本中执行术语提取。但是我有兴趣从非英语文本执行文本挖掘,基本上来自乌克兰语。所以这些是非常的问题:

  1. 有没有办法在SSIS中使用非英文文本实现术语提取?如果是,那么任何合适的资源将被赞赏:)
  2. 如果第一个问题的答案是肯定的,我想知道是否已经有一些针对非英语文本的自定义解决方案。
  3. 提前致谢:)

1 个答案:

答案 0 :(得分:0)

术语提取转换仅支持英语的文档states,并且没有提及添加其他语言的机制。

因此,我认为您需要找到某种可以使用乌克兰文本进行术语提取的工具,并找出如何将其集成到SSIS中。找到这样的工具实际上不是SSIS问题,它是一个普通的NLP或语言学问题,所以你可以在另一个论坛得到更好的答案。