数据准备使用正则表达式识别字符串并移至新列

时间:2016-11-11 20:18:48

标签: regex talend

您好我正在使用Talend准备产品数据以导入数据库。我想使用Talend的提取字符串部分功能。

我在一个单元格中有以下数据。 (数据长度不是固定宽度格式)

  

测量:环头宽度:6.8环高度:5.5环柄宽度:1.1女士带宽:2.5女士带柄宽度:1.2

我需要帮助创建正则表达式格式以匹配每个测量值并将其提取到新列。

什么是正则表达式以匹配以下文本?

  

环头宽度:6.8

并提取其后面的数值,即

  

6.8

同样,我想为所有上述测量创建正则表达式。我假设格式是一样的。

感谢您的时间和帮助。

1 个答案:

答案 0 :(得分:0)

如果您不打算使用多个操作来实现此结果,我建议您使用:

  • “:”
  • 中的“部分拆分文字”操作
  • 然后使用“删除空格”来获得干净的值。

如果你真的需要保留一个动作,你就可以在正则表达式上删除基于java Pattern的“删除部分文本”动作。

使用正则表达式“。*:\ s ”工作正常