Question

我想删除＆＃39; OLD_DATA＆＃39;列中的前四个字母包含以下数据 - （删除＆＃34;：＆＃34;前面的所有数据）并保留剩余数据。

-----------------------                 ----------------------- 
     OLD_DATA (before)                        NEW_DATA(after)
----------------------                  ----------------------
abc:cdef-12E456-AB                          cdef-12E456-AB
cdef-12E456-AB-12E456-AB                    cdef-12E456-AB
bcd:ghij-12E456-BS                          ghij-12E456-BS
abc:cdef-12E456-AB                          cdef-12E456-AB
cdef-12E456-AB                              cdef-12E456-AB
ghij-12E456-BS                              ghij-12E456-BS
bcd:ghij-12E456-BS                          ghij-12E456-BS
cdef-12E456-AB                              cdef-12E456-AB
abc:cdef-12E456-AB                          cdef-12E456-AB
abc:cdef-12E456-AB                          cdef-12E456-AB
-------------------------               -------------------------

我写了以下代码：REGEXP_EXTRACT（TABLE。OLD_DATA，r＆＃39;（\ w *）：＆＃39;）作为NEW_DATA：正如预期的那样将前三个字母分隔成单独的列但不删除实际数据。

此代码：REGEXP_EXTRACT（TABLE。OLD_DATA，r＆＃39;：（\ w *）＆＃39;）为NEW_DATA 在＆＃34;：＆＃34;之间分隔值首先＆＃34; - ＆＃34; ....这是5到10个字母。

任何建议......

Answer 1

#standardSQL
SELECT REGEXP_REPLACE(old_data, r'^\w*:', '') as new_data
FROM table

Answer 2

嗯。想到这一点：

select regexp_replace(data, '^...:', '')

请注意，这会回答您的问题，但它不会产生所需的输出，因为两者不同步。

REGEXP bigquery

2 个答案: