我正在尝试使用Google表格从Instagram字幕中提取文本(我之前使用Zapier来提取字幕)。我很难理解正则表达式的外观/外观。
这是文本的一部分:
??? ??? ???? ???? ??????? ??? ?????? ??????????? ?? ??? ????? ?????? ????????? ?? ??? ???????????? ?? ?????❓
-----
?????????: Species distribution is influenced by light availability. The deeper, the darker. Species depending on light, for instance, photosynthetic organisms, only inhabit the top 200 m. In the darker water, organisms found ways to adapt like this viperfish in the video. Do you know how?! Find out on the blog on the featured article.
⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀
-----
我想捕捉在“ OceanFact:”之后和不可见空间之前的内容(在下一个分隔符-----之前有一个不可见空间)。如果看不见的空格不起作用,我还可以插入一个特殊的词来表示字符串的结尾。
您将如何编码?我在正则表达式编辑器中尝试了很多东西,但无法捕捉到我想要的东西。
我以为(?![OceanFact]+\:\s+)\w(?!⠀)
可以解决这个问题,但不确定是最好的(括号中包含不可见的字符)。
它在此editor中部分起作用,但不适用于Google Spreadsheet。我无法在“ OceanFact:
”和“⠀”不可见字符之间使用空格和标点符号。
不知道我在哪里失败。
有任何线索吗?