Mysql使用SUBSTRING从LONG_TEXT中提取URL

时间:2013-09-30 10:37:31

标签: mysql facebook substring html-content-extraction locate

我的网页的HTML内容位于MySQL的 LONG_TEXT 列中。

我的目标使用 MySQL 中的LOCATESUBSTRINGSUBSTRING_INDEX函数提取我的Facebook页面的网址

我发现这篇文章Mysql query to extract domains from urls,但它并不适合这个问题。

如何使用mysql有效地提取字符串中'href="http://www.facebook.com/''"'之间的字符串?

1 个答案:

答案 0 :(得分:1)

此解决方案有效,但肯定可以改进

IF(LOCATE('http://www.facebook.com/', html_cache) > 0, CONCAT('http://www.facebook.com/', SUBSTRING_INDEX((SUBSTRING_INDEX(html_cache, 'http://www.facebook.com/', -1)), '"', 1)), html_cache) AS page_url