我在mysql上有一个保存为LONGTEXT
的列。此文本保存了丰富的文本。我正在阅读所有文本,然后使用javascript修复它以获取第一个100
字符,以便不在中间分割单词。
然而,这种做法似乎并不是最好的方法。我想直接使用查询选择摘要,但我还要注意不要包含html标签的字符。
以下功能似乎可以正常剥离html。
SET GLOBAL log_bin_trust_function_creators=1;
DROP FUNCTION IF EXISTS fnStripTags;
DELIMITER |
CREATE FUNCTION fnStripTags( Dirty varchar(4000) )
RETURNS varchar(4000)
DETERMINISTIC
BEGIN
DECLARE iStart, iEnd, iLength int;
WHILE Locate( '<', Dirty ) > 0 And Locate( '>', Dirty, Locate( '<', Dirty )) > 0 DO
BEGIN
SET iStart = Locate( '<', Dirty ), iEnd = Locate( '>', Dirty, Locate('<', Dirty ));
SET iLength = ( iEnd - iStart) + 1;
IF iLength > 0 THEN
BEGIN
SET Dirty = Insert( Dirty, iStart, iLength, '');
END;
END IF;
END;
END WHILE;
RETURN Dirty;
END;
|
DELIMITER ;
答案 0 :(得分:0)
解决方案的一部分是选择文本剥离使用
这是mysql函数,如php函数strip_tags
DROP FUNCTION IF EXISTS htmlStrip;
CREATE FUNCTION htmlStrip(pmXml longtext)RETURNS longtext
DETERMINISTIC
htmlStrip:
BEGIN
DECLARE vStart INTEGER ;
DECLARE vEnd INTEGER ;
DECLARE vResult LONGTEXT;
DECLARE vCount1 INTEGER;
DECLARE vCount2 INTEGER;
SET vResult:=pmXml;
SET vCount1:=LENGTH(vResult)-LENGTH(REPLACE(vResult,'<',''));
SET vCount2:=LENGTH(vResult)-LENGTH(REPLACE(vResult,'>',''));
IF vCount1<>vCount2 THEN
RETURN 'Input Error';
END IF;
WHILE (LOCATE('<',vResult) OR LOCATE('>',vResult)) DO
SET vStart:=LOCATE('<',vResult);
SET vEnd:=LOCATE('>',vResult);
SET vResult:=REPLACE(vResult,SUBSTRING(vResult,vStart,vEnd-vStart+1),'');
END WHILE;
RETURN vResult;
END;
SELECT htmlStrip('<html>hello<body> how r u?</body></html>') AS Result
Result
--------
hello how r u?
因此您需要使用substring + strip_tags