我正在努力完成标题所说的内容,在Delphi 2007中将表情符号插入字符串中,就像下面的例子一样:
procedure TForm1.Button1Click(Sender: TObject);
var s : string;
begin
s := 'This is my original string (y)';
s := ansireplacestr(s,'(y)','');
showmessage(s);
end;
我甚至可以将表情符号粘贴到IDE的代码中,但在运行时showmessage结果如下:
这是我原来的字符串????
有没有办法在Delphi 2007中实现这个任务?由于几个原因,我现在无法升级Delphi。
有人说我的问题在这个主题上得到了解决:
Handling a Unicode String in Delphi Versions <= 2007
但是这个主题只是说使用第三方组件,而没有确切知道如何去做。
编辑:建议后,我尝试使用函数pos,delete和insert以及一个宽带var:
function addEmoji(mystring : widestring) : widestring;
var r, aux : widestring;
p : integer;
begin
r := mystring;
while pos('(y)',r) > 0 do
begin
aux := r;
p := pos('(y)',aux);
Insert('',aux,p);
delete(aux,pos('(y)',aux),3);
r := aux;
end;
result := r;
end;
但结果是'(y)'被'????'取代。
答案 0 :(得分:7)
在Delphi 2007中,默认的string
类型为AnsiString
。 Emojis需要Unicode处理,因为它们使用的高Unicode代码点在大多数常用的Ansi编码中都不适合/存在。因此,您需要使用Unicode UTF编码(UTF-7,-8,-16或-32)。
您可以将AnsiString
用于UTF-7 1 ,或UTF8String
2 用于UTF-8或WideString
对于UTF-32,UTF-16或UCS4String
3 。
1 :UTF-7是一种7位ASCII兼容编码。
2 :UTF8String
确实存在于Delphi 2007中(它是在Delphi 6中引入的),但它不是 true UTF-8字符串类型,它只是AnsiString
的别名,期望它始终包含UTF-8编码数据。您必须使用UTF8Encode()
和UTF8Decode()
来确保通过UTF-16正确转换为其他编码。在Delphi 2009(UTF8String
和UTF8Encode()
也被弃用)之前,UTF8Decode()
未成为 true UTF-8字符串类型。
3 :UCS4String
自Delphi 6以来也存在,但它根本不是真正的字符串类型(即使在现代的Delphi版本中)。它只是array of UCS4Char
的别名。
RTL没有对UTF-7的任何本机支持(但手动实现并不困难),并且对UTF-32的支持很少(仅为了促进UTF-16之间的转换&lt; - &gt; ; UTF-32),因此您应该在代码中坚持使用UTF-8或UTF-16。
如果您将UTF数据转换为Ansi,则会丢失表情符号数据,例如,如果您将WideString
传递给ShowMessage()
。您可以将WideString
传递给Win32 API MessageBoxW()
函数,但您不会有任何数据丢失,但根据对话框使用的字体,表情符号可能会出现也可能无法正确显示(但它至少不会出现??
。
但是,Delphi 2007中的本机RTL根本不支持您尝试的内容,至少不支持UTF-16。您必须找到基于WideString
的第三方功能,或者使用RTL的Pos()
,Delete()
和Insert()
内在函数编写您自己的函数,其中WideString
数据超载,例如:
function WideReplaceStr(const S, FromText, ToText: WideString): WideString;
var
I: Integer;
begin
Result := S;
repeat
I := Pos(FromText, Result);
if I = 0 then Break;
Delete(Result, I, Length(FromText));
Insert(ToText, Result, I);
until False;
end;
var
s : WideString;
begin
s := 'This is my original string (y)';
s := WideReplaceStr(s, '(y)', '');
MessageBoxW(0, PWideChar(s), '', MB_OK);
end;
然而,使用UTF-8,你可以使用原生RTL完成同样的事情,但你仍然无法使用ShowMessage()
(嗯,你可以,但它不会显示非-ASCII字符正确):
var
s : UTF8String;
begin
s := UTF8Encode('This is my original string (y)');
s := AnsiReplaceStr(s, '(y)', UTF8Encode(''));
MessageBoxW(0, PWideChar(UTF8Decode(s)), '', MB_OK);
end;
无论哪种方式,请确保您的代码编辑器设置为以{1}}文件保存为UTF-8,否则您无法使用文字.pas
,您必须使用更多内容喜欢这样:
''
然后你可以这样做:
var
Emoji: WideString;
SetLength(Emoji, 2);
Emoji[1] := WideChar($D83D);
Emoji[2] := WideChar($DC4D);
或者:
var s: WideString;
...
s := WideReplaceStr(s, '(y)', Emoji);