执行失败:不正确的字符串值:'\ xD6sterl ...'与mariadb和perl DBD

时间:2019-06-19 02:04:42

标签: perl utf-8 mariadb utf8mb4 dbd

我是perl的新手程序员,试图使用DBI将包含带有变音符和其他非ASCII字符的电子邮件的文本缓冲区写入joomla数据库,并且有问题。

DBD::mysql::st execute failed: Incorrect string value: '\xD6sterl...' for column `lsv5webstage`.`xuxgc_content`.`fulltext` at row 1 at /home/alerts/scripts_linstage/AdvisoryTest.pm line 373.

我对编码的工作方式还不太熟悉,无法完全理解问题所在。这是一个具有mariadb-10.3.12和joomla-3.9的fedora29系统。

显然,“ \ xD6”是一个带有“塞巴斯蒂安·斯特隆德”变音符号的O。我读到一些有关utf8无法处理4个字符的信息,但我不完全了解。

我在网上找到了以下参考资料,内容涉及将编码类型从utf8更改为utf8mb4,但是所有表格似乎都已经在使用该编码:

> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR 
Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name            | Value              |
+--------------------------+--------------------+
| character_set_client     | utf8mb4            |
| character_set_connection | utf8mb4            |
| character_set_database   | utf8mb4            |
| character_set_filesystem | binary             |
| character_set_results    | utf8mb4            |
| character_set_server     | utf8mb4            |
| character_set_system     | utf8               |
| collation_connection     | utf8mb4_unicode_ci |
| collation_database       | utf8mb4_unicode_ci |
| collation_server         | utf8mb4_unicode_ci |
+--------------------------+--------------------+

我不确定是否有帮助,但这是我在perl代码中使用的insert语句:

    my $sql                 = <<EOF;
    INSERT INTO xuxgc_content (title, alias, introtext, `fulltext`, state, catid, created, created_by, created_by_alias, modified, modified_by, checked_out, checked_out_time, publish_up, publish_down, images, urls, attribs, version, ordering, metakey, metadesc, metadata, access, hits, language)
    VALUES ($title, "$title_alias", $introText, $fullText, $state, $catid, $created, $created_by, $created_by_alias, $modified, $modified_by, $checked_out, $checked_out_time, $publish_up, $publish_down, $images, $urls, $attribs, $version, $ordering, $metakey, $metadesc, $metadata, $access, $hits, $language);
    EOF

    my $sth = $dbh->prepare($sql);
    $sth->execute();
    db_disconnect($dbh);

$ fullText变量是从包含电子邮件正文的缓冲区中填充的。我在执行INSERT之前通过quote()运行它。

$fullText       = $dbh->quote($fullText);

我还尝试使用“ SET NAMES utf8mb4; INSERT INTO Mytable ...;”只是不喜欢这种格式。

以下是用于连接数据库的完整功能:

sub db_connect () {
  my %DB        = (
    'host'  => 'myhost',
    'db'    => 'mydb',
    'user'  => 'myuser',
    'pass'  => 'mypass',
  );

  return DBI->connect("DBI:mysql:database=$DB{'db'};host=$DB{'host'}", $DB{'user'}, $DB{'pass'}, { mysql_enable_utf8mb4 => 1 });
 }

我不记得以前有这个问题,并且此脚本已经使用了一段时间。

1 个答案:

答案 0 :(得分:1)

best1D6(以及其他几个数字)中Ö的十六进制。

您已经声明您的客户端使用CHARACTER SET latin1(utf8mb4)编码,因此它会吐唾沫。

请提供UTF-8,以查看SELECT HEX(col), col ...是否进入数据库(因此出现插入问题)或其他问题(可能是获取/显示问题)。

此外,您还没有引用D6字符串,因此很可能会遇到各种语法错误。

请不要盲目地将字符串放入$fulltext语句中,而在放入它们时将其转义。

其中可能有一些有用的Perl提示:

INSERT

并寻找绑定/引用/转义的技术。