导入CSV到MySQL数据库-如何读取波兰语字符的文件?

时间:2019-07-11 08:14:40

标签: c# mysql .net csv polish

我有一个csv文件,它也具有波兰字符。内容在这里:

ID_WORKER;FNAME;LNAME;WORKERS_GROUP;POSITION;
1;Paweł;ĄąĆćĘꣳŃńÓ󌜏źŻż;IT;IT Specialist;
6;Dawid;ĄąĆćĘꣳŃńÓ󌜏źŻż;Technologists;Technologists;
8;Maciej;ĄąĆćĘꣳŃńÓ󌜏źŻż;Storekeepers;Storekeeper;

如您所见,这些字符具有“ĄąĆćĘꣳŃńÓ󌜏źŻż”之类的字符。然后,我用以下代码导入csv文件:

private DataTable ImportFile()
{
    DataTable imported_data = new DataTable();

    OpenFileDialog ofd = new OpenFileDialog();
    ofd.Title = "Open csv file";
    ofd.DefaultExt = "*.csv";
    ofd.Filter = "Documents (*.csv)|*.csv";
    ofd.ShowDialog();

    FileInfo fi = new FileInfo(ofd.FileName);
    string FileName1 = ofd.FileName;
    string excel = fi.FullName;

    using(StreamReader sr = new StreamReader(excel, Encoding.Default))
    {
        string header = sr.ReadLine();
        if (string.IsNullOrEmpty(header))
        {
            MessageBox.Show("Not found or loaded not correct file.");
            return null;
        }

        string[] header_columns = header.Split(',');
        foreach(string header_column in header_columns)
        {
            imported_data.Columns.Add(header);
        }

        while (!sr.EndOfStream)
        {
            string line = sr.ReadLine();

            if (string.IsNullOrEmpty(linia)) continue;

            string[] fields = line.Split(',');
            DataRow imported_row = imported_data.NewRow();

            for (int i = 0; i < fields.Count(); i++)
            {
                imported_row[i] = fields[i];
            }

            imported_data.Rows.Add(imported_row);
        }
    }
    return imported_data;
}

当我使用下面的代码将包含所有内容的导入数据从csv文件插入到数据库时:

private void save_modules(DataTable imported_data)
{
    string connection = "datasource=localhost;port=3306;username=root;password=";
    using (MySqlConnection conn = new MySqlConnection(connection))
    {
        conn.Open();
        foreach (DataRow importRow in imported_data.Rows)
        {
            string query = @"INSERT IGNORE INTO try1.workers (ID_WORKER, FNAME, LNAME,
            WORKERS_GROUP, POSITION) VALUES (@ID_WORKER, @FNAME, @LNAME,
            @WORKERS_GROUP, @POSITION);";

            MySqlCommand cmd = new MySqlCommand(query, conn);

            cmd.Parameters.AddWithValue("@ID_WORKER", importRow["ID_WORKER"]);
            cmd.Parameters.AddWithValue("@FNAME", importRow["FNAME"]);
            cmd.Parameters.AddWithValue("@LNAME", importRow["LNAME"]);
            cmd.Parameters.AddWithValue("@WORKERS_GROUP", importRow["WORKERS_GROUP"]);
            cmd.Parameters.AddWithValue("@POSITION", importRow["POSITION"]);

            cmd.ExecuteNonQuery();
        }
        conn.Close();
    }  
    MessageBox.Show("Imported to database");
}

我在mysql数据库的“ LNAME”列中看到的不是所有波兰语字符:“ Aa Cc Ee Ll NnÓóSs Zz Zz”。这还不够好。

我尝试了什么?

我尝试用其他编码格式导入csv文件:

1)编码。默认-然后如本例所示,它显示为:“ Aa Cc Ee Ll NnÓóSs Zz Zz”。

2)Encoding.ASCII-然后显示所有“?”字符

3)Encoding.UTF8-但显示所有“?”字符。

4)Encoding.GetEncoding(1252)-并没有太大帮助。

至于mysql数据库,我已经设置了utf8_polish_ci比较字幕的方法。

现在,我该如何使用波兰字符导入csv。也许需要更改导入csv文件代码的第一部分中的代码行:

using(StreamReader sr = new StreamReader(excel, Encoding.Default)) 

有什么想法吗?

编辑

我使用 phpmyadmin 4.8.4 ,并且mysql数据库版本为 10.1.37-MariaDB

2 个答案:

答案 0 :(得分:1)

您至少要检查四件事:

  • Encoding.Default是否正确加载字符?使用Visual Studio调试器并检查linefields变量的值。
    • 可能的修复:将文件另存为UTF-8并使用Encoding.UTF8
  • 您的数据库可以存储这些字符吗?使用MySQL Workbench执行INSERT INTO try1.workers(LNAME) VALUES('ĄąĆćĘꣳŃńÓ󌜏źŻż'); SELECT * FROM try1.workers;(根据需要添加其他列)。
    • 可能的修复:将列类型声明为utf8mb4_unicode520_ci
  • cmd.ExecuteNonQuery是否正在将Unicode发送到数据库?插入值后使用MySQL Workbench从表中选择值,并检查它们是否正确。
    • 可能的解决方法:将CharSet=utf8mb4添加到您的连接字符串中,或​​切换到MySqlConnector,它总是通过网络发送Unicode数据。
  • phpmyadmin在检索数据时是否破坏了数据?如果其他一切看起来正确,则可能是问题所在。
    • 可能的解决方案:提出另一个SO问题(或编辑此问题)以仅专注于该问题,而不是C#+ MySQL。

答案 1 :(得分:0)

NVARCHAR表中的try1.workers列中仅接受Unicode字符,而不是ASCII。