如何在列表中修复阿拉伯语unicode

时间:2016-08-23 12:17:45

标签: python python-3.x

我创建了一个包含阿拉伯语单词的数据库,当我获取数据并打印出来时,它可以正常运行并打印出来:

@foreach (var item in Model)
{
    <p class="container images">
        foreach (var image in item.Item2)
        {
            <span>
                <img src="data:image/png;base64,@Convert.ToBase64String(image.ImageBytes)" />
            </span>
        }
        <div class="clearfix"></div>

        <hgroup>
            <h2>@Html.DisplayFor(x => item.Value1.Title)</h2>
        </hgroup>

        <span>
            @Html.DisplayFor(x => item.Value1.Content)
        </span>
    </p>
}

但是当我循环进入该数据库并将其转到列表然后打印该列表以查看发生的事情时,我明白了:

<?php

$x = array(1 => 'test1', 2 => 'test', 3 => 'test3', 4 => 'test4');
$y = array(1,4);

$result=array_diff_key($x,array_flip($y));

print_r($result);

以下是代码:

مشاعر‬

مودة     

在我问之前,我尝试了多种方法来修复它,但没有一种方法可以帮助我。

1 个答案:

答案 0 :(得分:0)

发现......

import re
cors.execute("SELECT * FROM DictContents") 

self.AraList = [] 

for raw in cors.fetchall(): 

    rawAra = raw[1] 
    cleanit = re.compile('\w+.*')
    cleanone = cleanit .search(rawAra)
    if cleanone:
            print(cleanone.group()) # prints the clean strings : مشاعر‬ مودة 
    self.AraList.append(cleanone.group()) # adding strings to list to see how it will looks like .
print(self.AraList) # prints much better clean list than firs one 
['مشاعر\u202c - ', 'المودة\u202c']