如何通过网页抓取获取表情符号?

时间:2017-09-27 07:44:07

标签: python unicode

我制作了一个简单的python脚本,它刮擦了一个特定的网站

以下是示例代码

words = []
f = open("text.txt", "r")
for line in f:
    try:
        if(line[0]=="<" and line[1]=="l" and line[2]=="i" and line[3]==">"):
        words.append(line.decode('utf-8'))
    except BaseException,e:
            pass
for a in words:
    print a.encode("utf-8")

之后,我使用此代码过滤数据以从特定标记中获取一些文本(尽管不是最好的方法)

I am pretty happy ☺ coz i can easily recall this ☝stuff
#x1f60f;&#x1f60f;

虽然我成功获取了我想要的数据但是当我尝试获取包含表情符号的文本时出现问题。

以下是我的输出

的摘录
cell.selectionStyle = UITableViewCellSelectionStyleNone;

所以任何想法如何转换这个&#34;#x1f60f&#34;成为表情符号?

P.S - 我也试图将它保存在firebase中,但它仍然显示这些&#34;#x1f60f&#34;在那里

1 个答案:

答案 0 :(得分:0)

  1. 尝试从#x参与到最后(#x1f60f - &gt; 1f60f

  2. 通过在开头添加0,按照Unicode要求将此部分最多填充为8位。 1f60f - &gt; 0001f60f

  3. 转换。

  4. emoji = "\U0001f60f"
    print(emoji)