我是韩国人,并在我的大学网站上制作网络抓取程序,其中包含韩语内容
但是,当我在此站点中废弃表格的某些内容时,结果如下所示:
16/01/27 (2.16 ¸¶°¨)2016Çг⵵ 1Çбâ ÀÌÈ¿©´ë ´ëÇпø ...
16/01/27 (1.29 ¸¶°¨)2016Çг⵵ 1Çбâ ÀÌÈ¿©´ë(ÇкÎ) ÇÐ...
16/01/27 [º¸°ÇÁø·á¼Ò] Áø·á½Ã°£ ´ÜÃà ¾Ë¸²
16/01/26 2016Çг⵵ 1Çб⠱³³» ±Ù·ÎÀåÇÐ ½Åû ¾È³»
16/01/26 [½ºÆ®·¹½ºÅ¬¸®´Ð] 16³â 2¿ù ¸í»óÇÁ·Î±×·¥ Âü°¡ÀÚ...
16/01/26 [¿µ¾î°ÀÇ ¼ö° Àü·«] ¿µ¾î ÇÁ·¹Á¨Å×À̼Ç,¿µ¾î ...
16/01/26 ¼¿ï´ëÇб³ Àü±â¡¤µµ½Ã°¡½º ¿¡³ÊÁö »ç¿ëÁ¤º¸ ¾È...
16/01/26 (2.3 ¸¶°¨)2016Çг⵵ 1Çб⠰øÁÖ´ë ÇÐÁ¡±³·ù ¾È...
16/01/26 (2.3 ¸¶°¨)2016Çг⵵ 1Çб⠾ÆÁÖ´ë ´ëÇпø ÇÐÁ¡...
16/01/26 (1.29 ¸¶°¨)2016Çг⵵ 1Çб⠾ÆÁÖ´ë(ÇкÎ) ÇÐÁ¡...
16/01/25 [½Åû] 2015 µ¿°è SNUìÑ Ãë¾÷Ä·ÇÁ
16/01/25 µ¿°è¹æÇÐ ¼ÅƲ¹ö½º ¿îÇàÇöȲ
16/01/25 2016. 1Çб⠴ëÇпµ¾î1, ´ëÇпµ¾î2 ´ã´ç±³¼ö º¯...
它看起来像一个外星语言。当我打印这些外星人句子的type
时,所有句子都是type 'str'
据我所知,Python 3的默认编码是unicode,因此我不必像在Python 2中那样使用encode()
或decode()
函数。
但我不知道为什么会发生这种事情
我真的想让你知道网站的网址,但这个网页只能由授权用户访问。
我想要你的建议,谢谢。
P.S只有这个页面显示如下。当我废弃其他韩国网站时,它并没有发生。