Php - 下载希伯来语网站 - 角色问题

时间:2013-01-17 16:01:47

标签: php curl web-scraping hebrew

有谁知道如何下载页面,如:

http://www.zvz.co.il/SingleAd.aspx?p=76755307&t=11&m=p

当我这样做时,我会在标题中看到这个:

<head id="Head1"><title> 
×–×”-וזה - רכב: מ×זדה ל×× ×˜×™×¡ 323 תת ×“×’× glx ×וטו' â€1800, ×©× ×ª 1996, 8,000 ₪ , ת. ×”×™×œ×•×›×™× ×וטומטית, יד ר××©×•× ×”, ×זור ×™×™×©×•×‘×™× ×•×ž×•×©×‘×™× ×‘×“×¨×•× ×‘×¤×ª×— תקווה, ×ž× ×•×¢ 1,840 סמ"ק, ×ž× ×•×¢ ×‘× ×–×™×Ÿ, צבע כסף, מס' ק"מ 210,000, בעלות × ×•×›×—×™×ª פרטית, הערות מצב ×ž×›× ×™ מעולה 
</title><link rel="Stylesheet" type="text/css" href="1.css" /> 

但真正存在的是:

<head id="Head1"><title>
    זה-וזה - רכב: מאזדה 2, שנת 2009, 80,000 ₪ , ת. הילוכים אוטומטית, יד שנייה, אזור רמת גן - גבעתיים ברמת גן, מנוע 1,400 סמ"ק, מנוע בנזין, צבע שחור, מס' ק"מ 30,000, בעלות קודמת פרטית, בעלות נוכחית פרטית, הערות שמורה ומתוחזקת.טסט לשנה(יוני 13).2 צמיגים קדמיים חדשים.בקיצור אחלה רכב עם מעט ק"מ.לרציניים בלבד., תוספות מערכת אבטחה של קוברה.מפוארת., טסט הבא 29/06/2013
</title><link rel="Stylesheet" type="text/css" href="1.css" />

我需要一些特殊的字符编码吗?我使用标准Php&amp; cUrl只是做一个简单的Web请求和下载。 请帮忙。

1 个答案:

答案 0 :(得分:0)

有一些类似的主题可能对您有所帮助:

R: extracting "clean" UTF-8 text from a web page scraped with RCurl

Using "cat" to write non-English characters into a .html file (in R)

性质不一样,但可能有帮助。