如何将字符串转换为seo-url?

时间:2012-01-04 08:11:57

标签: python string url unicode seo

我想将重音字符串转换为seo-url ...

例如: “Lebébé(de 4 ans)aégalementunétrange”rire“”to: “LE-贝贝-DE-4-ANS-A-egalement-UN-etrange-rire”

有任何解决方案吗?

谢谢!

6 个答案:

答案 0 :(得分:2)

这就是我使用的:

def _doStringSEOptiomization(objectName,pageName,lang,objectId):
"""
Prende in input il nome di un'offerta e svolge dei passi:
1- Trasforma tutte le variazioni delle vocali
   in vocali normali
2- Attraverso una serie di REGEX, elimina i caratteri non desiderati e torna 
   una stringa da inserire in un link adatto ai motori di ricerca e alle indicizzazioni
"""

try:
    import re #importo il modulo per le REGEX
    Speaker.log_debug(GREEN("core.ws_site.do_sites_offers_data_redux._doStringSEOptiomization() input: objectName=%s, pageName=%s, lang=%s, objectId=%s" % (objectName,pageName,lang,objectId)))

    #mappa dei caratteri html-entity e unicode
    vocalMap = { 'a' : ['à','á','â','ã','ä','å','æ','à','á','â','ã','ä','å','ā','æ'],
                 'e' : ['è','é','ê','ë','è','é','ê','ë','ē'],
                 'i' : ['ì','í','î','ï','ì','í','î','ï','ī'],
                 'o' : ['ò','ó','ô','œ','õ','ö','ò','ó','ô','œ','õ','ö','ō'],
                 'u' : ['ù','ú','û','ü','ù','ú','û','ü','ū']
                }

    objectName = objectName.lower() #trasformo la stringa di partenza in caratteri minuscoli

    for vocale, lista in vocalMap.iteritems(): #per ogni elemento della mappa avrà una chiave ed una lista
        for elemento in lista: #itero su tutti gli elementi della lista
            objectName = objectName.replace(elemento,vocale) #sostituisco nel nome dell'offerta, la vocale all' HTML-entity

    objectName = objectName.replace("/","-")

    objectName = re.sub("[^a-z0-9_\s-]","",objectName)     #######################################
    objectName = re.sub("[\s-]+"," ",objectName)           #strippo tutti i caratteri non voluti:# 
    objectName = re.sub("[\s_]","-",objectName)            #######################################

    objectName = pageName+"--"+objectName
    objectName += "-"+lang+"-"+str(objectId) #aggiungo la lingua e l'id dell'offerta

except Exception,s:
    Speaker.log_error("_doStringSEOptiomization(): Error=%s"%RED(s))

return objectName 

你必须根据自己的情况调整它。

答案 1 :(得分:2)

这可能(或可能不)足够:

import re
import unidecode

def normalized_id(title):
    title = unidecode.unidecode(title).lower()
    return re.sub('\W+', '-', title.replace("'", '')).strip('-')

答案 2 :(得分:2)

>>> a = u'Le bébé (de 4 ans) a également un étrange "rire"'
>>> r = unicodedata.normalize('NFKD',a).encode('cp1256','ignore')
>>> r = unicode(re.sub('[^\w\s-]','',r).strip().lower())
>>> r = re.sub('[-\s]+','-',r)
>>> print r
le-bebe-de-4-ans-a-egalement-un-etrange-rire

我使用cp1256(拉丁语1)处理重音字符......

完美!非常感谢!

答案 3 :(得分:1)

如果你有Django,你可以使用它的defaultfilter slugify(或根据你的需要调整它)。

答案 4 :(得分:1)

[~]$ python
Python 2.7.1 (r271:86882M, Nov 30 2010, 10:35:34) 
[GCC 4.2.1 (Apple Inc. build 5664)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import unicodedata
>>> import re
>>> def seo_string(x):
...     r = unicodedata.normalize('NFKD',x).encode('ascii','ignore')
...     r = unicode(re.sub('[^\w\s-]','',x).strip().lower())
...     return re.sub('[-\s]+','-',r)
... 
>>> seo_string(u'Le bébé (de 4 ans) a également un étrange "rire"')
u'le-bb-de-4-ans-a-galement-un-trange-rire'

感谢django的内置过滤器slugify,但它不会像@doncallisto发布的解决方案一样替换é

答案 5 :(得分:1)

以下是几种方法:Generating Slugs作者:Armin Ronacher。