如果其关键字在已过滤列表中,该如何过滤字典列表?

时间:2019-10-08 08:35:35

标签: python beautifulsoup python-requests

我正在使用代码根据预定列表(在代码中:filteredList)过滤输出(字典列表)。

我尝试了 结果变量 来过滤字典列表。

from bs4 import BeautifulSoup as bs
import requests
import pprint

urls = ['https://e-mehkeme.gov.az/Public/Cases?page=1',
        'https://e-mehkeme.gov.az/Public/Cases?page=2'
        ]


def get_soup(url):
    r = s.get(url)
    soup = bs(r.content, 'lxml')
    return soup


def pageNumber(url):
    response = requests.get('https://e-mehkeme.gov.az/Public/Cases')
    soup = bs(response.content, "html.parser")
    content = str(soup.find("li", class_="disabled PagedList-pageCountAndLocation").find("a", recursive=False))
    number = int("".join(filter(str.isdigit, content))) / 100
    return int(number)


print(pageNumber('https://e-mehkeme.gov.az/Public/Cases'))


filteredList = ['AZƏRBAYCAN DƏMİR YOLLARI',
                '"AZƏRSU" AÇIQ SƏHMDAR CƏMİYYƏTİ'
                ]
outcomes = []
with requests.Session() as s:
    for url in urls:
        soup = get_soup(url)
        detail_urls = [f'https://e-mehkeme.gov.az/Public/CaseDetail?caseId={i["value"]}' for i in
                       soup.select('.caseId')]
        for next_url in detail_urls:
            soup = get_soup(next_url)
            data = [string for string in soup.select_one('[colspan="4"]').stripped_strings]
            for i in data:
                for j in filteredList:
                        if i in j:
                            outcomes.append(data)
                        else:
                            pass

print(outcomes)

myFile = open('csvexample.csv', 'w')
with myFile:
    writer = csv.writer(myFile)
    writer.writerows(outcomes)

这里有两个问题: 1.返回空列表,不应 2。输出仅返回以下列表中符合条件的词典关键字([['Ətraflıməlumat:','İşəbaxan hakimvəyatərkib','VüqarHəsənov-sədrlikedənhakim','NamiqCəfərov-tərkibüz ,'ŞərafətMəmmədova-tərkibüzvü','Tərəflər','Cavabdeh:','“AZƏRSU”AÇIQSƏHMDARCƏMİYYƏTİ','İddiaçı:','DƏMİROVELMƏDDİN'in'N'VƏ 而不是唯一的过滤部分是['“AZƏRSU”AÇIQSƏHMDARCƏMİYYƏTİ'] ),

['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Tofiq Səmədov - sədrlik edən hakim', 'Elşən Kazımov - tərkib üzvü', 'İkram Şirinov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', '"Travelers Coffee Limited" Şirkətinin Azərbaycan Respublikasındakı Filialı', 'İddiaçı:', 'Məmmədov Vaqif İsmayıl', 'İşin mahiyyəti', 'İcarə müqaviləsi üzrə mübahisələr - Digər icarə müqavilələri']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'İlham Kərimli - sədrlik edən hakim', 'Xəyalə Cəmilova - tərkib üzvü', 'İsmayıl Xəlilov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'MİLYAYEVA NATALYA VASİLYEVNA', 'İddiaçı:', 'ƏLİYEV AKİF MUXTAR OĞLU', 'İşin mahiyyəti', 'Mülkiyyət hüququ ilə əlaqədar mübahisələr - Digər']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Şeyda Məhərrəmova - sədrlik edən hakim', 'Elşad Şamayev - tərkib üzvü', 'Məmməd Məmmədov - tərkib üzvü', 'Xəyal Sarıyev - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'ZÖHRABOV ORXAN RAMİZ OĞLU', 'Cavabdeh:', 'RZAYEV ƏLİBALA VASİF OĞLU', 'Cavabdeh:', 'ƏSGƏROV RUHİN İBRAHİM OĞLU', 'İddiaçı:', 'ALLAHVERDİYEVA MƏLAHƏT GÖYÜŞ QIZI', 'İşin mahiyyəti', 'Mənzil mübahisələri - Mənzildən çıxarılma', 'Müqavilənin etibarsız hesab edilməsi tələbi üzrə']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Xəyal Sarıyev - sədrlik edən hakim', 'Elşad Şamayev - tərkib üzvü', 'Məmməd Məmmədov - tərkib üzvü', 'Şeyda Məhərrəmova - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'BAXIŞOV AZAD SİRAC OĞLU', 'Cavabdeh:', 'KAZIMOV İLHAM DAVUD OĞLU', 'Cavabdeh:', '"MƏKAN" MƏNZİL-TİKİNTİ KOOPERATİVİ', 'Cavabdeh:', 'İSAYEVA QƏTİBƏ İSMAYIL QIZI', 'Cavabdeh:', 'BAXIŞOV AZƏR SİRAC OĞLU', 'İddiaçı:', 'HÜSEYNOV CAHANGİR HÜSEYN', 'İşin mahiyyəti', 'Sair mülki iş - Digər']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'İsmayıl Xəlilov - sədrlik edən hakim', 'Xəyalə Cəmilova - tərkib üzvü', 'İlham Kərimli - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'Rzayev Fəxrəddin Hidayət', 'Cavabdeh:', 'Rzayev Fəxrəddin', 'Cavabdeh:', 'RZAYEVA İRADƏ ELXAN QIZI', 'İddiaçı:', 'Dəmirov Davud Nüsrət', 'İddiaçı:', 'DƏMİROV DAVUD NÜSRƏT', 'İddiaçı:', 'Rzayeva İradə E', 'İşin mahiyyəti', 'Mülki hüquq pozuntularından (deliktlərdən) əmələ gələn öhdəliklər üzrə mübahisələr - Maddi ziyanın ödənilməsi']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Xumar Mərdanova - sədrlik edən hakim', 'Elnur Həsənov - tərkib üzvü', 'Fuad Babayev - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'MƏMMƏDOV SƏFƏR MƏHƏRLƏM OĞLU', 'İddiaçı:', 'ALLAHVERDİYEV BAYRAM MƏHƏRRƏM', 'İşin mahiyyəti', 'Sair mülki iş - Digər']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Fuad Babayev - sədrlik edən hakim', 'Elnur Həsənov - tərkib üzvü', 'Xumar Mərdanova - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', '"DAŞINAR VƏ DAŞINMAZ ƏMLAKLARIN QİYMƏTLƏNDİRİLMƏSİ XİDMƏTİ" MƏHDUD MƏSULİYYƏTLİ CƏMİYYƏTİ', 'Cavabdeh:', '"DAŞINAR  VƏ DAŞINMAZ ƏMLAKLARIN SATIŞI ÜZRƏ HƏRRAC MƏRKƏZİ"  MƏHDUD MƏSULİYYƏTLİ CƏMİYYƏTİ', 'İddiaçı:', 'MURADOV İSMAYIL KAMRAN OĞLU', 'İşin mahiyyəti', 'İpoteka müqaviləsi üzrə mübahisələr - İpoteka müqaviləsi ilə bağlı digər mübahisələr']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Abiddin Hüseynov - sədrlik edən hakim', 'Azad İmanov - tərkib üzvü', 'Vahid Sadıqov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'HƏRRAC MƏRKƏZİ "KÜLƏK" MMC', 'İddiaçı:', 'MUSAYEVA TƏRANƏ MURQUZ QIZI', 'İşin mahiyyəti', 'İpoteka müqaviləsi üzrə mübahisələr - İpoteka üzrə hərracın nəticələrinin ləğv edilməsi üzrə mübahisələr']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Vüqar Həsənov - sədrlik edən hakim', 'Namiq Cəfərov - tərkib üzvü', 'Şərafət Məmmədova - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', **'"AZƏRSU" AÇIQ SƏHMDAR CƏMİYYƏTİ'**, 'İddiaçı:', 'DƏMİROV ELMƏDDİN ƏNVƏR OĞLU', 'İşin mahiyyəti', 'Sair mülki iş - Kommunal xərcləri ilə bağlı istehlakçıların hüquqlarının müdafiəsi']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Şərafət Məmmədova - sədrlik edən hakim', 'Namiq Cəfərov - tərkib üzvü', 'Vüqar Həsənov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'AĞAYEV FƏRİD RASİM OĞLU', 'Cavabdeh:', 'ABBASOV RASİM AĞA OĞLU', 'Cavabdeh:', 'ABBASOVA ƏNTİQƏ ŞAHSUVAR QIZI', 'Cavabdeh:', 'ABBASOV AĞA HƏMİŞ OĞLU', 'İddiaçı:', 'MUSAYEV ELŞƏN İSA OĞLU', 'İşin mahiyyəti', 'Mənzil mübahisələri - Mənzilə istifadə hüququna xitam verilməsi']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Vüqar Həsənov - sədrlik edən hakim', 'Tərəflər', 'Cavabdeh:', '"BAKU ELECTRONİCS" MƏHDUD MƏSULİYYƏTLİ CƏMİYYƏTİ', 'İddiaçı:', 'CƏFƏROV AĞA HƏSƏN OĞLU', 'İşin mahiyyəti', 'Torpaq mübahisələri - Torpaq münasibətləri üzrə sair mübahisələr']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Abiddin Hüseynov - sədrlik edən hakim', 'Azad İmanov - tərkib üzvü', 'Vahid Sadıqov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'HÜSEYNOVA AYNUR VAQİF', 'İddiaçı:', 'ƏLİZADƏ TÜRKEL SƏRVƏR QIZI', 'İşin mahiyyəti', 'Əmək mübahisələri - Əmək haqqı tələbi']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Aida Hüseyn - sədrlik edən hakim', 'Etibar Nəbiyev - tərkib üzvü', 'Raqib Qurbanov - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'AZƏRBAYCAN TİBB UNİVERSİTETİNİN TƏDRİS CƏRRAHİYYƏ KLİNİKASI', 'Cavabdeh:', 'NƏSİRLİ CƏFƏR ƏLİABBAS OĞLU', 'Cavabdeh:', 'QƏNBƏROV HƏSƏNAĞA MƏMİ', 'Cavabdeh:', 'MƏRKƏZİ DƏNİZCİLƏR XƏSTƏXANASI', 'Cavabdeh:', 'MƏMMƏDOVA HƏCƏR TOFİQ', 'Cavabdeh:', 'BİO LAP TİBB MARKƏZ', 'İddiaçı:', 'ƏLƏKBƏROV XƏYYAM ÜZEYİR OĞLU', 'İşin mahiyyəti', 'Mülki hüquq pozuntularından (deliktlərdən) əmələ gələn öhdəliklər üzrə mübahisələr - Maddi ziyanın ödənilməsi', 'Mülki hüquq pozuntularından (deliktlərdən) əmələ gələn öhdəliklər üzrə mübahisələr - Mənəvi zərərin ödənilməsi']
['Ətraflı məlumat:', 'İşə baxan hakim və ya tərkib', 'Raqib Qurbanov - sədrlik edən hakim', 'Aida Hüseyn - tərkib üzvü', 'Etibar Nəbiyev - tərkib üzvü', 'Tərəflər', 'Cavabdeh:', 'SALMANOV VÜSAL SALMAN OĞLU', 'İddiaçı:', '"TEXNİKABANK" AÇIQ SƏHMDAR CƏMİYYƏTİ (Ləğv prosesindədir)', 'İşin mahiyyəti', 'Kredit müqaviləsi üzrə mübahisələr']

1 个答案:

答案 0 :(得分:1)

将您的最后一个代码更改为:

import csv

outcomes = []
    with requests.Session() as s:
        for url in urls:
            soup = get_soup(url)
            detail_urls = [f'https://e-mehkeme.gov.az/Public/CaseDetail?caseId={i["value"]}' for i in
                           soup.select('.caseId')]
            for next_url in detail_urls:
                soup = get_soup(next_url)
                data = [string for string in soup.select_one('[colspan="4"]').stripped_strings]
                for i in data:
                    for j in filteredList:
                            if i in j:
                                outcomes.append(data)
                            else:
                                pass

    print(outcomes)

    with open('csvexample.csv', 'w', newline='',encoding='utf-8') as myfile:
         writer = csv.writer(myfile, quoting=csv.QUOTE_ALL)
         writer.writerow(outcomes)

我建议您将结果附加到列表中,然后最后返回列表,而不是打印出来。