Algorytmy tekstowe

Zadanie 2: Analiza linków w kodzie HTML - `extract_links` (2 pkt)

Uzupełnij funkcję extract_links, która analizuje fragment kodu HTML i wyodrębnia wszystkie linki (<a> tagi).

Twoje zadanie:

Zaimplementuj wyrażenie regularne do dopasowania tagów <a> i wyodrębnienia potrzebnych atrybutów
Użyj re.finditer do znalezienia wszystkich wystąpień wzorca
Dla każdego znalezionego linku stwórz słownik z odpowiednimi informacjami
Zwróć listę wszystkich znalezionych linków

Każdy słownik w wynikowej liście powinien zawierać:

url: adres URL (wartość atrybutu href)
title: tytuł linku (wartość atrybutu title lub None jeśli nie istnieje)
text: tekst wyświetlany jako link (tekst pomiędzy tagami <a> i </a>)

Przykład:


html = '<div><a href="https://www.agh.edu.pl">AGH</a> <a href="https://www.agh.edu.pl/wydzialy" title="Wydziały">Wydziały AGH</a></div>'
extract_links(html)
-> [
    {'url': 'https://www.agh.edu.pl', 'text': 'AGH', 'title': None},
    {'url': 'https://www.agh.edu.pl/wydzialy', 'text': 'Wydziały AGH', 'title': 'Wydziały'}
]

Zadanie 2: Analiza linków w kodzie HTML - extract_links (2 pkt)

Zadanie 2: Analiza linków w kodzie HTML - `extract_links` (2 pkt)