Zadanie 2: Analiza linków w kodzie HTML - extract_links (2 pkt)
Uzupełnij funkcję extract_links, która analizuje fragment kodu HTML i wyodrębnia wszystkie linki (<a> tagi).
Twoje zadanie:
- Zaimplementuj wyrażenie regularne do dopasowania tagów
<a>i wyodrębnienia potrzebnych atrybutów - Użyj
re.finditerdo znalezienia wszystkich wystąpień wzorca - Dla każdego znalezionego linku stwórz słownik z odpowiednimi informacjami
- Zwróć listę wszystkich znalezionych linków
Każdy słownik w wynikowej liście powinien zawierać:
url: adres URL (wartość atrybutuhref)title: tytuł linku (wartość atrybututitlelubNonejeśli nie istnieje)text: tekst wyświetlany jako link (tekst pomiędzy tagami<a>i</a>)
Przykład:
html = '<div><a href="https://www.agh.edu.pl">AGH</a> <a href="https://www.agh.edu.pl/wydzialy" title="Wydziały">Wydziały AGH</a></div>'
extract_links(html)
-> [
{'url': 'https://www.agh.edu.pl', 'text': 'AGH', 'title': None},
{'url': 'https://www.agh.edu.pl/wydzialy', 'text': 'Wydziały AGH', 'title': 'Wydziały'}
]Last updated on