Błąd 404 – jak zidentyfikować niedziałające podstrony w serwisie?

Błąd 404 jest jednym z najpopularniejszych błędów pojawiających się w witrynach internetowych. Oznacza, że szukana strona nie została odnaleziona, w związku z tym jest ona niedostępna zarówno dla użytkowników, jak i robotów wyszukiwarki. Jakie niesie to konsekwencje? Jak wyszukać błędy 404 na stronie oraz jak się ich pozbyć? O tym w dalszej części wpisu.

Czym jest błąd 404?

Komunikat o błędzie 404 pojawia się w sytuacji, gdy zasób, do którego użytkownik chce uzyskać dostęp, nie istnieje. Problem ten szczególnie często spotykany jest w e-commerce. Przykładem jest kliknięcie w interesujący nas produkt w sklepie internetowym, po czym zamiast wyświetlenia szczegółowych informacji o nim pojawia się komunikat, że strona nie została odnaleziona. Z technicznego punktu widzenia błąd 404 to kod odpowiedzi http, który oznacza, że przeglądarka jest w stanie nawiązać połączenie z serwerem, natomiast serwer nie może odnaleźć żądanego zasobu i wyświetlić użytkownikowi jego zawartości.

Kiedy pojawiają się błędy 404?

Błędy 404 mogą pojawiać się w witrynie z wielu przyczyn. Wśród najczęstszych powodów wyróżnia się:

  • usunięcie podstrony z serwisu lub całej witryny,
  • przeniesienia zasobu pod inny adres URL (modyfikacje adresów URL bez wykonanych przekierowań),
  • wykonanie złych przekierowań,
  • chwilowa niedostępność strony z powodu jej moderacji lub przebudowy,
  • wpisanie niewłaściwego adresu URL podstrony,
  • złośliwe oprogramowanie wymuszające komunikat o błędzie.

Konsekwencje występowania błędów 404 na stronie

Błąd 404 negatywnie wpływa na doświadczenia użytkowników związane z witryną. Internauci, przechodząc na daną stronę, spodziewają się zobaczyć jej zawartość. W momencie, w którym otrzymują informację, że strony nie odnaleziono, czują się zakłopotani i najczęściej opuszczają daną witrynę. Częste występowanie błędów 404 może być uciążliwe i wywoływać irytację wśród użytkowników, którzy w przyszłości nie będą chcieli wrócić do witryny, mając w pamięci związane z nią wcześniejsze złe doświadczenia.

Duża liczba błędów 404 ma również negatywny wpływ na stronę pod kątem SEO. Frazy kluczowe, na które wcześniej wyświetlała się strona zwracająca aktualnie błąd 404, zostają utracone. Odbija się to na widoczności witryny w organicznych wynikach wyszukiwania. Kolejną konsekwencją występowania błędów 404 są problemy z indeksacją strony. Roboty Google niechętnie odwiedzają serwisy, w których odnajdują sporą liczbę błędnych podstron. Sytuacja ta wpływa także negatywnie na crawl budget witryny, który zostaje zmarnowany przez roboty Google na odwiedzanie niewartościowych podstron.

Jak wykryć błędy 404 na stronie?

  • Screaming Frog

Podstawowym narzędziem, od którego warto rozpocząć analizę błędów 404 jest Screaming Frog lub dowolny inny crawler pozwalający na przeskanowanie strony np. Sitebulb, OnCrawl itp. Narzędzia te pozwalają na dogłębną analizę witryny, w której efekcie otrzymamy szereg informacji na temat parametrów on-site strony, w tym na temat błędów 404.

W przypadku narzędzia Screaming Frog informacje te znajdziemy m.in. w zakładce „Response Code”. Możemy także dokładnie zlokalizować miejsce występowania poszczególnych błędów 404, klikając w konkretny adres URL, a następnie sprawdzając zakładkę „Inlinks”.

Screaming Frog 404

 

Za pomocą narzędzia Screaming Frog można również odnaleźć błędy 404 do źródeł zewnętrznych, czyli linków zamieszczonych w serwisie, ale odnoszących do obcych domen. Dane te znajdziemy w zakładce „External”.

  • Google Search Console

Ważnym krokiem podczas identyfikacji błędów 404 jest przejrzenie stanu indeksu w narzędziu Google Search Console. GSC niestety nie wyświetli pełnej listy problematycznych podstron, mimo to warto przejrzeć komunikaty w sekcjach „Błąd” oraz „Wykluczono”. Odnaleźć tam można wiele problemów związanych z indeksowaniem, które powinniśmy jak najszybciej naprawić. W celu dokładniejszego przeanalizowania błędów 404 warto skupić się na zestawieniu podstron określonych poniższymi komunikatami:

– nie udało się odnaleźć przesłanego adresy URL-a (404),

– nie znaleziono (404),

– pozorny błąd 404.

Dodatkowo pod kątem błędów 404 warto także przejrzeć adresy URL znajdujące się w wykazie podstron określonym jako „Nieprawidłowość związana ze skanowaniem” oraz „Przesłany URL zawiera błędy indeksowania”.

  • Analiza logów serwera

Analiza logów serwera pozwala dokładnie poznać, w jaki sposób roboty Google przemieszczają się w danym serwisie. Mając na uwadze jak najlepsze zarządzanie crawl budgetem, warto dokładnie przyjrzeć się logom. Dzięki temu mamy szansę zidentyfikować podstrony w serwisie, które zostały odwiedzone przez roboty Google, ale zwróciły błędy 404.

Jednym z narzędzi pomocnych podczas analizy logów jest Screaming Frog Log File Analyser. Do narzędzia możemy zaimportować paczkę logów, którą najprawdopodobniej znajdziemy w panelu hostingu lub w plikach na serwerze. Aby analiza była jak najbardziej miarodajna dobrze przeprowadzić ją dla danych z logów z okresu przynajmniej ostatnich 30 dni.

Narzędzie File Log Analyser jest bardzo intuicyjne, po załadowaniu logów już w widoku podstawowym możemy zobaczyć wykres prezentujący rozkład kodów odpowiedzi serwera. W celu dokonania dokładniejszej analizy warto przejść do zakładki „URLs”, gdzie znajdziemy informację m.in. o tym, które podstrony wywołują najwięcej zdarzeń, z jaka częstotliwością są odwiedzane przez boty oraz to, co interesuje nas najbardziej, czyli jaki status kodu zwracają. W trakcie analizy oprócz identyfikacji stron błędów 404 warto również dokładnie przyjrzeć się podstronom przekierowań 301, gdyż mogą one prowadzić na podstrony z błędem 404 lub generować pętle przekierowań.

 

  • Mapa .xml

Dobrą praktyką jest również sprawdzenie mapy strony .xml pod kątem istniejących w niej ewentualnych błędów 404. Jest to szczególnie istotne w przypadku witryn, których mapy strony nie są automatycznie aktualizowane. Mogą one wówczas zawierać bardzo wiele historycznych adresów URL, które już nie istnieją w strukturze witryny. Informacje na temat zawartości mapy strony możemy sprawdzić w GSC. Koniecznie jest jednak wcześniejsze zgłoszenie adresu URL mapy .xml w tym narzędziu. W raporcie mapy witryny możemy sprawdzić stan przesłania lub zaindeksowania. Jeśli przetwarzanie mapy witryny powiodło się bez komplikacji możemy przejrzeć stan mapy .xml w indeksie i kolejno przeanalizować sekcję z błędami lub wykluczeniami.

 

Analizę mapy strony pod kątem błędów 404 można również przeprowadzić we wspomnianym wcześniej narzędziu Screaming Frog. Musimy tutaj pamiętać o odpowiedniej konfiguracji Spidera. Upewnijmy się więc, że mamy zaznaczoną opcje „Crawl Linked XML Sitemaps”. Następnie uruchamiamy Crawl Analysis. Dane dotyczące mapy witryny powinniśmy znaleźć w zakładce Sitemaps.

  • Wtyczki do WordPressa

W serwisach opartych o CMS WordPress przydatne pod kątem wyłapywania błędów 404 są wtyczki takie jak Broken Link Checker oraz Redirection. Głównym zadaniem pierwszej z nich jest monitorowanie wszystkich linków wewnętrznych oraz linków wychodzących z serwisu pod kątem błędów. Więcej na temat zalet tej wtyczki można przeczytać we wpisie „Uszkodzone linki w WordPress – jak nad nimi zapanować?”.

Kolejna wtyczka Redirection pozwala na łatwe zarządzanie przekierowaniami 301 oraz monitorowanie błędów 404 pojawiających się w linkowaniu wewnętrznym. Co ciekawe wtyczka zbiera również informacje na temat błędów 404 powstałych w wyniku działań użytkowników np. pomyłki i wpisania niepoprawnego adresu URL lub przejścia przez niedziałający odnośnik znaleziony w obcej domenie. Mając takie informacje, łatwo możemy sprawdzić najczęstsze błędy popełniane przez użytkowników i dokonać odpowiednich przekierowań.

 

 

  • Google Analytics

Podstrony zwracające status kodu 404 możemy również śledzić za pomocą Google Analytics. Musimy jednak pamiętać, że w narzędziu tym znajdziemy tylko te podstrony z błędem 404, które próbował odwiedzić użytkownik. Aby namierzyć takie podstrony, można zaimplementować specjalną regułę w Google Tag Managerze, która będzie uruchamiała się za każdym razem, gdy użytkownik trafi na stronę błędu.

Innym sposobem jest po prostu wyszukanie ręczne błędów w Google Analytics. Jeśli przeprowadzamy taką analizę pierwszy raz, najlepiej zaznaczyć możliwie najdłuższy okres i przejść do zakładki Zachowanie –> Zawartość witryny –> Wszystkie strony. Następnie należy dodać dodatkowy wymiar, jakim jest tytuł strony oraz ustawić zaawansowany filtr, który będzie wyświetlał tylko podstrony o tytule, jaki posiada strona błędu 404. W moim przypadku jest to tytuł „Strona nie została znaleziona”. Otrzymane dane możemy wyeksportować do pliku excel.

Sposoby na poprawę błędów 404 na stronie

Naprawę błędów warto rozpocząć od zebrania w jednym pliku excel wszystkich adresów URL podstron zwracających 404, które zidentyfikowaliśmy podczas wcześniejszych analiz. Z uwagi na to, że dane pochodzą z różnych źródeł warto wykorzystać funkcję excel „usuń duplikaty”. Pozbędziemy się dzięki temu podstron, które wystąpiły kilkukrotnie w zestawieniu. Otrzymaną listę adresów URL możemy przeanalizować hurtowo w narzędziu Ahrefs. Pozwala ono m.in. na sprawdzenie liczby słów kluczowych, na jakie wyświetla się dana podstrona, czy też liczby odwołujących się do niej linków zewnętrznych. Informacje te pozwolą nam wyfiltrować najważniejsze podstrony, które posiadają jakąś widoczność i profil linków i to właśnie na tych podstronach powinniśmy w pierwszej kolejności skupić nasze działania.

Przechodząc do sedna – jak zatem pozbyć się błędów 404?

Najprostszym sposobem jest wykonanie przekierowań 301 z niedziałających podstron na aktywne podstrony zbliżone tematycznie. Przekierowanie 301 przenosi moc podstrony przekierowywanej na stronę, którą wskazuje, dzięki temu nie utracimy słów kluczowych, na jakie mogła wyświetlać się nieaktywna podstrona. Zachowamy także profil odwołujących się do niej linków. Bardzo istotne jest jednak prawidłowe dobranie podstron, na które przekierowany będzie błędny adres. W przypadku podstrony produktowej zwracającej błąd 404 najlepiej przekierować ją na inny podobny produkt lub jeśli taki nie istnieje na stronę kategorii, do której należał produkt. Podobnie sytuacja wygląda z wpisami blogowymi. Niedziałający link prowadzący do danego artykułu najlepiej przekierować na inny wpis o zbliżonej tematyce, który ma szansę wyświetlać się na podobne frazy kluczowe.

Jak zaprojektować stronę błędu 404?

Pomimo naszych starań i dogłębnie przeprowadzonej analizy trudno jest wyeliminować wszystkie błędy 404 pojawiające się w witrynie. Przykładem mogą być te błędy, które wynikają z działań użytkowników np. niepoprawnie wpisany adres URL strony. Warto być przygotowanym na taką sytuację i zadbać o odpowiednią prezentację strony błędu.

Dobrze skonstruowana strona 404 powinna wspierać konwersję w serwisie i wskazywać jakie dalsze kroki może podjąć internauta, tak aby zapobiec jego irytacji i zatrzymać go na stronie. Kluczowe kwestie, o których warto pamiętać, projektując stronę błędu 404:

  • szablon strony powinien być utrzymany w stylistyce całego serwisu,
  • wszelkie komunikaty o błędach powinny być wyrażone językiem naturalnym bez umieszczania kodów systemowych i niezrozumiałych dla użytkownika definicji technicznych,
  • strona powinna posiadać odnośnik do strony głównej, innych kluczowych podstron (np. główne menu),
  • warto umieścić formularz kontaktowy lub numer telefonu w celu szybkiego kontaktu,
  • w e-commerce szczególnie warto zaprezentować na stronie błędu 404 produkty polecane, najnowsze lub informacje o promocjach,
  • dobrym rozwiązaniem jest również zamieszczenie wyszukiwarki wewnętrznej, tak by użytkownik mógł wyszukać interesującą go frazę.

 

Podsumowanie

Dobrze przygotowana strona zwracająca status kodu 404 może wspierać konwersję w serwisie, jednak nie powinniśmy bagatelizować tego typu błędów. Zdecydowanie lepiej jest zapobiegać pojawianiu się ich w serwisie. Niepoprawne zarządzanie błędami 404 może prowadzić do utraty wartościowych linków przychodzących, spadków pozycji na ważne słowa kluczowe, a w konsekwencji zmniejszenia ruchu na stronie. Systematycznie przeprowadzana analiza oraz stały monitoring błędów 404  pozwala uniknąć wielu negatywnych skutków związanych z niedostępnością podstron.

Martyna Tomicka

Specjalistka SEO odpowiedzialna za kompleksowe działania optymalizacyjne. Wolne chwile wykorzystuje na aktywną działalność w kołach studenckich, gdzie rozwija swoje umiejętności programistyczne.