Błąd 404 – jak zidentyfikować i naprawić niedziałające podstrony w serwisie?

Blog page

Błąd 404 jest jednym z najpopularniejszych błędów pojawiających się w witrynach internetowych. Oznacza, że szukana strona nie została odnaleziona, w związku z tym jest ona niedostępna zarówno dla użytkowników, jak i robotów wyszukiwarki. Co oznacza błąd 404 na naszej stronie? Jakie niesie konsekwencje? Jak wyszukać błędy 404 na stronie oraz jak się ich pozbyć? O tym w dalszej części wpisu.

Błąd 404 – co to jest i o czym nas informuje?

Błąd 404 (page not found) pojawia się w sytuacji, gdy zasób, do którego użytkownik chce uzyskać dostęp, nie został znaleziony na serwerze. Problem ten szczególnie często spotykany jest w e-commerce. Przykładem jest kliknięcie w interesujący nas produkt w sklepie internetowym, po czym zamiast wyświetlenia szczegółowych informacji o nim pojawia się komunikat, że strona nie została odnaleziona. Z technicznego punktu widzenia błąd 404 to kod odpowiedzi http, który oznacza, że przeglądarka jest w stanie nawiązać połączenie z serwerem, natomiast serwer nie może odnaleźć żądanego zasobu i wyświetlić użytkownikowi jego zawartości.

Kiedy pojawiają się błędy 404?

Błędy 404 mogą pojawiać się w witrynie z wielu przyczyn. Wśród najczęstszych powodów ich występowania wyróżnia się:

  • usunięcie podstrony z serwisu lub całej witryny,
  • przeniesienia zasobu pod inny adres URL (modyfikacje adresów URL bez wykonanych przekierowań),
  • wykonanie złych przekierowań,
  • chwilowa niedostępność strony z powodu jej moderacji lub przebudowy,
  • wpisanie niewłaściwego adresu URL podstrony,
  • złośliwe oprogramowanie wymuszające komunikat o błędzie.

Co może generować błędy 404 adresów URL, które nigdy nie istniały?

Czasem błędy 404 pojawiają się w kontekście adresów URL, które nigdy nie istniały w obrębie naszej strony www. Taka sytuacja może mieć wiele różnych powodów, jednak do najczęstszych należą:

  • błędne linki w obrębie witryny, prowadzące do nieistniejących adresów URL,
  • błędne linki prowadzące do naszej strony (np. błędny adres URL w serwisach zewnętrznych),
  • caching, czyli sytuacja gdy Google zapamięta starą wersję naszej strony i jej adresów,
  • a także ataki hakerskie, które mogą generować wiele spamerskich błędnych linków prowadzących do strony internetowej.

Błędy 404 – konsekwencje ich występowania na stronie

Błąd 404 negatywnie wpływa na doświadczenia użytkowników związane z witryną. Internauci, przechodząc na daną stronę, spodziewają się zobaczyć jej zawartość. W momencie, w którym otrzymują informację, że strony nie odnaleziono, czują się zakłopotani i najczęściej opuszczają daną witrynę. Częste występowanie błędów 404 może być uciążliwe i wywoływać irytację wśród użytkowników, którzy w przyszłości nie będą chcieli wrócić do witryny, mając w pamięci związane z nią wcześniejsze złe doświadczenia.

Duża liczba błędów 404 ma również negatywny wpływ na stronę pod kątem SEO. Frazy kluczowe, na które wcześniej wyświetlała się strona zwracająca aktualnie błąd 404, zostają utracone. Odbija się to na widoczności witryny w organicznych wynikach wyszukiwania. Kolejną konsekwencją występowania błędów 404 są problemy z indeksacją strony w google. Roboty Google niechętnie odwiedzają serwisy, w których odnajdują sporą liczbę błędnych podstron. Sytuacja ta wpływa także negatywnie na crawl budget witryny, który zostaje zmarnowany przez roboty Google na odwiedzanie niewartościowych podstron.

Błędy 404 – jak je wykryć na stronie?

  • Screaming Frog

Podstawowym narzędziem, od którego warto rozpocząć analizę błędów 404 jest Screaming Frog lub dowolny inny crawler pozwalający na przeskanowanie strony np. Sitebulb, OnCrawl itp. Narzędzia te pozwalają na dogłębną analizę witryny, w której efekcie otrzymamy szereg informacji na temat parametrów on-site strony, w tym na temat błędów 404.

W przypadku narzędzia Screaming Frog informacje te znajdziemy m.in. w zakładce „Response Code”. Możemy także dokładnie zlokalizować miejsce występowania poszczególnych błędów 404, klikając w konkretny adres URL, a następnie sprawdzając zakładkę „Inlinks”.

Błąd 404 w screaming frog

 

Za pomocą narzędzia Screaming Frog można również odnaleźć błędy 404 do źródeł zewnętrznych, czyli linków zamieszczonych w serwisie, ale odnoszących do obcych domen. Dane te znajdziemy w zakładce „External”.

Strona domowa narzędzia Screaming Frog – www.screamingfrog.co.uk

  • Google Search Console

Ważnym krokiem podczas identyfikacji błędów 404 jest przejrzenie stanu indeksu w narzędziu Google Search Console. GSC niestety nie wyświetli pełnej listy problematycznych podstron, mimo to warto przejrzeć komunikaty w sekcjach „Błąd” oraz „Wykluczono”. Odnaleźć tam można wiele problemów związanych z indeksowaniem, które powinniśmy jak najszybciej naprawić. W celu dokładniejszego przeanalizowania błędów 404 warto skupić się na zestawieniu podstron określonych poniższymi komunikatami:

    • nie udało się odnaleźć przesłanego adresy URL-a (błąd 404),
    • nie znaleziono (błąd 404),
    • pozorny błąd 404.

Dodatkowo pod kątem błędów 404 warto także przejrzeć adresy URL znajdujące się w wykazie podstron określonym jako „Nieprawidłowość związana ze skanowaniem” oraz „Przesłany URL zawiera błędy indeksowania”.

Wykrycie błędów 404 w Google Search Console

  • Analiza logów serwera

Analiza logów serwera pozwala dokładnie poznać, w jaki sposób roboty Google przemieszczają się w danym serwisie. Mając na uwadze jak najlepsze zarządzanie crawl budgetem, warto dokładnie przyjrzeć się logom. Dzięki temu mamy szansę zidentyfikować podstrony w serwisie, które zostały odwiedzone przez roboty Google, ale zwróciły błędy 404.

Jednym z narzędzi pomocnych podczas analizy logów jest Screaming Frog Log File Analyser. Do narzędzia możemy zaimportować paczkę logów, którą najprawdopodobniej znajdziemy w panelu hostingu lub w plikach na serwerze. Aby analiza była jak najbardziej miarodajna dobrze przeprowadzić ją dla danych z logów z okresu przynajmniej ostatnich 30 dni.

Narzędzie File Log Analyser jest bardzo intuicyjne, po załadowaniu logów już w widoku podstawowym możemy zobaczyć wykres prezentujący rozkład kodów odpowiedzi serwera. W celu dokonania dokładniejszej analizy warto przejść do zakładki „URLs”, gdzie znajdziemy informację m.in. o tym, które podstrony wywołują najwięcej zdarzeń, z jaka częstotliwością są odwiedzane przez boty oraz to, co interesuje nas najbardziej, czyli jaki status kodu zwracają. W trakcie analizy oprócz identyfikacji stron błędów 404 warto również dokładnie przyjrzeć się podstronom przekierowań 301, gdyż mogą one prowadzić na podstrony z błędem 404 lub generować pętle przekierowań.

 

Błędy 404 w logach serwera

  • Mapa .xml

Dobrą praktyką jest również sprawdzenie mapy strony .xml pod kątem istniejących w niej ewentualnych błędów 404. Jest to szczególnie istotne w przypadku witryn, których mapy strony nie są automatycznie aktualizowane. Mogą one wówczas zawierać bardzo wiele historycznych adresów URL, które już nie istnieją w strukturze witryny. Informacje na temat zawartości mapy strony możemy sprawdzić w GSC. Koniecznie jest jednak wcześniejsze zgłoszenie adresu URL mapy .xml w tym narzędziu. W raporcie mapy witryny możemy sprawdzić stan przesłania lub zaindeksowania. Jeśli przetwarzanie mapy witryny powiodło się bez komplikacji możemy przejrzeć stan mapy .xml w indeksie i kolejno przeanalizować sekcję z błędami lub wykluczeniami.

Błędy 404 w mapie witryny

 

Analizę mapy strony pod kątem błędów 404 można również przeprowadzić we wspomnianym wcześniej narzędziu Screaming Frog. Musimy tutaj pamiętać o odpowiedniej konfiguracji Spidera. Upewnijmy się więc, że mamy zaznaczoną opcje „Crawl Linked XML Sitemaps”. Następnie uruchamiamy Crawl Analysis. Dane dotyczące mapy witryny powinniśmy znaleźć w zakładce Sitemaps.

wykrycie błędów 404 w screaming frog

  • Wtyczki do WordPressa

W serwisach opartych o CMS WordPress przydatne pod kątem wyłapywania błędów 404 są wtyczki takie jak Broken Link Checker oraz Redirection. Głównym zadaniem pierwszej z nich jest monitorowanie wszystkich linków wewnętrznych oraz linków wychodzących z serwisu pod kątem błędów. Więcej na temat zalet tej wtyczki można przeczytać we wpisie „Uszkodzone linki w WordPress – jak nad nimi zapanować?”.

Kolejna wtyczka Redirection pozwala na łatwe zarządzanie przekierowaniami 301 oraz monitorowanie błędów 404 pojawiających się w linkowaniu wewnętrznym. Co ciekawe wtyczka zbiera również informacje na temat błędów 404 powstałych w wyniku działań użytkowników np. pomyłki i wpisania niepoprawnego adresu URL lub przejścia przez niedziałający odnośnik znaleziony w obcej domenie. Mając takie informacje, łatwo możemy sprawdzić najczęstsze błędy popełniane przez użytkowników i dokonać odpowiednich przekierowań.

 

Wtyczki do wykrywania błędów 404 na WordPress

 

  • Google Analytics

Podstrony zwracające status kodu błędu 404 możemy również śledzić za pomocą Google Analytics. Musimy jednak pamiętać, że w narzędziu tym znajdziemy tylko te podstrony z błędem 404, które próbował odwiedzić użytkownik. Aby namierzyć takie podstrony, można zaimplementować specjalną regułę w Google Tag Managerze, która będzie uruchamiała się za każdym razem, gdy użytkownik trafi na stronę błędu.

Innym sposobem jest po prostu wyszukanie ręczne błędów w Google Analytics. Jeśli przeprowadzamy taką analizę pierwszy raz, najlepiej zaznaczyć możliwie najdłuższy okres i przejść do zakładki Zachowanie –> Zawartość witryny –> Wszystkie strony. Następnie należy dodać dodatkowy wymiar, jakim jest tytuł strony oraz ustawić zaawansowany filtr, który będzie wyświetlał tylko podstrony o tytule, jaki posiada strona błędu 404. W moim przypadku jest to tytuł „Strona nie została znaleziona”. Otrzymane dane możemy wyeksportować do pliku excel.

Wykrywanie błędów 404 w Google Analytics

Jak rozwiązać problem z błędem 404 na naszej stronie?

Naprawę błędów warto rozpocząć od zebrania w jednym pliku excel wszystkich adresów URL podstron zwracających 404, które zidentyfikowaliśmy podczas wcześniejszych analiz. Z uwagi na to, że dane pochodzą z różnych źródeł warto wykorzystać funkcję excel „usuń duplikaty”. Pozbędziemy się dzięki temu podstron, które wystąpiły kilkukrotnie w zestawieniu. Otrzymaną listę adresów URL możemy przeanalizować hurtowo w narzędziu Ahrefs. Pozwala ono m.in. na sprawdzenie liczby słów kluczowych, na jakie wyświetla się dana podstrona, czy też liczby odwołujących się do niej linków zewnętrznych. Informacje te pozwolą nam wyfiltrować najważniejsze podstrony, które posiadają jakąś widoczność i profil linków i to właśnie na tych podstronach powinniśmy w pierwszej kolejności skupić nasze działania.

Najprostszym sposobem jest wykonanie przekierowań 301 z niedziałających podstron na aktywne podstrony zbliżone tematycznie. Przekierowanie 301 przenosi moc podstrony przekierowywanej na stronę, którą wskazuje, dzięki temu nie utracimy słów kluczowych, na jakie mogła wyświetlać się nieaktywna podstrona. Zachowamy także profil odwołujących się do niej linków.

Bardzo istotne jest jednak prawidłowe dobranie podstron, na które przekierowany będzie błędny adres. W przypadku podstrony produktowej zwracającej błąd 404 najlepiej przekierować ją na inny podobny produkt lub jeśli taki nie istnieje na stronę kategorii, do której należał produkt. Podobnie sytuacja wygląda z wpisami blogowymi. Niedziałający link prowadzący do danego artykułu najlepiej przekierować na inny wpis o zbliżonej tematyce, który ma szansę wyświetlać się na podobne frazy kluczowe.

Jak rozwiązać problem z błędami 404 jako użytkownik?

Napotykając się na Błąd 404 na witrynie którą odwiedzamy, możemy wyróżnić kilka sposobów, które rozwiążą ten problem. Poniżej przedstawiamy kilka metod:

  • Sprawdź adres URL – bardzo często zdarza się, że wpisany wpisany adres URL został błędnie wpisany, bądź niepoprawnie skopiowany z innej witryny w której go znaleźliśmy. Zanim więc przejdziemy do próby rozwiązania, warto jest zobaczyć, czy nie doszło do błędu podczas jego wpisywania.
  • Załaduj stronę ponownie – często przyczyną błędu 404 może być chwilowy problem z połączeniem użytkownika z serwerem. Warto jest więc odświeżyć stronę i pozwolić załadować się jej ponownie
  • Usuń cache i pliki cookie – kolejnym problemem, który może powodować błąd 404, może być błąd związany z pamięcią podręczną witryny, lub z istniejącymi plikami cookies. Warto jest w tym przypadku usunąć zapisane wersje tych plików i na nowo otworzyć stronę
  • Cofnij się do poprzedniego poziomu katalogu – jeżeli pod podanym URL’em nie możemy znaleźć informacji, które miały się pod nim znajdywać, warto jest cofnąć się w strukturze katalogu na witrynie, używając opcji okruszków breadcrumbs, bądź usuwając ostatni człon katalogu z URL zakładki zwracającej błąd (możliwe że link który znalazłeś, najzwyczajniej posiadał błąd).

Jak zaprojektować własną stronę błędu 404?

Pomimo naszych starań i dogłębnie przeprowadzonej analizy trudno jest wyeliminować wszystkie błędy 404 pojawiające się w witrynie. Przykładem mogą być te błędy, które wynikają z działań użytkowników np. niepoprawnie wpisany adres URL strony. Warto być przygotowanym na taką sytuację i zadbać o odpowiednią prezentację strony błędu.

Dobrze skonstruowana własna strona błędu 404 powinna wspierać konwersję w serwisie i wskazywać jakie dalsze kroki może podjąć internauta, tak aby zapobiec jego irytacji i zatrzymać go na stronie. Kluczowe kwestie, o których warto pamiętać, projektując stronę błędu 404:

  • szablon własne strony 404 błędu powinien być utrzymany w stylistyce całego serwisu,
  • wszelkie komunikaty o błędach powinny być wyrażone językiem naturalnym bez umieszczania kodów systemowych i niezrozumiałych dla użytkownika definicji technicznych,
  • strona błędu 404 powinna posiadać odnośnik do strony głównej, innych kluczowych podstron (np. główne menu),
  • warto umieścić formularz kontaktowy lub numer telefonu w celu szybkiego kontaktu,
  • w e-commerce szczególnie warto zaprezentować na stronie błędu 404 produkty polecane, najnowsze lub informacje o promocjach,
  • dobrym rozwiązaniem jest również zamieszczenie wyszukiwarki wewnętrznej, tak by użytkownik mógł wyszukać interesującą go frazę.

 

Projektowanie strony błędu 404

Nie tylko błędy 404 – jakie są inne kody błędu 4xx?

Błędy z serii 4xx oznaczają problem związany z dostępem do strony internetowej. Najpopularniejsze z nich, oprócz błędu 404, to błędy 401 i 403, jednak zdarza się, że możemy zobaczyć również inne komunikaty, oto niektóre z nich:

  • Błąd 400 (nieprawidłowe żądanie) – oznacza, że żądanie przesłane przez przeglądarkę jest niepoprawne, a serwer nie jest w stanie go przetworzyć, dlatego blokuje użytkownikowi dostęp do strony.
  • Błąd 401 (unauthorized) –  oznacza, że nia masz dostępu do zawartości danej strony i w rezultacie nie możesz jej zobaczyć,
  • Błąd 403 (forbidden) – pojawia się, gdy serwer zrozumiał przesłane żądanie, jednak z powodu ustawień bezpieczeństwa wyświetla komunikat o odmowie dostępu do określonych zasobów.
  • Błąd 405 (method not allowed) – oznacza, że użyta metoda HTTP podczas wysyłania żądania jest nieprawidłowa, nie jest obsługiwana przez serwer.
  • Błąd 408 (request timeout) – pojawia się, gdy serwer nie otrzyma żadnej odpowiedzi w odpowiednim czasie od wysłanego żądania, często powodem jest wolne połączenie internetowe.

Inne błędy z serii 4xx to błąd 409, 414, czy 418 (żartobliwy „I’m a teapot”).

Błąd 404 – podsumowanie

Dobrze przygotowana strona zwracająca status kodu 404 może wspierać konwersję w serwisie, jednak nie powinniśmy bagatelizować tego typu błędów. Zdecydowanie lepiej jest zapobiegać pojawianiu się ich w serwisie. Niepoprawne zarządzanie błędami 404 może prowadzić do utraty wartościowych linków przychodzących, spadków pozycji na ważne słowa kluczowe, a w konsekwencji zmniejszenia ruchu na stronie. Systematycznie przeprowadzana analiza strony internetowej oraz stały monitoring błędów 404  pozwala uniknąć wielu negatywnych skutków związanych z niedostępnością podstron.

Zespół Netim

Naszą redakcję tworzą eksperci marketingu internetowego: specjaliści SEO, SEM/PPC, social media i copywriterzy. Chętnie dzielimy się wiedzą – jeśli masz do nas pytania, zostaw je w komentarzu. Z przyjemnością na nie odpowiemy 🙂