Table of Contents

To lahko direktno skopiraš v DokuWiki editor in shraniš.

Odprava robots.txt napake v Google Search Console

(WordPress + Cloudflare + AI crawlerji)

🎯 Namen dokumenta

Ta dokument opisuje:

Napaka je bila zaznana ob dodajanju domene v orodje:


Velja za


🧠 Povzetek problema (TL;DR)

Če uporabljaš:

lahko Google poroča, da je robots.txt neveljaven, tudi če je datoteka na strežniku videti pravilna.

Razlog je v tem, da Cloudflare prepiše robots.txt in vanj doda nestandardno direktivo, ki je Google Search Console ne podpira.


🔍 Root cause (kaj je bilo v resnici narobe)

Cloudflare ima možnost samodejnega upravljanja robots.txt, ki v datoteko doda naslednjo direktivo:

Content-signal: search=yes,ai-train=no

Ta direktiva:

Pomembno:

robots.txt prepisuje proxy ali aplikacija (najpogosteje Cloudflare).


❌ Napačen primer

Primer robots.txt, ki povzroči napako:

User-agent: * Content-signal: search=yes,ai-train=no Allow: /

Posledica:


✅ Pravilna rešitev

Rešitev ima dva obvezna koraka.


Korak 1: Pravilni robots.txt na strežniku

Robots.txt mora biti nameščen v WordPress root direktoriju (tam, kjer so mape `wp-admin`, `wp-content`, `wp-includes`).

Priporočena vsebina robots.txt:

Block AI training & AI crawlers

User-agent: GPTBot Disallow: /

User-agent: ChatGPT-User Disallow: /

User-agent: ClaudeBot Disallow: /

User-agent: PerplexityBot Disallow: /

User-agent: CCBot Disallow: /

User-agent: Amazonbot Disallow: /

User-agent: Google-Extended Disallow: /

User-agent: Applebot-Extended Disallow: /

User-agent: meta-externalagent Disallow: /

Allow search engines

User-agent: * Allow: /

Sitemap: https://example.si/sitemap_index.xml

Ta konfiguracija:


Korak 2: Izklop Cloudflare upravljanja robots.txt

V Cloudflare nadzorni plošči:

S tem:


🧪 Diagnostika (če se zatakne)

Vedno preveri, kaj Google dejansko vidi:

https://example.si/robots.txt

Če vidiš:

potem Cloudflare še vedno prepisuje robots.txt in je treba ponovno preveriti nastavitve.


🛡️ Kako preprečiti ponovitev napake

Primer HTTP headerja:

X-Robots-Tag: noai, noimageai


📌 Povzetek v eni stavki

Napaka v robots.txt ni bila posledica WordPressa, temveč tega, da je Cloudflare prepisoval robots.txt z nestandardnimi direktivami, ki jih Google Search Console ne podpira.