odprava_robots.txt_napake_v_google_search_console
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revision | |||
| odprava_robots.txt_napake_v_google_search_console [2026/01/04 15:19] – sistemc | odprava_robots.txt_napake_v_google_search_console [2026/01/04 15:23] (current) – sistemc | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| + | To lahko direktno skopiraš v DokuWiki editor in shraniš. | ||
| + | |||
| ====== Odprava robots.txt napake v Google Search Console ====== | ====== Odprava robots.txt napake v Google Search Console ====== | ||
| (WordPress + Cloudflare + AI crawlerji) | (WordPress + Cloudflare + AI crawlerji) | ||
| Line 37: | Line 39: | ||
| lahko Google poroča, da je **robots.txt neveljaven**, | lahko Google poroča, da je **robots.txt neveljaven**, | ||
| - | Razlog je v tem, da **Cloudflare prepiše robots.txt** in vanj doda **nestandardno direktivo**, | + | Razlog je v tem, da **Cloudflare prepiše robots.txt** in vanj doda **nestandardno direktivo**, |
| ----- | ----- | ||
| Line 43: | Line 45: | ||
| ===== 🔍 Root cause (kaj je bilo v resnici narobe) ===== | ===== 🔍 Root cause (kaj je bilo v resnici narobe) ===== | ||
| - | Cloudflare ima možnost **samodejnega upravljanja robots.txt**, | + | Cloudflare ima možnost **samodejnega upravljanja robots.txt**, |
| + | |||
| + | |||
| + | |||
| + | Content-signal: | ||
| + | |||
| + | |||
| + | Ta direktiva: | ||
| + | |||
| + | * ni del uradnega robots.txt standarda, | ||
| + | * je Google Search Console ne prepozna, | ||
| + | * povzroči napake: | ||
| + | * **robots.txt is not valid** | ||
| + | * **Unknown directive** | ||
| + | * **Links are not crawlable** | ||
| + | |||
| + | Pomembno: | ||
| + | |||
| + | * Google vedno bere samo **eno** datoteko: | ||
| + | * https:// | ||
| + | * če se ta razlikuje od datoteke na strežniku, | ||
| + | robots.txt prepisuje **proxy ali aplikacija** (najpogosteje Cloudflare). | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ===== ❌ Napačen primer ===== | ||
| + | |||
| + | Primer robots.txt, ki povzroči napako: | ||
| + | |||
| + | |||
| + | |||
| + | User-agent: * | ||
| + | Content-signal: | ||
| + | Allow: / | ||
| + | |||
| + | |||
| + | Posledica: | ||
| + | |||
| + | * Google označi robots.txt kot neveljaven, | ||
| + | * crawling je omejen, | ||
| + | * v Search Console se pojavijo opozorila. | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ===== ✅ Pravilna rešitev ===== | ||
| + | |||
| + | Rešitev ima **dva obvezna koraka**. | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ==== Korak 1: Pravilni robots.txt na strežniku ==== | ||
| + | |||
| + | Robots.txt mora biti nameščen v **WordPress root direktoriju** | ||
| + | (tam, kjer so mape `wp-admin`, `wp-content`, | ||
| + | |||
| + | Priporočena vsebina robots.txt: | ||
| + | |||
| + | |||
| + | Block AI training & AI crawlers | ||
| + | |||
| + | User-agent: GPTBot | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: ChatGPT-User | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: ClaudeBot | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: PerplexityBot | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: CCBot | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: Amazonbot | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: Google-Extended | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: Applebot-Extended | ||
| + | Disallow: / | ||
| + | |||
| + | User-agent: meta-externalagent | ||
| + | Disallow: / | ||
| + | |||
| + | Allow search engines | ||
| + | |||
| + | User-agent: * | ||
| + | Allow: / | ||
| + | |||
| + | Sitemap: https:// | ||
| + | |||
| + | |||
| + | Ta konfiguracija: | ||
| + | |||
| + | * blokira AI crawlerje, | ||
| + | * ne vpliva na Google / Bing indeksacijo, | ||
| + | * je skladna z robots.txt standardom. | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ==== Korak 2: Izklop Cloudflare upravljanja robots.txt ==== | ||
| + | |||
| + | V Cloudflare nadzorni plošči: | ||
| + | |||
| + | * izberi domeno, | ||
| + | * pojdi na **Security → Settings**, | ||
| + | * poišči razdelek **Manage your robots.txt**, | ||
| + | * izberi možnost: | ||
| + | * **Disable robots.txt configuration**, | ||
| + | * shrani spremembo. | ||
| + | |||
| + | S tem: | ||
| + | |||
| + | * Cloudflare preneha generirati robots.txt, | ||
| + | * Google vidi robots.txt s strežnika, | ||
| + | * napaka v Google Search Console izgine. | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ===== 🧪 Diagnostika (če se zatakne) ===== | ||
| + | |||
| + | Vedno preveri, kaj Google dejansko vidi: | ||
| + | |||
| + | |||
| + | |||
| + | https:// | ||
| + | |||
| + | |||
| + | Če vidiš: | ||
| + | |||
| + | * direktivo **Content-signal**, | ||
| + | * oznake **Cloudflare Managed content**, | ||
| + | |||
| + | potem Cloudflare še vedno prepisuje robots.txt in je treba ponovno preveriti nastavitve. | ||
| + | |||
| + | ----- | ||
| + | |||
| + | ===== 🛡️ Kako preprečiti ponovitev napake ===== | ||
| + | |||
| + | * robots.txt vedno upravljaj izključno na strežniku, | ||
| + | * Cloudflare ne uporabljaj za generiranje robots.txt, | ||
| + | * ne dodajaj nestandardnih direktiv v robots.txt, | ||
| + | * za omejevanje AI raje uporabi HTTP headerje. | ||
| + | |||
| + | Primer HTTP headerja: | ||
| + | |||
| + | |||
| + | |||
| + | X-Robots-Tag: | ||
| + | |||
| + | |||
| + | ----- | ||
| + | |||
| + | ===== 📌 Povzetek v eni stavki ===== | ||
| + | Napaka v robots.txt ni bila posledica WordPressa, temveč tega, da je Cloudflare prepisoval robots.txt z nestandardnimi direktivami, | ||
odprava_robots.txt_napake_v_google_search_console.txt · Last modified: by sistemc
