Jaká podoba URL je správná

Často se v diskusních fórech objevuje téma „jakou podobu URL zvolit“. To mě přivedlo k otázce, jaká je tedy správná podoba URL?

Budu se zabývat jen cestou ve struktuře webu a názvem stránky.

Nejdřív možné varianty:

  • /kategorie/nazev-clanku
  • /kategorie-nazev-clanku-1234
  • /kategorie-nazev-clanku-1943.html
  • /kategorie/?idClanku=1943
  • /?idClanku=1943&idKategorie=12

Tyto se dají rozdělit na 2 základní skupiny – s parametrem a bez parametru.

Varianty s parametry bych rovnou zavrhl. Už kvůli tomu, že třeba Seznam a jeho fulltext zvládá zpracovávat maximálně 4 parametry v URL a některé ignoruje. Např. PHPSESSID nebo uId.

Pokud jde o zbývající „hezká“ URL, tam už je to celkem jedno.  Přesto bych doporučoval kromě třeba kategorie a názvu článku použít i nějaký další identifikátor. Díky tomu se sníží šance, že vzniknou dvě stránky s rozdílným obsahem, ale ve stejné kategorii a se stejným názvem. Může to být nějaké idéčko, nebo třeba timestamp.

Jestli nesouhlasíte – směle do mě. Třebas jsem něco zásadního opomněl.

Šmírák: street Google

Google připustil, že během snímání WiFi hotspotů v rámci projektu Street View nasbíral data z nezabezpečených bezdrátových sítí a jejich uživatelů.

Pár postřehů aneb příležitost dělá zloděje.

To, že vidím na ulici odemknuté auto, sice ještě neznamená, že si do něj sednu a vypůjčím si třeba autorádio. Stejné je to s bezdrátovou sítí. Čili Google vs. společnost 0:1 – „fuj fuj ty ošklivý velký bratře“. To se prostě nedělá resp. česká verze, když už dělám něco neslušného, tak se u toho nesmím nechat chytit.

Na druhou stranu. Spousta věcí se nesmí, třeba šmírovat sousedku v protějším domě při převlékání, protože si zrovna nezatáhla závěs. Nemá se to, je to neslušné, ale kdo by odolal! A stejné je to i s daty, která si jen tak poletují vzduchem. No, a když už Google vypravil do světa tak drahá autíčka s „foťáky“, proč by neměly ještě, jako bonus přivést i informace které se v blízkosti nacházeli byť ne zrovna ve vizuální podobě. Navíc, když oficiálně mapuje hotspoty. Jde o ideální příležitost. Ovšem je tu i druhá možnost. Data nasbírali opravdu omylem. I mistr tesař… Nicméně tomu se mi moc věřit nechce. A konspiračním teoriím se meze nekladou. Tohle téma může být velmi populární.

A k čemu jim ty data vlastně budou? Nemají jich už takhle dost?

Postulát platný nejen na Inetu: „Dat není nikdy dost.“  A navíc takováhle reálná data (třeba jen informace o zrovna navštívené stránce) jsou velmi užitečná a druhá příležitost jen tak nebude.

Já bych si toto počínání interpretoval následujícím způsobem. Google získává data tak, že čeká, co k němu přijde. Tedy čeká, co mu uživatelé dodají v podstatě sami, svým brouzdáním (po jeho službách, kam uživatelé odcházejí z hledání apod.). Zdroj a objem dobrý, ale jsou závěry, které jsme z toho vyvodili opravdu správné? Nezapomínáme na nějaký aspekt? No a tím, že přijde Google přímo k vám a podívá se, co zrovna děláte, si může ověřit některé předpoklady. Třeba sledovat sociologicko-demografické aspekty, které by, třeba z geo IP zjistit nešly. Když poletíte do vesmíru, tak taky budete snímat, fotit, zaznamenávat, prostě zhraňovat informace co to dá. Co s nimi pak je v tom okamžiku druhořadé. Následných způsobů využití je spousta, záleží jen na fantazii.

No, a pokud chceme současně věřit, že cíleně sbíral data a Google máme rádi nebo mu důvěřujeme, tak se hodí další hypotéza. Google chtěl jen ověřit zabezpečení rozmáhajících se bezdrátových sítí. Následně na základě vyhodnocení získaných dat bude inovovat zabezpečení vlastních služeb – to zní jako dobrý důvod a argument, který bych jim klidne zbaštil.

V důsledku může jít o riziko pro uživatele. Přesto si myslím, že se o závažné ohrožení svobody nejedná. Už kvůli tomu, že data nasbíraná z veřejných a nezabezpečených sítí by z logiky věci neměly obsahovat nic důvěrného a tajného. A další věc je, že taková velká společnost jako G jistě nemá potřebu zbytečně kompromitovat sebe ani jiné.

Spíš přijde nějaký šikula, chvíli bude sledovat provoz, vyhodnotí data a rozhodne se, k čemu je využije. Od vydírání před nějaké podvodné jednání až po krádež. Tohle jednání očekávám od druhořadých individuí, ale rozhodně ne od Google. Na to nemá čas, nemá to zapotřebí v už tak dusné atmosféře, která se točí kolem soukromí, služeb Guglu a třeba Číny.

Podnět získán z E15 (17. 5. 2010).

SEO diskuse a fóra v češtině. Jaká jsou?

Na českém internetovém rybníčku existuje celkem dost stránek a webů, které se tváří, že jsou internetovým fórem. Většina z nich však valnou úroveň nemá. Které diskuse o SEO, vyhledávání a vyhledávačích jsou tedy hodnotné?

Nebudu chodit kolem horké kaše. Česká SEO fóra, která za něco stojí jsou 4. Celkem málo, ale zatím bych řekl, že to stačí.

Ostatní jsou mrtvá. Nebo, a to mi přijde častější, jsou provozována nějakou SEO firmou a jejich cílem není ani tak vést diskuzi a pomáhat názorem ostatním, ale spíš ukázat, že optimalizování je těžké a tudíž je lepší si někoho najmout.

No a jaká jsou tedy ty čtyři nejpoužitelnější?

Je to web vyhledavace.info, seo.nawebu.cz, webtrh.cz a diskuse.jakpsatweb.cz resp. jejich podsekce.

Každé z nich má svoje plusy a mínusy, která se pokusím přiblížit.

vyhledavace.info

+ odpovídá Marek Prokop /je to jeho poradna/
+ rychlé odpovědi
+ odpovídají i odborníci na slovo vzatí a veřejně známí (předpokládejme tedy i důvěryhodnější) třeba Dušan Janovský aka Yuhů
+ diskuse se nezvrhávají jako jinde
– provoz na fóru není moc velký
– GUI je z dob řekněme dřevních (ale to za problém nepovažuju)

seo.nawebu.cz

+ přijde mi, že level problémů a témat je vyšší oproti ostatním diskusím
+ až na pár výjimek se jsou komentáře věcné
+ na webu se dají lehce dohledat spousty cenných informací (pro fulltextové vyhledávání jako stvořené stránky)
– konference je emailová (mě to přijde jako mínus)
– poslední dobou provoz stagnuje
– témata se opakují

webtrh.cz

+ asi nejživější české SEO fórum
+ rychlé odpovědi
– o odbornosti mnoha zaníceně diskutujících se dá pochybovat
– jedno téma se řeší dokola v různých vláknech jak paralelně, tak se i v čase opakují
– uživatelé se často spíš chvástají a radit se jim nechce (nechtějí pustit know-how) a je to vidět až ze Sněžky
– myslím, že nepřeháním, pokud napíšu, že v sekci o SEO je >40% uživatelů spamery a MFAčkary, kteří netvoří příliš hodnotné weby, ale jak vidno, některým to celkem sype…
– přispěvatelé se rádi pouští do nekonstruktivních sporů

diskuse.jakpsatweb.cz

+ živá diskuse
+ odpovídá mj. i Marek Prokop
+ různé levely odbornosti
– často lammerské dotazy
– přispěvatelé se rádi pouští do nekonstruktivních sporů

I přes výhrady k jednotlivým diskusím sleduji pravidelně právě tyto 4. Ostatní fóra spíš nahodile.

Pokud si myslíte, že jsem nějaké podstatné nebo kvalitní fórum opomněl tak se klidně vyjádřete v komentářích. Rád změním názor.

Kult hlavní stránky

Je opravdu HP webu ta nejdůležitější ze všech stránek? Má se ve vyhledávání zobrazovat raději podstránka nebo hlavní stránka webu?

Tohle jsou jen některé z otázek, které napadají, když si pročítám fóra, kde se poslední dobou hodně omílá vypadnutí HP nějakého webu vyhledávání na Seznamu.cz a nahrazení nějakou podstránkou, která se umísťuje v SERP na mnohem horší pozici.

Proč k výpadkům dochází nechám teď stranou a zaměřím se spíš na vnímání hlavní stránky jako takové. Pracovně jsem si tento jev nazval „Kult homepage“, nebo hezky česky „Kult hlavní stránky webu“.

Je homepage opravdu klíčová?

Hodně webmásterů a optimalizatorů si myslí, že homepage je nejpodstatnější stránka webu a tak směřují obrovské úsilí optimalizací této a považte, jediné stránky. Naštěstí jich kvapem ubývá.

Samozřejmě, optimalizování HP je jistě hodně podstatné. Navíc hlavní stránka je vstupní branou webu a má tedy patřičně reprezentovat. No a do jisté míry je i o dost jednodušší ji zoptimalizovat, než optimalizace desítek různých podstránek. Na druhou stranu, pokud všechny zpětné odkazy vedou pouze na hlavní (nebo jednu) stránku, tak se majitel resp. webmáster pouští na velmi tenký led.

Důvody, proč je vhodně věnovat víc času optimalizaci podstránek jsou přitom na snadě. Jednak tak zachytíte longtail dotazů o kterém se HP ani nezdá. Navíc při nějakém výpadku ať už na straně vyhledávače, tak i vašeho serveru chvíli trvá, než všechny stránky vypadnou a máte tak čas průšvihu zabránit. No a to samé platí třeba i pro nějakou ne zcela optimální změnu, kdy máte čas při vypozorování negativního vlivu provést nějaký rollback.

Proč jsou podstránky důležitější než HP?

Celkově mi přijde, že HP je pro návštěvníka užitečná jen tehdy, pokud hledá přímo web jako takový. Ve většině ostatních případů by měla být zobrazena spíš nějaká podstránka, která odpovídá dotazu přesněji. Díky tomu také zamezíte zbytečnému bounce rate, kdy uživatel vleze na HP webu, nezorientuje se, resp. si nevšimne třeba odkazu na podstránku, která obsahuje odpověď na jeho dotaz a zas odchází hledat jinam. U podstránky, kde vidí rovnou informaci, která ho zajímá je šance na opuštění webu přeci jen menší.

Proč je riskantní zaměřit úsilí optimalizace na HP

  • HP může vypadnou z hledání a pak jste v pr..čicích
  • jednu stránku těžko zoptimalizujete na všechny požadované KW
  • jakákoliv úprava může být smrtelná, protože předem nevíte, co přesně změna bude pro vyhledávače znamenat

Meta keywords

Přemýšlím, zda se o tomto tagu vůbec zmiňovat. No, pár slov si snad zaslouží.
Samozřejmě, nic nezkazíte, když budete pečlivě doplňovat relevantní klíčová slova do tagu meta keywords, ale v současné době snad žádný rozumný vyhledávač na světě těmto slovům nepřikládá alespoň minimální váhu. To, že ho třeba Jyxo.cz  nebo Yahoo.com zpracovává, ještě neznamená, že je pro ně nějak zásadní.

Důvod je prostý, nedodržování základních pravidel slušného chování.
Není dávno doba a snad ještě stále trvá, kdy existovalo nemálo stránek, které do meta keywords uváděly i zcela nerelevantní slova v objemech vskutku gigantických. Přeci, když děláte web o špagetách, tak nezopakujete v MK 50x po sobě slovo mp3… Věřte i takové věci se děly, dějí a dít budou. Není potom divu, že fulltexty na takovou entitu neberou zřetel.

Počet slov (frází) v meta KW by měl být rozumný a úměrný délce textu stránky resp. tématické různorodosti. Nic nezkazte, pokud do meta keywords zařadíte 3 – 10 nejčetnějších slov ze stránky, která se vztahují k tématu.

Pokud znáte nějaký vyhledávač, který meta keywords zohledňuje, napište jej prosím do komentáře.

Meta description

Nenápadný, ale docela podstatný tag je bezesporu meta description. Ať se totiž zdají fulltexty jakkoliv strohé a nespravedlivé, tak se každý z nich snaží vydolovat o stránce co nejvíc relevantních informací. A právě v meta descripton se skrývá to „pravé zlato“. Důvod je prostý.

Neoptimalizované (povětšinou i shirské) stránky jej nepoužívají, mají jej na všech stránkách webu stejný nebo je brutálně přeoptimalizovaný.

Zde je těžiště celého významu tagu meta description, totiž lenost člověka. Obecně panuje nedůvěra ve význam meta descripton a proto i SEO optimalizátor jej jaksi odbývá a cpe do něj jen trochu relevantní informace (za víc není placen, je totiž často jednodušší získávat zpětné odkazy a prezentovat je klientovi, než pracně vymýšlet copywrite pro entitu, která „vlastně není ani vidět“). No řekněte sami, za co vás klient více „pochválí“ (berme na vědomí, že o SEO a SEM nemá ani páru a vychází z faktu, že kdo je víc vidět, tak vyhraje). Odkaz (byť je v brutálně dlouhé patičce), je vidět. Kdežto meta description je „na nic“, vždyť to není vidět.

To co je výše popsáno se dá shrnout do věty: „Tagem meta description se nic nezkazí a obecně platí, že platí za rozhodně relevantnější údaj než meta keywords. Ovšem blbě vykazuje do faktury…“

POZNÁMKA: Možná se mi to zdá, ale v poslední době tento tag zažívá mezi SEO optimalizátory opět trochu boom a tak je otázkou, jak se k němu budou v budoucnu chovat vyhledávače. Obzvláště, pokud bude jeho věrohodnost klesat.

Tvoříme titulek stránky – title

Jedním z nejdůležitějších tagů a onpage faktorů, který indexují všechny vyhledávače je právě titulek stránky. Myšlen atribut <title> v hlavičce HTML dokumentu. Samozřejmě není důležitý jen pro fulltexty, ale také pro uživatele (zpětně tedy i pro vyhledávače).

Důvodů, proč je tenhle tag důležitý je jistě mnoho, zkusme tedy zmínit alespoň ten nejdůležitější. Title, asi víc než cokoliv jiného, ovlivňuje uživatele ve výsledcích vyhledávání. Může říct „tady je to co hledáš přehledně a jasně“, ale stejně tak o „no jo, něco tu je, ale je to změť ve které se možná ani nevyznáš“. Dokáže vzbudit důvěru, ale může také uživatele odradit. Současně také uživateli jak starších (nezáložkových) browserů tak i moderním prohlížečů, usnadňuje orientaci. Titulky jsou zobrazovány jako přehledné identifikátory jednotlivých stránek. Pár příkladu špatných a dobrých titulků.

Jak tvořit titulek stránky

Při navrhování title jednotlivých dokumentů, ale i celého webu je třeba zohlednit několik podmínek.

Obsah title

Titulek by neměl obsahovat „zbytečná“ slova. Ideální obsah titulku informuje o tom, co naleznete na konkrétní stránce, nikoliv celém webu (výjimku může tvořit homepage, která nemusí nést žádné konkrétní informace resp. obsahuje tolik druhů informací, že není efektivní je všechny vyjmenovat v titulku). Vyvarujte se opakování slov.

Délka titulku

Titlulek by neměl být příliš dlouhý hned ze dvou důvodů. Jednak při velké délce se infomace mohou dostat mimo zobrazitelnou část (titulek není ve vyhledávačí a prohlížeči vidět celý) a druhým důvodem je zohlednění délky ze strany vyhledávačů. Když je titulek moc dlouhý, může být těžší v něm najít důležitá slova.

Ideální délka titulku je zhruba do 70 znaků. Víc znaků stejně nebývá zobrazeno.

Struktura (uspořádání) titulku

Titulek by měl obsahovat informace ve sledu nejkonkrétnější, konkrétní, obecné, nejobecnější. Je to dáno tím, že uživatel na první pohled dokáže rozlišovat mezi jednotlivými strákami jednoho webu. Mnoho zákazníků vyžaduje název webu, firmy na začátku titulků, tak aby si dělali pěkné promo. Pokud má firma krátký název, tak se dá na začátku title tolerovat. Ale pokud se jedná o 3 slovný název, pak je to přeci jen trochu moc. Zkuste si představit a porovnat jak vypadají v hledání, ale i v prohlížečí 2 hypotetické titulky:

ČEZ – Často Extrémně Zdražit | Podpora zákazníka | Ceníky a tarify | Ceník pro domácnosti od 1. 1. 2009
oproti
Ceník domácností od 1. 1. 2009 | Podpora zákazníka | ČEZ – Často Extrémně Zdražit

Použití klíčových KW (lokálních vs. globálních)

Z výše uvedeného v podstatě vyplývá, že v titulku se slovy neplýtvá a tak by v něm měly být uvedeny přednostně lokální KW. To znamená ta slova, která jsou podstatná pro konkrétní stránku. A až pokud zbyde místo, můžeme do titulku přidávat obecnější věci, jako je třeba název sekce webu.

Příklady nevhodných titlků

Hledáno bylo obecné slovo „ceník“.

  • „Ceník“ (co že to je za web? jaký ceník?)
  • „Vysoká škola ekonomická v Praze – Správa účelových zařízení (SÚZ) – ubytování na kolejích VŠE“ (brutálně dlouhý titulek a jeho nejpodstatnější informace je často mimo zobraziletnou část titulku)
  • „Ski Čenkovice – lyžařský areál Buková hora, Čenkovice – ceny jízdného na vlecích, letecký snímek areálu“ (extrémně dlouhý titulek)
  • „Horský hotel Flora“ (chybí zmínka o tom,že stránka obsahuje ceník)
  • „Česká pošta s.p. : Ceník“ (špatné uspořádání společně s chybějícím upřesněním o jaký ceník se jedná)
  • „Časopis Respekt – Ceník předplatného“ (sice krátný titulek, ale špatně uspořádaný – přeci jen tohle už celkem jde)

Příklady správných title

Hledáno bylo obecné slovo „ceník“.

  • „Ceník střešních oken VELUX – | VELUX“
  • „Ceník služeb aukce Odklepnuto.cz“

Z čeho se dají data pro analýzu klíčových slov získat

Způsobů a zdrojů je mnoho. Některé jsou placené a jiné zas třeba ne tak rozsáhle. Níže uvedené jsou jednak zadarmo současně je ale jejich vypovídající hodnota dostatečná.

  • Statistiky hledanosti dotazů na search.seznam.cz
    + vývoj hledanosti za posledních 60 dní
    + nejčastější rozšíření
    + volná i přesná shoda hledané fráze
    – jsou chráněna proti hromadnému stahování
    – týkají se jen hledání na seznam.cz
  • Našeptávač na seznam.cz
    + nabízí pravostranné rozšíření
    – není zřejmé z jakého časového úseku se data počítají (ne zrovna aktuální zpráva říká, že za 60dní zpět)
    – čísla zobrazovaná v našeptávači (pokud si vypnete styly) nejsou skutečná hledanost, ale jen pseudohodnota hledanosti přepočítaná podle „tajné“ rovnice
  • Statistiky na toplist.cz
    + jsou vidět vstupní stránky
    + pokud není vyžadováno heslo, pak vidíte i statistiky cizích webů
    – data se týkají jen stránek s vloženým skriptem
    – výrazně ovlivněna pozicí webu ve vyhledávačích
  • Access logy vašeho serveru
    + lehce se zpracovávají
    + obsahují velké množství „zajímavých“ informací (referer, čas přístupu, IP návštěvníka, zobrazení jednotlivých stránek…)
    + fungují na rozdíl od toplistu automaticky
    + při troše snahy celkem přesně vysledujete chování uživatelů
    – výrazně ovlivněna pozicí webu ve vyhledávačích
    – jen vaše data. Těžko seženete někoho, kdo vám zpřístupní vlastní logy (natož zdarma)
  • AdWords, Sklik a další PPC systémy
    + nejčastější rozšíření
    + volná i přesná shoda hledané fráze
    – jsou chráněna proti hromadnému stahování
  • Google Analytics

Asi nejmocnější nástroj současnosti a tak si jeho zhodnocení nechám na někdy jindy a zkusím mu věnovat samostatný článek.

  • SEO nástroje jiných dodavatelů

Existuje celá řada SEO nástrojů, které vytvářejí třeba SEO firmy, nebo i jednotlivci. Některé jsou zdarma jiné placené. Obecně se dá valná většina z nich prohlásit za vesměs užitečné. Jen je potřeba jejich výstup porovnávat se zdravým rozumem, tak aby jsme si neuškodili. Zkrátka je třeba pamatovat, že autorem může být i laik, který o optimalizaci mnoho neví. Nebo naopak nějaký spamer, který běžně používá nekalé SEO praktiky a tak by mohla doporučení od takového nástroje celkem uškodit.

Závěrem bych rád zdůraznil, že žádný nástroj vám klíčová slova jen tak nevyplivne a že je potřeba alespoň trochu přemýšlet. Někdy znamená méně více a platí to i v tomto případě. O konkrétním postupu analyzování KW zas někdy jindy.

Čeho se vyvarovat při zakládání webu

Zjednodušeně nesmíte být unáhlení. To, že prodáváte propisky neznamená, že toto slovo je alfou a omegou vaší optimalizace. Snad vždy existuje několik, většinou desítky, frází, které jsou pro vás zajímavé a právě na těchto frázích je dobré postavit první verzi webu.
Zatímco text uvedený na stránce se dá kdykoliv změnit a pokud zpozorujete negativní vliv na vyhledávače, pak se vrátíte k původnímu obsahu s relativně malou ztrátou, tak s URL adresou to tak prosté není a přitom se jedná o důležitou složku relevance, kterou vyhledávače zohledňují.
Tedy, pokud zakládáte nový web, tak je vhodné paralelně s přípravami grafického návrhu či struktury databáze, také analyzovat klíčová slova a volit strukturu url.

to co mě zajímá na Internetu