K čemu je dobré optimalizování stránek pro vyhledávače

Stále více lidí používá Internet a tím pádem přibývá i domén, stránek a portálů, které se snaží získat co nejvíce čtenářů nebo chcete-li uživatelů a tím pádem i větší prostor prodávat své služby, produkty a nebo třeba jen vydělávat na reklamě, která směřuje na třetí stranu.S tímto rostoucím množstvím roste i konkurence a také jakýsi chaos. Ne vždy je má nejrelevantnější odpověď na dotaz např. „Praha“ doména „praha.cz“. A právě v tomto chaosu se snaží fulltextové vyhledávače zorientovat a poskytnout svému uživateli co nejlepší odpověď na dotaz, který ho zrovna zajímá.Na druhé straně je webmaster nebo SEO optimalizátor, který má za úkol vytvořit takové stránky, které budou kladně hodnoceny jak uživateli, tak také již zmíněnými fulltextovými vyhledávači – optimalizují stránky.

Drobný příklad

Pokud prodáváte kuličková pera, tak jistě nejste jediní.

Počet lidí, kteří přímo do adresního řádku prohlížeče zadají vaši doménu (ať už třeba kulickovapera.cz) je minimální. Nemluvě o tom, že ani takto přímočarou doménu nemusíte mít možnost získat.
A právě v tuto chvíli nastupuje na scénu vyhledávač a SEO. Protože, pokud si uživatel není jistý jakou doménu chce, hledá všelijaké alternativy či nejvýhodnější nabídku, pak použije s velkou pravděpodobností nějaký vyhledávač

Pokud tedy prodáváte ona zmíněná kuličková pera a jste na dotaz „kuličková pera“ na první pozici ve vyhledávači, pak máte i 70% šanci takového uživatele na své stránky přilákat. Co se bude dít pak už je de facto nad rámec SEO a záleží už spíš na designu stránek, ergonomii, cenách a dalších pro uživatele důležitých faktorech.

Proklikovost v závyslosti na pozici – jak je důležité dobré umístění ve vyhledávání

Z tabulky je vidět, jaký vliv má pozice ve výsledcích vyhledávání na počet prokliků na výsledek vyhledávání. Lehce si dovodíte, že být první je to nejlepší, co vás může potkat.

Svou roli (obzvláště u seznamu díky náhledu stránky) hraje optická podoba výsledku. Jinými slovy záleží na titulku, popisu, „líbivosti“ zobrazené URL apod.. Vzhledem k faktu, že tyto údaje byly u sledovaných stránek neměnné je jejich vliv vždy stejný (vliv má ale změna vzhledu u konkurenčních stránek).

Metodika:
Uvedené hodnoty byly získávány v průběhu cca 5 měsíců, kdy 8 sledovaných stránek (neměnných, tedy se stejným obsahem a stejným designem kvůli náhledům na seznam.cz) bylo průběžně na prvních 5 pozicích na search.seznam.cz a 6 pozicích na google.com. Měření bylo provedeno pro 10 různých dotazů.

O tom, co všechno má, nebo může mít vliv na úspěšnost stránky ve výsledku hledání podrobněji asi někdy jindy.

Prokliky z různých pozic v SERP
search.seznam.cz
pozice zobrazení * kliků ** CTR
1. 11153 2632 23,6%
2. 28424 3212 11,3%
3. 27136 1791 6,6%
4. 66039 3368 5,1%
5. 75394 2865 3,8%
google.com
pozice zobrazení * kliků ** CTR
1. 2420 685 28,3%
2. 8781 1124 12,8%
3. 12180 742 6,1%
4. 20609 948 4,6%
5. 31194 967 3,1%
6. 22962 597 2,6%

* hledanost – počet zobrazení bylo odvozeno ze statisticných hodnot poskytovaných vyhledávači
** počet kliků byl stanoven z access logu

Obecně o SEO

Co že vono to SEO je?
Jedná se o zkratku Search Engine Optimization, tedy přeloženo – optimalizace pro vyhledávače.
V podstatě jde se o metodu jak vyhledávačům „předhodit“ stránky tak aby se zobrazovaly na co nejlepších pozicích na slova a dotazy, které považujeme za důležitá.
Pokud se stránka dostane na přední pozice i na jiná slova, pak se jistě zlobit nebudeme.
Ne vždy je vyšší pozice lepší ale o tom více zase někdy jindy.
Existuje několik technik jak se dostat ve výsledcích vyhledávání výš. Některé jsou rychlejší jiné dlouhodobější a jiné zase patří mezi nekalé techniky (to bude výživná část seriálu:D).
Optimalizaci tedy můžeme rozdělit na etické SEO. To jsou vesměs takové metody, které zvyšují kvalitu stránek, kterou vnímá vyhledávač. Můžeme sem zazařadit přirozené zpětné odkazy, kvalitní a unikátní obsah, ale třeba také tématické odkazování.
Na druhé straně je neetické SEO, black hat SEO nebo ještě jinak spam. Do této kategorie patří zejména budování doorways, linkfarem nebo vkládání skrytých textů do stánek.

Co že vono to SEO je?Jedná se o zkratku Search Engine Optimization, tedy přeloženo – optimalizace pro vyhledávače.V podstatě jde se o metodu jak vyhledávačům „předhodit“ stránky tak aby se zobrazovaly na co nejlepších pozicích na slova a dotazy, které považujeme za důležitá.Pokud se stránka dostane na přední pozice i na jiná slova, pak se jistě zlobit nebudeme.Ne vždy je vyšší pozice lepší ale o tom více zase někdy jindy.Existuje několik technik jak se dostat ve výsledcích vyhledávání výš. Některé jsou rychlejší jiné dlouhodobější a jiné zase patří mezi nekalé techniky (to bude výživná část seriálu:D).Optimalizaci tedy můžeme rozdělit na etické SEO. To jsou vesměs takové metody, které zvyšují kvalitu stránek, kterou vnímá vyhledávač. Můžeme sem zazařadit přirozené zpětné odkazy, kvalitní a unikátní obsah, ale třeba také tématické odkazování.Na druhé straně je neetické SEO, black hat SEO nebo ještě jinak spam. Do této kategorie patří zejména budování doorways, linkfarem nebo vkládání skrytých textů do stánek.

SEO seriál – povídání o optimalizaci pro fulltexty hezky česky

Už několikrát jsem si říkal, že vytvořím SEO příručku „hezky česky“, tedy srozumitelný popis pojmů spojených s optimalizováním stránek a webů pro vyhledávače. Pokaždé jsem oprášil staré texty, zaktualizoval je a něco málo připsal. Bohužel, nikdy nebyl ten správný fokus a tah na branku. Proto jsem nyní zvolil méně ucelený přístup, kdy jednotlivé „kapitoly“ zkusím publikovat jako samostatné příspěvky. No uvidíme…

Cílem celého snažení je provést malinkou osvětu. Pančto, co se občas dočítám v některých diskusích (obzvláště na Webtrhu) mi vyvolává nepříjemné svědění – co lidi dokážou vyplodit za bláboly a ještě tomu věřit je občas neskutečné.

Druhá motivace je fakt, že sice existuje mnoho fór a diskusí, ale komu se chce v nich hledat…

No a do třetice. Své know how nikdo jen tak nepustí a tak jsou informace sice dostupné, ale často poněkud děravé. Zkusím nějakou tu mezeru zacelit.

Ale abych jen nekřivdil – třeba poradna serveru Vyhledávače.info není sice nejnavštěvovanější, ale o to možná víc, fundovanější a serióznější.

Konec keců, jde se na věc:)

Jak může vidět stránku vyhledávač

Napadlo vás někdy, jak může robot nebo indexer nějakého vyhledávače vidět webovou stránku? Tohle malé udělátko, které jsem pojmenoval vznešeně „highLighter“ vám to může malinko přiblížit.


Zvýrazňovač slov textu – highLighter

Co to vlastně dělá?

Kromě nějakého obalu, který se stará o stahování a parsování stránky nebo textu (které není nejdokonalejší, tak buďte prosím shovívaví), jde o vyhodnocení počtu slov na stránce a následnou vizualizaci, která má znázornit optickou nasycenost textu jednotlivými slovy.

Slova nejsou nijak lemmatizována, skloňována a není ani nijak zohledňě slovní druh. V podstatě se jen odstraní diakritika a znaky, které nepatří mezi alfanumerické.

Pokud jde o samotný výpočet, pak vězte, že jde o prosté procentuální zastoupení jednotlivých slov v celku. Definována je minimální a maximální velikost. Ještě jsem zkoušel i nějaké barevné odlišení, ale výstup mi přišel spíš zašuměný a tak zbyla obyčejná černá varianta s různou velikostí.

Prostě žádný zázrak, ale občas se člověk nestíhá divit.

Souvislost: tvoříme MFA a boom okolo iPad

Nejen s příchodem nějaké očekávané novinky ať už technologické nebo třeba filmu se objevují dříve či později spekulanti, přesněji MFA-čkaři, kteří se snaží vydělat na názvu díky tvorbě stránek bez užitečného obsahu, zato se spoustou reklam. Vyplatí se to? Kolik práce je připravit takový web?

Asi by bylo dobré nejdříve si ujasnit, co to takové MFA je, kdo a proč ho dělá a také co z toho má.

MFA je z mého pohledu web, který na první pohled nemá propracovaný design, nebo je nápadně neoriginální, ale to samo o sobě nemusí znamenat mnoho. Třeba jen autor, webmáster nemá cit (třeba jako já). Pokud ale takový web kromě mizerného vzhledu ještě navíc neobsahuje víc jak pár stránek s napůl, nebo zcela ukradeným obsahem, který je doplněn jen o pár informací, které se po přečtení stejně ukáží být zbytečné, tak už je to hodně divné. No a aby byl cíl webu splněn, je takový fešák ještě řádně protkán reklamními pozicemi, které se ideálně ještě pletou s menu webu. A je celkem jedno, jestli opticky, nebo obsahově. Samozřejmě nesmím zapomenout na doménu takových stránek. MFÁčkař volí domény, propůjčím si název iPad, typu ipad-apple.biz. Zkrátka takové, které u BFU mohou snáze vzbudit dojem „kvality“. Poslední uvedený příznak mi připomněl ještě něco. A to pojem cybersquatting, tedy parazitování na doméně nebo názvu výrobku, kdy se cybersquatter snaží tvořit web zaměnitelný, třeba opticky, s originálem a podle toho i volí doménové jméno. Jistě existuje mnoho podob a všelijakých úprav MFA, ale podstata je stále stejná.

Tak to by jsme měli rozebráno, o čem je řeč. Jen pro formu dodávám, že význam zkratky je made for adsense.

Kolik práce je vyrobit MFA web a farmu?

Záleží jak moc to myslíte vážně. Pokud chcete mít jen málo takových stránek, tak je to celkem práce. Nevyplatí se totiž vytvářet, nebo rozběhávat nějaký systém na správu, údržbu a tvorbu takového smetiště. Ale, pokud chcete kšeft s reklamními weby rozjet ve velkém, tak je práce značně jednodušší. Samozřejmě pracnost je vztažena k množství shitu, který vyprodukujete.

Základem je zvolit správnou strategii. Chce to rozmyslet, zda pojedete na freehostinzích nebo budete domény kupovat. Také je potřeba sehnat obsah – jako vhodný kandidát pro hromadnou tvorbu je agregování nějakých autoritativních webů resp. jejich RSS. Díky tomuhle triku, který dotlačí na váš web hromadu textu, lze vytvořit i tisíce stránek s unikátním obsahem jež vytvořil někdo jiný. A pokud jste na agregování líní, tak stačí obsah generovat rovnou automaticky z předem vytvořeného seznamu slov a slovních spojení. Co na tom, že text nebude dávat smysl – o to přeci nejde;) No a v neposlední řadě je třeba mít účet v nějakém reklamním systému. Pak už stačí jen registrovat, instalovat, registrovat, instalovat… A i na to existují „hotová“ řešení. Hodí se také navzájem weby trochu provázat odkazy, tak aby se nahnal nějaký rank. Ale přehánět by se to nemělo. Neděláme linkfarmu, ale MFA;)

Odhaduji, že s rozběhaným systémem na tvorbu MFA je vytvoření nového webu otázkou 15 minut, ale chce to rutinu a také pár pomocných nástrojů, třeba na vymýšlení vhodných doménových jmen.

Ale asi nejpodstatnější je vybírat lukrativní témata a zamyslet se nad expirací tématu. Tak aby jste zbytečně neinvestovali energii do bubliny, která třeba splaskne už po týdnu nebo měsíci. No a to, že by jste měli koukat po budoucích tématech a včas se na ně připravit je asi celkem samozřejmé.

A co SEO?

To by na první pohled mohl být zádrhel, ale nebojte. V kvantitě je síla. Pokud na jedno téma vytvoříte 50 webů, kdy každý je postaven z jiných RSS a každý obsahuje třeba 20 stránek, tak by v tom byl čert, aby se časem neprobojovaly na pár rozumných míst. Zde je myslím na čase zmínit se o „kouzlu“ jménem long tail. Pokud se vrátíme ke vzpomínanému iPadu, tak je celkem jasné, že na samotný dotaz „iPad“ asi tak lehce na první stránce nebudete, ale lidé nehledají jen tenhle dotaz. Co třeba „hmotnost iPad“, „rozlišení iPad“ a co já vím, co ještě. Fígl je i využít překlepů. Schválně kolik lidí neumí správně napsat Whirlpool nebo Allianz. Jistě, hledanost takových dotazů není zrovna vysoká, ale v součtu to je často víc než samotný název.

Zisk z MFA webů

A teď to nejpodstatnější. Je možné na tomhle vydělat, nebo dokonce zbohatnout?

Myslím, že ano. Je to sice pruda, ale pokud nemáte nic lepšího na práci, tak proč by ne. Jen je třeba počítat s tím, že než začne web sypat, tak to chvíli trvá a kdykoliv vás může přes prsty seknout vyhledávač. Prostě vás vykopne z hledání, protože se někomu váš web nebude líbit (a neříkejte, že by vás to překvapilo?). Ale rovnou říkám, že víc jak pár korun vám za měsíc většinou průměrný web nevydělá.

Bilanci bych vyjádřil nějak takhle:

počet webů * zisk z jednoho webu za měsíc – strávený čas (nakolik si jej ceníte) – kolik vás stály registrace = váš zisk z MFA

Pokud tedy mám třeba

  • 100 zaběhaných MFA webů, kdy každý mi
  • vydělá 10 Kč měsíčně a já jsem jejich
  • údržbě věnoval 2 hodiny a
  • hodnota mého času je 500 Kč/hod.
  • Weby běží na zadarmo hostingu

Pak 100*10-500*2=0.  Tedy jsem na 0.

Z toho celkem jasně plyne, že by to chtělo mít webů víc. Tedy za předpokladu, že zisk roste úměrně s počtem stránek a pracnost naopak v poměru k administrovanému počtu MFA klesá.


Steve Jobs a jeho přerostlý iPhone zvaný iPad

„A je to tu“ – chtělo by se říci po tomto týdnu, kdy Apple ve středu 27. 1. 2010 ukázal svou představu o tablet PC, tedy zařízení bez klávesnice s dotykovým displejem. Podobných pokusů už bylo celkem dost, ale vesměs skončily neúspěšně. Na druhou stranu ještě nikdy za těch zhruba 10 let,  co se podobná udělátka čas od času objeví, nebylo očekávání tak velké. Tedy spíš nafouklé.

Malé srovnání.

Asi nemá cenu dělat výčet všech neúspěšných předchůdců od jiných výrobců a tak jsem si vybral jednoho, kterého považuji za velmi zdařilého a to Touch Book od společnosti Always Innovating o kterém se začalo mluvit někdy v březnu 2009. Jasně, každý je trochu jiná váhová, ale možná právě proto stojí za srovnání.

Začneme hezky srovnáním parametrů.

[table id=1 /]

Zjednodušeně lze říct, že Apple už tradičně nabízí nadstandardní výkon pro nadprůměrně náročný OS s komplikovaným rozšiřováním. Perfektní zpracování, slušný design a „vrzat“ jen tak nezačne. Možný problémem, stejně jako u iPhonu, může být programové vybavení, které se zatím relativně těžko shání. Pravdou je, že kdo hledá najde… Těšit se určitě můžeme na skvělý displej, který jistě u jeho menšího bratříčka patří ke špičce na trhu. Ale to je tak pomalu všechno, co mě napadá. Prostě nic extra, co bych hned zítra musel mít. Nemohu se zbavit dojmu, že jde jen o iPhone na sterojdech. Do batohu bych si asi vzal něco levnějšího, výkonnějšího a použitelnějšího.

iPad 3G
iPad 3G

A teď Touch Book. Neznámá firma, která zatím nezískala investora, ale o to teď nejde. Zařízení jako takové je velmi překvapivé díky „modulárnosti“. Dokáže fungovat jako samostatný tablet (bohužel se sníženou výdrží baterie), nebo jako klasický Net Book, kdy se výdrž vyškrábe udajně až na 15 hodin. Zadní kryt displeje je magnetický – zajímavý nápad, ale nevím, kolik hospodyněk si jej pořídí kvůli přilepení na ledničku. Moc jiných způsobů, snad kromě průmyslových, mě nenapadá. USBček má požehnaně. To je jen dobře, vzhledem k tomu, že nemá v základní výbavě paměť s pořádnou kapacitou. Provedení šasí není z nejlepších, display taktéž zaslouží nějaké to vylepšení. A takhle by se ještě chvíli dalo pokračovat.

Jaký je tedy můj závěr, pokud jde o srovnání těchto dvou zařízení?

I přes svou počáteční skepsi bych se asi rozhodl pro iPad i když rozdíl v ceně, kdy tenhle Apple v nejslabší verzi bude stát někde okolo 10000 a Touch Book cca 7500 (oboje v USA). Důvody jsou následující: distribuční síť, dokončené a odladěné řešení, support, kvalita zpracování. Ani jedno z toho Always Innovating nabídnou nemůže (zatím).

A teď trochu obecně:

Jak to ten Apple dělá, že se o něm tak mluví?

Tahle firma dokázala okolo sebe vybudovat jakousi auru. Která říká, že když už něco udělá, tak to je špička. Nejde s hlavním proudem, ale razí si celkem úspěšně vlastní koryto. Když už něco začne dělat, tak to dotáhne, což se rozhodně o konkurenci made by Steve Balmer říct nedá. Apple inovuje – porovnejte pokrok s Windows CE. A je celkem jedno, jestli je to pravda, nebo ne – prostě taková je situace a vnímání. Navíc Apple dokáže provozovat velmi účinný marketing. Lidé prostě o okousaným jabkách rádi mluví.

Má tedy iPad šanci na globální úspěch?

Touch Book

To bych chtěl taky vědět, ale zkusím alespoň dedukovat. Cena říká, že tohle zařízení bude pro 3 skupiny lidí (stejně jako iPhone). První jsou geekové, kteří rádi zkouší a následně i efektivně využívají buď pro práci, nebo zábavu. Druhá jsou mastňáci, kteří sice 80% funkcí nevyužijí, ale chtějí být trendy, free, cool a in – jinak řečeno „trendy frykulíni“. No  třetí jsou zoufalci, kteří si myslí, že když budou mít toho ypáda, tak že jejich společenský level rázem povyroste. Jinými slovy, potenciál tu je, ale asi nepůjde nikdy o masově rozšířené zařízení a ani asi nedosáhne stejné penetrace jako menší bráška iPhone. Ostatně o nějaké globální nadvládě asi mr. Jobs jen sní a sám ví, že sice odvedli pořádný kus práce, ale že to zatím stačit nebude.

Potřebuje lidstvo vlastně tablety?

To, že se za x let nepodařilo nikomu prorazit na poli tabletů naznačuje, že lidé vlastně takové zařízení ani nepotřebují a nechtějí. Ale zas tak černě bych to neviděl. Třeba nikdo nepřišel s ideálním řešením. A až se někdo takový najde, je už je otázkou času, kdy trh rozhoupe. Tomu může napomoct třeba rozvoj 3G sítí a obecně veřejný přístup k Inetu kdykoliv a kdekoliv. No uvidíme, ale zatím jsem spíš skeptický.

Pozn.: v článku byly použity obrázky z oficiálních stránek výrobců apple.com a alwaysinnovating.com

Bing zatím neudržel pozici na českém Internetu

Server Navrcholu.cz zveřejnil vývoj zastoupení vyhledávačů na českém Internetu za uplynulý rok 2009. Kromě jiného vyplývá ze statistik několik zajímavých faktů o vstupu a následném vývoji fulltextového vyhledávání od Microsoftu, Bing v české kotlině.

Pokusme se shrnout a rozklíčovat co se vlastně stalo.

Vývoj podílu Bingu v roce 2009:

  • leden- 1% hledání
  • březen – podíl hledání se zvedá
  • duben – dochází ke stagnaci okolo 2,5%
  • červen – jakési zmítání
  • srpen – propad na téměř původní (lednové) hodnoty na které už zůstane

Kde se taková data dají vyčíst?

Jedním zdrojem mohou být právě statistiky Navrcholu. Druhým a pro mě  osobně sympatičtějším jsou data z Toplistu viz. zastoupení vyhledávačů nad všemi daty Toplistu a statistika jen pro české stránky. Jistě si všimnete rozdílů. A to jak mezi Navrcholu a Toplistem (tady je to věc metodiky, kde skoro víc věřím druhému zmíněnému – je to věc pohledu), ale i českým a obecným toplistem (tady je metodika stejná, ale rozdíl je v tom, že parametr v URL &lang=CZ znamená měření jen nad českými stránkami).

Jak je možný takový rychlý vzestup a proč se tak dlouho udržel?

Důvodů je několik. Pro růst podílu mluví velká světová kampaň a jistě i její virální efekt. Ale za mnohem podstatnější považují dva jiné důvody. A sice zvědavost. Mnoho lidí si ten „skvělý Bing“ chtělo vyzkoušet a druhý (především udržovací) je jistě nástup prohlížeče Internet Explorer 8, který se mohutně začal rozmáhat právě na začátku května 2009, kdy už pomalu začínalo Bingu téct do bot. Dočasná záchrana tedy přišla právě v podobě IE8 a výzvy k nastavení výchozího vyhledávání.

Proč tedy takový pád?

I tady je důvodů hned několik. Jednak uživatelé zjistili, že se nic převratného nekoná a obzvláště ne pro českého uživatele (pro USA snad, ale i o tom pochybuju). Druhak je český internetový uživatel velmi loajální, což dokazuje dlouhodobá dominance searche od Seznamu. No a do třetice, když už jsem nakousnul Seznam, tak ten na přelomu července a srpna začal místo Googlu pro vyhledávání ve světě používat Bing. Jistě se najde mnoho lidí, kteří sice Bing používají, jen si našli jinou cestu – třeba právě přes Seznam.

A ani nástup Exploreru nemohl nástup zachránit – vždyť poměr microsoftích browserů (všech verzí) ku zastoupení prohlížečů Firefog resp. Mozzila Fireox je tak 50 na 50.

Kde tedy udělali Steve Balmer a jeho ovečky chybu?

Po bitvě je každý generálem, přesto si dovolím být kritický. Nevyužití díry v jinak googlem ovládaném trhu je tristní –  tou dírou myslím v dobrém Českou republiku. A samotná reklama by něstačila. Chtělo to se zaměřit na specifika národa, rozjet tu pořádně reklamní a obchodní strategii. Rozpoutat „virální peklo“. A hlavně – přinést něco nového uvnitř, ne jen slušivý kabátek.

Je šance na prosazení nového hledacího hráče v Česku?

Určitě. Je to sice těžké a jistě ne laciné, přesto si myslím, že dobrá služba s dobrou propagací má šanci postupem času dosáhnout třeba na 10% tržního podílu. Důkazem může být Zboží.cz, které je silně tlačeno ze strany Seznamu, ale na druhou stranu to není obecný fulltext. I takto specifický produkt si dokáže urvat k 5%. Ovšem takový cíl je věcí dlouhého běhu.

Bing nechce být velkým bratrem jako Google

V lednu 2010 Bing potažmo Microsoft vydal oficiální prohlášení, že zkrátí dobu, po kterou bude uchovávat informace o uživatelích. Microsoft uvádí, že informace o aktivitě jednotlivých IP adres v současnosti uchovává 18 měsíců. Nově by tato době měla být šest měsíců.

Google data o činnosti a pohybu uživatelských IP na jeho serverech uchovává i déle než 9 měsíců.

Tolik holá fakta. A teď co to znamená a bude znamenat.

K čemu vyhledávače tolik informací potřebují?

Asi hlavním důvodem střádání dat je jejich následné využití k ladění, simulování a statistickým výpočtům. Například, pokud vím, že uživatelé dlouhodobě opomíjejí nějaký odkaz, je třeba se zamyslet, proč to tak je. A přesně tato data vám logy mohou poskytnout. Jistě lze provádět měření ještě před nasazením nějaké změny např. eye trackingem, tvorbou heat map atd., ale až realita může ukázat slabiny.

Asi nejhodnotnější jsou, ale takováto data v upgradu hledacích algoritmů, vždyť, co je lepší než reakce uživatele, pro kterého je hledání vyvíjeno.

Je uchovávání dat fulltexty a portály pro uživatele nebezpečné?

Řekl bych, že normálnímu průměrnému a podprůměrnému uživateli je celkem jedno, zda si někdo někde pamatuje, že včera v noci hledal to a to. Ale jistě existují skupiny lidí, kterým je taková představa nahání husí kůži. Přitom důvod může být různý od čistě principiální roviny až po pragmatický důvod typu: „Nechci, aby někdo byl schopen vytáhnout roky zpětně, že jsem v mládí hledal nelegální stažení mptrojky.“

Je zabezpečení takto citlivých dat dostatečné?

Společnosti typu Microsoft a Google jsou jistě dostatečně dominantní, aby si svá data dokázaly ochránit právně. Lidsky řečeno, pokud nebudou chtít, tak z nich taková data žádný soud na světě nevymámí. Potud bych se nebál, ještě nejsme v Číně.

Mnohem horší zabezpečení se dá očekávat okolo dat samotných. Kde taková data leží? Jsou na discích v serverech, které jsou dostupné z netu? Nebo jsou uloženy pro případ potřeby na páskách někde v sejfu? Kolik existuje kopií? Nepotulují se tato data napříč firmou na „pár“ DVD? Jak se takovéto firmy chrání proti průmyslové špionáži? Co když selže jedinec a data vynese ven, nebo s nimi rovnou začne někoho vydírat?

Normální smrtelník se pravděpodobně odpovědi nikdy nedozví.

Skutečně data budou zcela odstraněna?

Další, celkem zajímavou otázkou je, kdo bude odstranění dat kontrolovat? Přeci do všech poboček Microsoftu nebude pravidelně jednou za x měsíců chodit kontrola a prohledávat datová úložiště. Stejně by nic nenašli – stačí data vhodně zakódovat, zaheslovat nebo prostě fyzicky schovat. Opět můžeme jen spekulovat, zda data opravdu zmizí z povrchu zemského.

Může tedy nějaký server vědět, že přesně já jsem dělal to a to?

Ne. Důvod je prostý, z normálního access logu třeba Apache můžeme vyčíst typicky: IP, navštívenou URL, user agenta, referer (odkud uživatel přišel) a čas. Samy o sobě jsou tato data anonymní. Navíc IP nemusí nutně znamenat konkrétní koncový počítač. Může být za velkou firemní proxy, IP adresa může být přidělena dynamicky, nebo máte doma router a 5 počítačů. Nelze tedy z běžného logu poznat, že se jednalo o konkrétní PC. A už vůbec je složité prokázat, že jste u konkrétního počítače seděli třeba zrovna vy. Síla dat je v jejich množství, jistě z nich jde poskládat monstrózní statistiku.

Čeho se spíš bát?

Spyware – jedno slovo za všechny. Mnohem nebezpečnější než uchovávání vaší aktivity na různých serverech po světě mi přijde infikování přímo vašeho počítače a následné odesílání informací o chování někam „pryč“. Ale to je trochu jiné téma

to co mě zajímá na Internetu