Jak může vidět stránku vyhledávač

Napadlo vás někdy, jak může robot nebo indexer nějakého vyhledávače vidět webovou stránku? Tohle malé udělátko, které jsem pojmenoval vznešeně „highLighter“ vám to může malinko přiblížit.


Zvýrazňovač slov textu – highLighter

Co to vlastně dělá?

Kromě nějakého obalu, který se stará o stahování a parsování stránky nebo textu (které není nejdokonalejší, tak buďte prosím shovívaví), jde o vyhodnocení počtu slov na stránce a následnou vizualizaci, která má znázornit optickou nasycenost textu jednotlivými slovy.

Slova nejsou nijak lemmatizována, skloňována a není ani nijak zohledňě slovní druh. V podstatě se jen odstraní diakritika a znaky, které nepatří mezi alfanumerické.

Pokud jde o samotný výpočet, pak vězte, že jde o prosté procentuální zastoupení jednotlivých slov v celku. Definována je minimální a maximální velikost. Ještě jsem zkoušel i nějaké barevné odlišení, ale výstup mi přišel spíš zašuměný a tak zbyla obyčejná černá varianta s různou velikostí.

Prostě žádný zázrak, ale občas se člověk nestíhá divit.