31. 3. 2025
2. část: Novinky v Microsoft Power Platform pro Release Wave 1 2025

Už jste někdy slyšeli pojem „web scraping“? Vězte, že pokud aktivně používáte internet, určitě se s web scrapingem setkáváte v podstatě denně. Pojďme se tedy podívat na to, co to web scraping je, na co se běžně využívá a jaké etické otázky vyvolává.
Web scraping je jednoduše řečeno proces, při kterém robot prochází webové stránky a „vytahuje“ z nich nejrůznější informace. Tato technika umožňuje jednotlivcům i organizacím shromažďovat a analyzovat informace pro různé účely, včetně tržní analýzy a konkurenčního průzkumu. Metoda je široce využívána především v oblastech jako jsou e-commerce, marketing, žurnalistika a další, kde umožňuje rychlou a efektivní analýzu dat dostupných online.
Hlavní výhodou web scrapingu je schopnost rychle a efektivně shromažďovat a analyzovat velké množství dat a informací, které by byly jinak obtížně dostupné nebo by jejich manuální sběr byl časově velmi náročný. Možnosti využití web scrapingu jsou různé – od sběru dat pro tržní analýzy, sledování cen konkurence, vytváření katalogů služeb, porovnávání produktů až třeba po agregaci novinových článků nebo sociálních médií.
Jako běžní uživatelé se tak s web scrapingem setkáte v podstatě pokaždé, když si prohlížíte nějaký produkt na zbožových vyhledávačích, jako jsou Heureka nebo Zboží, porovnáváte si online nabídky např. pojištění automobilu nebo vyhledáváte levné letenky.
Na druhé straně přináší web scraping i určité výzvy. Pokud se o scraping pokouší někdo neopatrný nebo nezkušený, může zasláním přílišného množství dotazů způsobit nechtěné přetížení serverů cílových webových stránek. Uživatel tak poškodí nejen web, který se stane nedostupným, ale i sám sebe, protože se nedostane k požadovaným informacím.
Dalším často diskutovaným tématem jsou etické otázky ohledně používání a sdílení shromážděných dat. Některé weby a portály jsou scrapingu otevřené a poskytují vlastní API pro předání dat, zatímco jiné se snaží tuto praxi omezit nebo zakázat, aby ochránily svá data před konkurencí a možným zneužitím. Zajímavým příkladem jsou e-shopy, které se usilovně brání scrapingu od konkurenčních stránek, ale zároveň jsou otevřené scrapingu od zbožových vyhledávačů, díky kterým jsou více vidět.
Web scraping je tedy nástroj, který šetří spoustu času a lidské práce. Jedná se o typický příklad automatizace, díky kterému můžeme vytvářet neustále aktuální databáze a pracovat s kontextem v rozsahu, který dříve nebyl možný. S těmito daty dále většinou pracuje také umělá inteligence, respektive machine learning modely. Vzhledem ke kontroverzním stránkám scrapingu je ovšem nezbytné přistupovat k této praxi s porozuměním a uvědoměním si všech aspektů, které s jeho používáním souvisí.
Autor: Václav Adamec, Business Operations Director, Gauss Algorithmic