Zpátky Domů

Článek | Zjistil.cz

Český název: Archív webů
Anglický název: Web archiving

Webové archivování Webové archivování je proces sběru částí World Wide Webu s cílem zajistit, aby informace byly uchovány v archivu pro budoucí výzkumníky, historiky a veřejnost. Weboví archiváři obvykle využívají webové prohledávače pro automatické zachycení kvůli masivní velikosti a množství informací na webu. Největší organizací pro webové archivování založenou na přístupu hromadného prohledávání je Wayback Machine, která se snaží udržovat archiv celého webu. Rostoucí část lidské kultury vytvářené a zaznamenávané na webu činí nevyhnutelným, aby se stále více knihoven a archivů muselo potýkat s výzvami webového archivování. Národní knihovny, národní archivy a různá konsorcia organizací se také podílejí na archivaci kulturně významného webového obsahu. Komerční software a služby pro webové archivování jsou také k dispozici organizacím, které potřebují archivovat svůj vlastní webový obsah pro účely firemního dědictví, regulace nebo právních předpisů. Metody webového archivování Existuje několik metod webového archivování, včetně:
Procházení webu: Weboví archiváři používají webové prohledávače k automatickému procházení webu a ukládání kopií webových stránek.
Sběr odkazů: Weboví archiváři mohou také sbírat odkazy z webových stránek a ukládat kopie těchto stránek.
Selektivní ukládání: Weboví archiváři mohou ručně vybrat konkrétní webové stránky nebo části webu, které chtějí archivovat.
Archivace na úrovni stránek: Weboví archiváři mohou archivovat jednotlivé webové stránky, včetně obrázků, videí a dalších souborů.
Archivace na úrovni domény: Weboví archiváři mohou archivovat všechny webové stránky v rámci konkrétní domény. Výzvy webového archivování Webové archivování čelí řadě výzev, včetně:
Velikost webu: Web je masivní a neustále se rozrůstá, což ztěžuje archivaci celého webu.
Dynamický web: Web je dynamický a neustále se mění, což ztěžuje archivaci aktuálních informací.
Vlastnická práva: Weboví archiváři musí respektovat autorská práva a další vlastnická práva na webový obsah.
Financování: Webové archivování je nákladné a vyžaduje významné financování. Budoucnost webového archivování Webové archivování je stále se vyvíjející oblast a existuje řada slibných technologií a přístupů, které by mohly pomoci překonat výzvy webového archivování. Mezi tyto technologie a přístupy patří:
Strojové učení: Strojové učení lze použít k identifikaci a archivaci důležitého webového obsahu.
Distribuované archivování: Distribuované archivování může pomoci snížit náklady na webové archivování a zlepšit spolehlivost.
Archivace na úrovni sítě: Archivace na úrovni sítě může pomoci archivovat celý web, včetně dynamického obsahu. Webové archivování je důležitá oblast, která pomáhá zachovat kulturní dědictví a zajistit, aby informace na webu byly dostupné pro budoucí generace.

Facebook Twitter