Debian Debian je linuxová distribuce složená z bezplatného a otevřeného softwaru a proprietárního softwaru vyvinutého komunitou podporovaným Debian projektem, který byl založen Ianem Murdockem 16. srpna 1993. První verze Debianu (0.01) byla vydána 15. září 1993 a její první stabilní verze (1.1) byla vydána 17. června 1996. Stabilní větev Debianu je nejoblíbenější edicí pro osobní počítače a servery. Debian je také základem pro mnoho dalších distribucí, které mají různé účely, jako Proxmox pro servery, Ubuntu nebo Linux Mint pro desktopy, Kali pro penetrační testování nebo Pardus a Astra pro vládní použití. Debian je jedním z nejstarších operačních systémů založených na jádře Linuxu a od září 2023 druhá nejstarší distribuce Linuxu stále v aktivním vývoji, hned za Slackware. Projekt je koordinován prostřednictvím internetu týmem dobrovolníků vedeným vedoucím Debian projektu a třemi základními dokumenty: Debian Social Contract, Debian Constitution a Debian Free Software Guidelines. Nové distribuce jsou průběžně aktualizovány a další kandidát je vydán po časovém zmrazení. Od svého založení do roku 2022 byl Debian vyvíjen otevřeně a distribuován zdarma podle některých principů projektu GNU. Z tohoto důvodu Free Software Foundation sponzorovala projekt od listopadu 1994 do listopadu 1995. 16. června 1997 založil Debian projekt neziskovou organizaci Software in the Public Interest, aby pokračoval ve finanční podpoře vývoje.
Wapedia byla mobilní verze Wikipedie. Založena byla v srpnu 2004 Florianem Amrheinem a ukončila činnost 4. listopadu 2013. Provozovala ji společnost Taptu. Wapedia byla původně WAP (Wireless Application Protocol) stránka určená pro mobilní telefony z počátku 21. století. URL adresa Wapedie byla http://wapedia.mobi/ (což byl jeden z prvních příkladů .mobi webových stránek). Postupem času byla přidána HTML rozhraní a stránka začala generovat stránky optimalizované pro různá mobilní zařízení, jako jsou smartphony, PDA (osobní digitální asistenti) a tablety. V roce 2009 byly spuštěny dedikované aplikace pro iPhone, Android a WebOS. Wapedia poskytovala články pomocí kombinace chování podobného proxy a lokální databáze článků. Nenabízela možnost editovat stránky. Wapedia vkládala do článků Wikipedie reklamy, a to buď do HTML, nebo do aplikací.
Co je počítačový klastr? Počítačový klastr je soubor počítačů, které pracují společně tak, aby je bylo možné vnímat jako jediný systém. Na rozdíl od počítačových sítí má každý uzel počítačového klastru nastavenou stejnou úlohu, kterou řídí a plánuje software. Nejnovějším projevem počítačového klastru je cloud computing. Komponenty klastru jsou obvykle vzájemně propojeny prostřednictvím rychlých místních sítí, přičemž každý uzel (počítač používaný jako server) spouští vlastní instanci operačního systému. Ve většině případů všechny uzly používají stejný hardware a stejný operační systém, i když v některých nastaveních (například při použití Open Source Cluster Application Resources (OSCAR)) lze na každém počítači použít různé operační systémy nebo různý hardware. Klastry se obvykle nasazují za účelem zvýšení výkonu a dostupnosti oproti jednomu počítači, přičemž jsou obvykle mnohem nákladově efektivnější než jednotlivé počítače srovnatelné rychlosti nebo dostupnosti. Počítačové klastry vznikly v důsledku konvergence řady trendů v oblasti výpočetní techniky, včetně dostupnosti levných mikroprocesorů, vysokorychlostních sítí a softwaru pro vysoce výkonné distribuované výpočty. Mají širokou škálu použitelnosti a nasazení, od klastrů malých podniků s několika málo uzly až po některé z nejrychlejších superpočítačů na světě, jako je Sequoia od IBM. Před příchodem klastrů byly používány jednoprocesorové odolné proti chybám mainframy s modulární redundancí, ale nižší počáteční náklady na klastry a zvýšená rychlost síťové struktury zvýhodnily přijetí klastrů. Na rozdíl od vysoce spolehlivých mainframů jsou klastry levnější pro škálování, ale také mají zvýšenou složitost v oblasti zpracování chyb, protože v klastrech nejsou režimy chyb neprůhledné pro běžící programy.
Co je to cache?
Cache je hardwarová nebo softwarová komponenta, která ukládá data, aby budoucí požadavky na tato data mohly být obsluhovány rychleji. Data uložená v cache mohou být výsledkem předchozího výpočtu nebo kopií dat uložených jinde.
Jak funguje cache?
Když počítač požaduje data, nejprve zkontroluje, zda jsou tato data v cache. Pokud ano, jedná se o cache hit a data jsou poskytnuta z cache. Pokud data v cache nejsou, jedná se o cache miss a data musí být načtena z pomalejšího úložiště, jako je pevný disk.
Proč je cache důležitá?
Cache je důležitá, protože umožňuje počítači poskytovat data rychleji, než kdyby je musel znovu vypočítávat nebo načítat z pomalejšího úložiště. To může výrazně zlepšit výkon počítače, zejména u aplikací, které často přistupují ke stejným datům.
Typy cache
Existují různé typy cache, včetně:
CPU cache: Cache, která je integrovaná do procesoru. Je nejrychlejší typ cache, ale také nejmenší.
Paměťová cache: Cache, která je umístěna na základní desce. Je větší než CPU cache, ale pomalejší.
Disková cache: Cache, která je umístěna na pevném disku. Je největší typ cache, ale také nejpomalejší.
Jak optimalizovat cache
Existuje několik způsobů, jak optimalizovat cache, včetně:
Zvýšení velikosti cache: Větší cache může pojmout více dat, což vede k vyšší míře cache hitů.
Použití vícenásobných úrovní cache: Použití více úrovní cache umožňuje počítači rychleji přistupovat k datům, která jsou nejčastěji používána.
Použití algoritmů nahrazování: Algoritmy nahrazování určují, která data budou odstraněna z cache, když je potřeba přidat nová data. Správný algoritmus nahrazování může zlepšit míru cache hitů.
Závěr
Cache je důležitá komponenta počítačového systému, která může výrazně zlepšit výkon počítače. Správným používáním a optimalizací cache mohou uživatelé maximalizovat rychlost a výkon svých počítačů.
Powerset Powerset byla americká společnost se sídlem v San Francisku v Kalifornii, která v roce 2006 vyvíjela vyhledávač přirozeného jazyka pro internet. 1. července 2008 byla společnost Powerset získána společností Microsoft za odhadovaných 100 milionů dolarů (~134 milionů dolarů v roce 2022). Powerset pracoval na vytvoření vyhledávače přirozeného jazyka, který by dokázal najít cílené odpovědi na otázky uživatelů (na rozdíl od vyhledávání založeného na klíčových slovech). Například při dotazu jako „Který stát USA má nejvyšší daň z příjmu?“ konvenční vyhledávače ignorují formulaci otázky a místo toho vyhledávají klíčová slova „stát“, „nejvyšší“, „příjem“ a „daň“. Powerset se na druhou stranu snaží porozumět podstatě otázky pomocí zpracování přirozeného jazyka a vrátit stránky obsahující odpověď. Společnost byla v procesu „vytváření vyhledávače přirozeného jazyka, který čte a rozumí každé větě na webu“. Společnost licencovala technologii přirozeného jazyka od PARC, bývalého Xerox Palo Alto Research Center. 11. května 2008 společnost představila nástroj pro vyhledávání v pevné podmnožině anglické Wikipedie pomocí hovorových frází namísto klíčových slov. Akvizice společností Microsoft Jedním z významných milníků v historii Powersetu byla jeho akvizice společností Microsoft 1. července 2008 za odhadovaných 100 milionů dolarů. Tato akvizice byla součástí širší strategie společnosti Microsoft zlepšit své vyhledávací schopnosti a efektivněji konkurovat jiným poskytovatelům vyhledávačů, zejména Googlu. Vyhledávač přirozeného jazyka Hlavním zaměřením Powersetu bylo vyvinout vyhledávač přirozeného jazyka schopný porozumět a interpretovat uživatelské dotazy více lidským způsobem. Místo pouhého porovnávání klíčových slov se Powerset snažil pochopit význam slov, což umožnilo přesnější a kontextově relevantnější výsledky vyhledávání. Technologie a partnerství Powerset licencoval technologii přirozeného jazyka od PARC, Xerox Palo Alto Research Center. Tato technologie pravděpodobně hrála zásadní roli ve vývoji NLP schopností Powersetu. Vyhledávací nástroj Wikipedie V květnu 2008 představil Powerset vyhledávací nástroj, který uživatelům umožňoval vyhledávat v pevné podmnožině anglické Wikipedie pomocí hovorových frází namísto tradičních klíčových slov. To demonstrovalo potenciál technologie NLP společnosti Powerset při poskytování přesnějších a relevantnějších výsledků vyhledávání.
Microsoft Bing Úvod Microsoft Bing, běžně označovaný jako Bing, je vyhledávač vlastněný a provozovaný společností Microsoft. Služba má své kořeny v dřívějších vyhledávačích společnosti Microsoft, včetně MSN Search, Windows Live Search a Live Search. Bing nabízí široké spektrum vyhledávacích služeb, které zahrnují produkty pro vyhledávání na webu, videa, obrázků a map, které jsou všechny vyvinuty pomocí ASP.NET. Historie Přechod z Live Search na Bing oznámil generální ředitel společnosti Microsoft Steve Ballmer 28. května 2009 na konferenci All Things Digital v San Diegu v Kalifornii. Oficiální vydání následovalo 3. června 2009. Bing představil při svém vzniku několik pozoruhodných funkcí, jako jsou návrhy vyhledávání během zadávání dotazu a seznam souvisejících vyhledávání, známý jako 'panel Průzkum'. Tyto funkce využívaly sémantickou technologii od společnosti Powerset, kterou společnost Microsoft získala v roce 2008. Microsoft také uzavřel dohodu se společností Yahoo!, která vedla k tomu, že Bing poháněl vyhledávání Yahoo!. Pokrok a inovace Microsoft učinil v roce 2016 významné kroky směrem k open-source technologiím, když otevřel zdrojový kód algoritmu indexování vyhledávače BitFunnel a různých komponentů Bingu. V únoru 2023 společnost Microsoft spustila Bing Chat (později přejmenovaný na Microsoft Copilot), zážitek chatbota s umělou inteligencí založený na GPT-4, který byl integrován přímo do vyhledávače. Ten byl dobře přijat a Bing dosáhl v následujícím měsíci 100 milionů aktivních uživatelů. Současný stav K roku 2023 je Bing druhým největším vyhledávačem na světě s objemem dotazů 12 %, zaostává za Googlem s 79 %. Dalšími konkurenty jsou Baidu s 5 % a Yahoo! Search, který je z velké části poháněn Bingem, s 2 %.
Omniscriptum Publishing Group Omniscriptum Publishing Group, dříve známá jako VDM Verlag Dr. Müller, je německá vydavatelská skupina se sídlem v Rize v Lotyšsku. Byla založena v roce 2002 v Düsseldorfu a její knižní produkce je založena na technologii tisku na objednávku. Společnost vydává disertační práce, výzkumné zprávy a habilitační práce prostřednictvím svých internetových knihkupectví. Její vydavatelské metody byly zpochybňovány kvůli tomu, že vyžadovala rukopisy od jednotlivců a poskytovala autorům zdání historie recenzovaného vydávání. Omniscriptum je norskou vědeckou indexací označována jako neakademická a její dceřiná společnost Lambert Academic Publishing byla popsána jako predátorský „vanity press“, který „nepoužívá základní standardy akademického publikování, jako je recenzní řízení, redakční nebo korektorské procesy.“ Společnost také nabízí tisk na objednávku pro autory beletrie. Dříve se specializovala na vydávání a prodej článků z Wikipedie, ale uvedla, že praxe publikování obsahu z Wikipedie skončila v roce 2013.
Sémantický web
Sémantický web, někdy známý jako Web 3.0 (neplést s Web3), je rozšířením World Wide Webu prostřednictvím standardů stanovených World Wide Web Consortium (W3C). Cílem sémantického webu je učinit data na internetu strojově čitelná.
K umožnění kódování sémantiky pomocí dat se používají technologie, jako je Resource Description Framework (RDF) a Web Ontology Language (OWL). Tyto technologie se používají k formálnímu znázornění metadat. Ontologie může například popisovat pojmy, vztahy mezi entitami a kategorie věcí. Tato vložená sémantika nabízí významné výhody, jako je uvažování nad daty a práce s heterogenními zdroji dat.
Tyto standardy podporují běžné formáty dat a výměnné protokoly na webu, v zásadě RDF. Podle W3C „Sémantický web poskytuje společný rámec, který umožňuje sdílení a opětovné použití dat napříč hranicemi aplikací, podniků a komunit.“ Sémantický web je proto považován za integrátor mezi různými aplikacemi a systémy obsahu a informací.
Tento termín vymyslel Tim Berners-Lee pro web dat (nebo datový web), který mohou zpracovávat stroje – tj. takový, ve kterém je velká část významu strojově čitelná. Zatímco jeho kritici zpochybňovali jeho proveditelnost, zastánci tvrdí, že aplikace v knihovní a informační vědě, průmyslu, biologii a výzkumu v humanitních vědách již prokázaly platnost původního konceptu.
Berners-Lee původně vyjádřil svou vizi sémantického webu v roce 1999 takto:
„Mám sen o webu, ve kterém se počítače stanou schopnými analyzovat všechna data na webu – obsah, odkazy a transakce mezi lidmi a počítači. „Sémantický web“, který to umožní, ještě nevznikl, ale až vznikne, každodenní mechanismy obchodu, byrokracie a našeho každodenního života budou řešeny stroji, které mluví se stroji. „Inteligentní agenti“, o kterých lidé dlouho mluví, se konečně zhmotní.“
Článek Scientific American z roku 2001 od Berners-Leeho, Hendlera a Lassila popsal očekávaný vývoj stávajícího webu na sémantický web. V roce 2006 Berners-Lee a jeho kolegové uvedli: „Tato jednoduchá myšlenka... zůstává do značné míry nerealizovaná“. V roce 2013 obsahovalo více než čtyři miliony webových domén (z celkového počtu přibližně 250 milionů) sémantický webový markup.
Charakteristiky sémantického webu:
Strojově čitelná data: Data na sémantickém webu jsou strojově čitelná, což znamená, že je mohou počítače zpracovávat a interpretovat bez lidského zásahu.
Formální ontologie: Sémantický web používá formální ontologie k definování pojmů a vztahů mezi nimi. To umožňuje počítačům porozumět významu dat a provádět logické úsudky.
Výměnné protokoly: Sémantický web používá výměnné protokoly, jako je RDF, k reprezentaci a výměně dat mezi různými aplikacemi a systémy.
Globální dosah: Sémantický web je navržen tak, aby měl globální dosah, což umožňuje sdílení a opětovné použití dat napříč různými hranicemi.
Výhody sémantického webu:
Zvýšená interoperabilita: Sémantický web umožňuje bezproblémovou interoperabilitu mezi různými aplikacemi a systémy, což usnadňuje výměnu a sdílení dat.
Zlepšené vyhledávání: Strojově čitelná data na sémantickém webu umožňují pokročilejší vyhledávací nástroje, které mohou poskytovat přesnější a relevantnější výsledky.
Automatizace úloh: Sémantický web umožňuje automatizaci úloh, jako je extrakce dat, analýza a rozhodování, což může zvýšit efektivitu a ušetřit čas.
Personalizovaný obsah: Sémantický web umožňuje personalizovaný obsah na základě uživatelských preferencí a kontextu, což vede k vylepšenému uživatelskému prostředí.
Nové obchodní příležitosti: Sémantický web vytváří nové obchodní příležitosti pro společnosti, které vyvíjejí aplikace a služby založené na sémantických technologiích.
Aplikace sémantického webu:
Knihovny a informační věda: Sémantický web se používá ke katalogizaci a organizaci knihovních zdrojů, což umožňuje snadnější vyhledávání a objevování.
Průmysl: Sémantický web se používá ke zlepšení řízení dodavatelského řetězce, údržby zařízení a řízení znalostí.
Biologie: Sémantický web se používá k integraci a analýze biologických dat, což umožňuje nové objevy ve výzkumu.
Humanitní vědy: Sémantický web se používá ke studiu a analýze historických a kulturních dokumentů, což umožňuje nové pohledy na minulost.
Vláda: Sémantický web se používá ke zlepšení transparentnosti a odpovědnosti vládních organizací.
Výzvy sémantického webu:
Složitost: Sémantické technologie mohou být složité na implementaci a údržbu, což představuje výzvu pro jejich široké přijetí.
Nedostatek standardů: I přes úsilí W3C stále existují některé neshody ohledně sémantických standardů, což může bránit interoperabilitě.
Omezená adopce: Přijetí sémantického webu je stále relativně omezené, což může ztížit jeho široké použití.
Náklady: Implementace a údržba sémantických technologií může být nákladná, což představuje překážku pro některé organizace.
Nedostatek kvalifikovaných odborníků: Existuje nedostatek kvalifikovaných odborníků se znalostmi sémantických technologií, což může omezit jejich vývoj a implementaci.
Budoucnost sémantického webu:
Přestože sémantický web ještě nedosáhl svého plného potenciálu, má slibnou budoucnost. Pokračující vývoj sémantických technologií a standardů, stejně jako rostoucí poptávka po strojově čitelných datech, pravděpodobně povede k širšímu přijetí sémantického webu v různých oblastech.
DBpedia
DBpedia je projekt, jehož cílem je extrahovat strukturovaný obsah z informací vytvořených v rámci projektu Wikipedia. Tyto strukturované informace jsou zpřístupněny na World Wide Webu pomocí OpenLink Virtuoso. DBpedia umožňuje uživatelům sémanticky dotazovat vztahy a vlastnosti zdrojů Wikipedie, včetně odkazů na jiné související datové sady. V roce 2008 Tim Berners-Lee popsal DBpedia jako "jeden z nejslavnějších" kousků decentralizovaného úsilí Linked Data.
Historie
DBpedia byla poprvé vydána 10. ledna 2007 a byla vyvinuta na Univerzitě v Lipsku a Univerzitě v Mannheimu. Projekt byl původně založen na ontologii YAGO (Yet Another Great Ontology), která byla vyvinuta v Max-Planckově institutu pro informatiku. V roce 2008 byla DBpedia integrována do platformy Linked Data a stala se jednou z jejích základních datových sad.
Data
Data DBpedia jsou extrahována z infoboxů a šablon článků Wikipedie. Infoboxy jsou tabulky, které se obvykle nacházejí v pravém horním rohu článků Wikipedie a obsahují stručné informace o tématu článku. Šablony jsou kódy, které se používají k formátování článků Wikipedie a mohou také obsahovat strukturovaná data.
Data DBpedia jsou rozdělena do několika kategorií, včetně:
Lidé: informace o lidech, jako je jejich jméno, datum narození, povolání a vzdělání
Místa: informace o místech, jako je jejich název, poloha a populace
Věci: informace o věcech, jako je jejich název, popis a funkce
Události: informace o událostech, jako je jejich název, datum a místo
Použití
Data DBpedia lze použít pro širokou škálu aplikací, včetně:
Výzkum: DBpedia lze použít k provádění výzkumu v různých oblastech, jako je historie, geografie a sociologie.
Vývoj aplikací: Data DBpedia lze použít k vývoji aplikací, jako jsou vyhledávače, mapové aplikace a sociální sítě.
Vzdělávání: Data DBpedia lze použít k výuce studentů o různých tématech, jako je historie, geografie a věda.
Licence
Data DBpedia jsou licencována pod licencí GNU General Public License (GPL). To znamená, že data lze svobodně používat, sdílet a upravovat, ale pokud jsou data upravována, musí být upravená data také licencována pod licencí GPL.
Budoucnost
DBpedia je neustále vyvíjený projekt a budoucí plány zahrnují:
Rozšíření pokrytí DBpedia tak, aby zahrnovalo více jazyků a oblastí znalostí
Zlepšení kvality a přesnosti údajů DBpedia
Vývoj nových nástrojů a aplikací pro práci s daty DBpedia
DBpedia je důležitým zdrojem pro sémantický web a má potenciál být ještě užitečnější v budoucnosti.
Openmoko je ukončený projekt, jehož cílem bylo vytvořit řadu mobilních telefonů, které jsou open source, včetně hardwarové specifikace, operačního systému (Openmoko Linux) a skutečné implementace vývoje smartphonů, jako jsou Neo 1973 a Neo FreeRunner. Celý projekt sponzorovala společnost Openmoko Inc. Prvním dílčím projektem byl Openmoko Linux, operační systém založený na Linuxu určený pro mobilní telefony, postavený pomocí svobodného softwaru. Druhým dílčím projektem byl vývoj hardwarových zařízení, na kterých běží Openmoko Linux. Prvním vydaným zařízením byl Neo 1973 v roce 2007, po kterém následoval Neo FreeRunner 25. června 2008. 2. dubna 2009 Openmoko pozastavilo vývoj svého třetího zařízení s kódovým označením GTA03, aby se zaměřilo na FreeRunner. V roce 2010 pokračoval vývoj GTA03 společností Golden Delicious Computers pod novým kódovým označením GTA04, který zahrnuje hlavní hardwarovou revizi, a první jednotka byla dodána 10. října 2011. Na rozdíl od většiny ostatních platforem mobilních telefonů jsou tyto telefony navrženy tak, aby poskytovaly koncovým uživatelům možnost upravovat operační systém a softwarový stack. K dispozici jsou také další telefony podporované společností Openmoko.