Získávání dat
Co to znamená:
Získávání dat je proces, kdy shromažďujeme informace z různých zdrojů.
Příklady ve světě a počítači:
Měření teploty senzorem nebo počítání návštěvníků ve škole.
Stahování dat z internetu (např. počasí, statistiky, články).
Zadávání informací do počítače (např. vyplnění formuláře).
Co je dobré vědět:
Data mohou být číselná, textová, obrázky, video, zvuk.
Data mohou být strukturovaná (tabulka, databáze) nebo nestrukturovaná (texty, obrázky).
Vyhledávání dat
Co to znamená:
Vyhledávání je proces hledání konkrétních informací mezi velkým množstvím dat.
Jak se to děje:
V počítači – pomocí vyhledávačů (Google, Seznam) nebo databázových dotazů.
V knihovně – podle názvu, autora nebo klíčových slov.
V tabulkách – filtrování nebo hledání určité hodnoty.
Co je dobré vědět:
Klíčová je efektivita – rychle najít přesně to, co potřebujeme.
Při vyhledávání je důležité znát správná klíčová slova a rozlišovat spolehlivé zdroje.
V počítači se používají algoritmy pro vyhledávání, např. binární vyhledávání v seřazených datech.
Ukládání dat
Co to znamená:
Ukládání dat je proces, kdy informace zůstávají dostupné pro pozdější použití.
Způsoby uložení:
Na pevný disk, SSD nebo USB.
V databázích, například pro školy, knihovny nebo e-shopy.
V cloudu (Google Drive, OneDrive).
Co je dobré vědět:
Data mohou být dočasná (RAM) nebo trvalá (disk, cloud).
Důležitá je organizace dat – složky, názvy souborů, zálohy.
Bezpečnost dat – hesla, šifrování, ochrana proti ztrátě.
Shrnutí
Student by měl:
Vědět, co jsou data a jak se liší typy dat.
Rozumět, jak data získat – měření, zadání, stahování.
Umět data vyhledávat – efektivně a s rozlišením spolehlivosti.
Znát principy ukládání – trvalé vs. dočasné, organizace, bezpečnost.
Mít povědomí o základních nástrojích – tabulky, databáze, soubory, vyhledávače.
Jak vyhledávače fungují
Vyhledávač má tři části:
- Prohledávání/procházení webu (crawler, spider, robot)
prochází celý web, odkazy na nalezené stránky ukládá na servery - Indexování (prohlížení a řazení stažených stránek)
jaká slova se za nalezených stránkách nacházi nejčastěji, řazení podle celé řady kritérií - Hodnocení a zobrazování adres stránek z indexu (cca 0,5 s)
hledá ve svém indexu adresy stránek obsahující hledaná slova, provádí hodnocení (vč. jazyka, polohy apod.)
Google, Bing, Seznam, Baidu
náklady na vyhledávač - miliardy dolarů - placeno reklamou
Vyhledávače neustále procházejí celý web předem, aby zaznamenaly informace, které mohou později pomoci při vašem vyhledávání.
Internet je síť stránek navzájem propojených hypertexzovými odkazy. Vyhledávač má neustále spuštěný program (pavouk), který těmito weby prochází aby o nich shromáždil informace, následuje všechy nalezené hypertextové odkazy. Potřebné informace zaznamenává do tzv. indexu (vyhledávacího indexu - spec. databáze)
Základ vyhledávačů - vyhledávací algoritmus, využití strojového učení, AI
Výsledek hledání:
- počet stránek, doba hledání v indexu
- URL stránky - doménu
- Titul - nadpis nalezené stránky
- Ukázka obsahu
- Reklama - info
přesná fráze (sousloví) - text v uvozovkách
vyloučení pojmu z vyhledávání: ˗̶ před vyhledávaným slovem
období, kdy stránky vznikly
typ souboru, který má vyhledávač najít: filetype:pdf (pptx, docx, xlsx,...)
web, na kterém se mají informace hledat: site:theses.cz (web, který sám nemá žádné vyhledávání)
vyhledání populárních témat podle tzv. hashtagu: # [Příklad: #volby2025]
spojení dvou slov: _
nahrazení slova: * (nejlépe v kombinaci s uvozovkami)
stránky, které odkazují na určitou stránku: link:
stránky podobné adrese URL: related:
stránky, které mohou obsahovat jen jedno z několika slov: OR (velkými písmeny)
informace o adrese URL: info:
jak stránka vypadala, když ji Google naposledy procházel: cache:
libovolné kombinace předchozího
>nástroje > rozšířené vyhledávání
https://www.google.cz/advanced_search (pokročilé vyhledávání)
https://www.google.cz/advanced_image_search (pokročilé vyhledávání obrázků)
FILTRY: Webové stránky
- Jazyk
- Oblast
- Poslední aktualizace
- Web nebo doména
- Výskyt výrazů na stránce
- Bezpečné vyhledávání
- Úroveň čtení
- Typ souboru
- Práva k užití (najít stránky, které jste oprávněni používat)
- Velikost
- Poměr stran
- Barva
- Typ (obličej, animovaný apod.)
- Web nebo doména
- Typ souboru
- Bezpečné vyhledávání
- Práva k užití (najít obrázky, které jste oprávněni používat)
Zapamatuj:
VYHLEDÁVÁNÍ
sousloví - fráze v úvozovkách- nástroje -
kombinace - např. "Karel Čapek" se narodil
vyloučení pojmu z vyhledávání - např: "Josef Čapek" -Karel
období, kdy stránky vznikly
typ souboru - např: "Josef Čapek" filetype:PDF
PDF, PPTX, DOCX, XLSX apod.
určení webu - např. "Karel Čapek" site:theses.cz
lze prohledat i web, který nemá vyhledávací pole
>nástroje > rozšířené vyhledávání