Automatické vyhľadávanie informácií na internete. Profesionálne vyhľadávanie informácií na internete

Čo je to

DuckDuckGo je pomerne známy open source vyhľadávací nástroj. zdrojový kód... Servery sa nachádzajú v USA. Vyhľadávač okrem vlastného robota používa aj výsledky ďalších zdrojov: Yahoo, Bing, Wikipedia.

Lepšie

DuckDuckGo sa umiestňuje ako vyhľadávací nástroj, ktorý poskytuje maximálne súkromie a dôvernosť. Systém nezhromažďuje žiadne údaje o používateľoch, neuchováva denníky (žiadna história vyhľadávania), používanie cookiesčo najviac obmedzený.

DuckDuckGo nezhromažďuje ani nezdieľa osobné informácie od používateľov. Toto sú naše zásady ochrany osobných údajov.

Gabriel Weinberg, zakladateľ DuckDuckGo

Prečo to potrebuješ

Všetky hlavné vyhľadávače sa pokúšajú prispôsobiť výsledky vyhľadávania na základe údajov o osobe pred monitorom. Tento jav sa nazýva „filtračná bublina“: používateľ vidí iba tie výsledky, ktoré súhlasia s jeho preferenciami alebo ktoré za ne systém považuje.

Vytvára objektívny obraz, ktorý nezávisí od vášho predchádzajúceho správania na webe, a na základe vašich dopytov sa zbavuje tematickej reklamy Google a Yandex. DuckDuckGo uľahčuje vyhľadávanie informácií v cudzích jazykoch, zatiaľ čo Google a Yandex predvolene uprednostňujú stránky v ruskom jazyku, aj keď je požiadavka zadaná v inom jazyku.


Čo je to

not Evil je vyhľadávací nástroj pre anonymnú sieť Tor. Ak ju chcete používať, musíte ísť do tejto siete, napríklad spustením špecializovanej siete.

not Evil nie je jediným vyhľadávacím nástrojom svojho druhu. K dispozícii je LOOK (predvolené vyhľadávanie v prehliadači Tor, prístupné z bežného internetu) alebo TORCH (jeden z najstarších vyhľadávacích nástrojov v sieti Tor) a ďalšie. Na jednoznačnom náznaku Googlu sme sa usadili na platforme Not Evil (stačí sa pozrieť na úvodnú stránku).

Lepšie

Vyhľadávania, kde sú v zásade zatvorené vyhľadávacie nástroje Google, Yandex a ďalšie.

Prečo to potrebuješ

V sieti Tor je veľa zdrojov, ktoré sa nedajú nájsť na internete, ktorý dodržiava zákony. A ich počet bude narastať, pretože vláda sprísňuje kontrolu nad obsahom webu. Tor je druh siete v rámci siete s vlastnými sociálnymi sieťami, nástrojmi na sledovanie torrentov, médiami, trhmi, blogmi, knižnicami atď.

3. YaCy

Čo je to

YaCy je decentralizovaný vyhľadávací nástroj založený na sieťach P2P. Každý počítač, na ktorom je nainštalovaný hlavný softvérový modul, skenuje internet nezávisle, to znamená, že je analógom vyhľadávacieho robota. Získané výsledky sa zhromažďujú v spoločnej databáze, ktorú používajú všetci účastníci YaCy.

Lepšie

Je ťažké povedať, či je to tu lepšie alebo horšie, pretože YaCy je úplne iný prístup k organizácii vyhľadávania. Absencia jediného servera a vlastníka spoločnosti robí výsledky úplne nezávislými na preferenciách niekoho. Autonómia každého uzla vylučuje cenzúru. YaCy je schopný prehľadávať hlboký web a neindexované verejné siete.

Prečo to potrebuješ

Ak ste zástancom open source softvéru a bezplatného internetu, na ktorý nemajú vplyv vládne agentúry a veľké korporácie, potom je YaCy vašou voľbou. Možno ho použiť aj na organizovanie vyhľadávaní v rámci podnikovej alebo inej autonómnej siete. A aj keď YaCy nie je v každodennom živote veľmi užitočný, z hľadiska procesu vyhľadávania je dôstojnou alternatívou k Googlu.

4. Pipl

Čo je to

Pipl je systém určený na vyhľadávanie informácií o konkrétnej osobe.

Lepšie

Autori Pipl tvrdia, že ich špecializované algoritmy hľadajú efektívnejšie ako „bežné“ vyhľadávače. Prioritou sú predovšetkým profily. sociálne siete, komentáre, zoznamy účastníkov a rôzne databázy, kde sú zverejnené informácie o osobách, napríklad databázy súdnych rozhodnutí. Vedenie spoločnosti Pipl v tejto oblasti potvrdzujú hodnotenia spoločností Lifehacker.com, TechCrunch a ďalších publikácií.

Prečo to potrebuješ

Ak potrebujete nájsť informácie o osobe žijúcej v USA, bude Pipl oveľa efektívnejší ako Google. Databázy ruských súdov sú pre vyhľadávač zrejme neprístupné. Preto sa s občanmi Ruska tak dobre nevyrovnáva.

Čo je to

FindSounds je ďalší špecializovaný vyhľadávací nástroj. Hľadá v otvorených zdrojoch rôzne zvuky: dom, príroda, autá, ľudia atď. Táto služba nepodporuje dotazy v ruštine, ale existuje pôsobivý zoznam značiek v ruskom jazyku, ktoré môžete vyhľadávať.

Lepšie

Výsledkom sú iba zvuky a nič viac. V nastaveniach môžete nastaviť požadovaný formát a kvalitu zvuku. Všetky nájdené zvuky sú k dispozícii na stiahnutie. Existuje vyhľadávanie vzorov.

Prečo to potrebuješ

Ak potrebujete rýchlo nájsť zvuk výstrelu z muškety, rany sajúceho ďatľa alebo krik Homera Simpsona, potom je táto služba pre vás. A vybrali sme to iba z dostupných požiadaviek v ruskom jazyku. Zapnuté anglický jazyk spektrum je ešte širšie.

Vážne, špecializovaná služba predpokladá špecializované publikum. Ale čo keď to príde vhod?

Čo je to

Wolfram | Alpha je počítačový vyhľadávací nástroj. Namiesto odkazov na články obsahujúce Kľúčové slová, dáva pripravenú odpoveď na požiadavku užívateľa. Ak napríklad zadáte do vyhľadávacieho formulára „porovnať populácie New Yorku a San Francisca“ v angličtine, Wolfram | Alpha okamžite zobrazí tabuľky a grafy s porovnaním.

Lepšie

Táto služba je na hľadanie faktov a výpočet údajov lepšia ako ostatné. Wolfram | Alpha zbiera a organizuje znalosti dostupné na webe z rôznych oblastí vrátane vedy, kultúry a zábavy. Ak táto databáza obsahuje pripravenú odpoveď na vyhľadávací dotaz, systém ju zobrazí; ak nie, vypočíta a zobrazí výsledok. V tomto prípade používateľ vidí iba a nič nadbytočné.

Prečo to potrebuješ

Ak ste napríklad študent, analytik, novinár alebo vedecký pracovník, môžete pomocou Wolfram | Alpha nájsť a vypočítať údaje súvisiace s vašou prácou. Služba nerozumie všetkým požiadavkám, ale neustále sa vyvíja a je múdrejšia.

Čo je to

Metasearch engine Dogpile zobrazuje kombinovaný zoznam výsledkov vyhľadávania z Google, Yahoo a ďalších obľúbených vyhľadávacích nástrojov.

Lepšie

Po prvé, Dogpile zobrazuje menej reklám. Za druhé, služba používa špeciálny algoritmus na nájdenie a zobrazenie najlepších výsledkov z rôznych vyhľadávacích nástrojov. Podľa vývojárov Dogpile ich systém generuje najkompletnejšie výsledky vyhľadávania na celom internete.

Prečo to potrebuješ

Ak nemôžete nájsť informácie v službe Google alebo inom štandardnom vyhľadávacom nástroji, vyhľadajte ich vo viacerých vyhľadávacích nástrojoch naraz pomocou služby Dogpile.

Čo je to

BoardReader je systém pre textové vyhľadávanie na fórach, v službách Q&A a ďalších komunitách.

Lepšie

Služba vám umožňuje zúžiť vyhľadávacie pole na sociálne platformy... Vďaka špeciálnym filtrom môžete rýchlo nájsť príspevky a komentáre, ktoré vyhovujú vašim kritériám: jazyk, dátum vydania a názov stránky.

Prečo to potrebuješ

BoardReader môže byť užitočný pre PR špecialistov a ďalších mediálnych profesionálov, ktorí sa zaujímajú o hromadné názory na určité problémy.

Konečne

Život alternatívnych vyhľadávacích nástrojov je často pominuteľný. Spoločnosť Lifehacker sa pýtala Sergeja Petrenka, bývalého generálneho riaditeľa ukrajinskej pobočky spoločnosti Yandex, na dlhodobú perspektívu takýchto projektov.


Sergej Petrenko

Bývalý generálny riaditeľ Yandex. Ukrajina.

Pokiaľ ide o osud alternatívnych vyhľadávacích nástrojov, je to jednoduché: byť veľmi špecializovanými projektmi s malým publikom, bez jasných obchodných perspektív, alebo naopak s úplnou jasnosťou ich absencie.

Ak sa pozriete na príklady v článku, môžete vidieť, že tieto vyhľadávače sa špecializujú buď na úzky, ale žiadaný výklenok, ktorý, možno len doteraz, nevyrástol natoľko, aby bol viditeľný na radaroch Google alebo Yandex, alebo testujú pôvodná hypotéza v rebríčku. ktorá zatiaľ nie je použiteľná v bežnom vyhľadávaní.

Ak sa napríklad zrazu ukáže, že je hľadanie na Tor žiadané, to znamená, že výsledky odtiaľ budú potrebné aspoň pre percento publika Google, potom bežné vyhľadávače samozrejme začnú riešiť problém ako ich nájsť a ukázať používateľovi. Ak správanie publika ukazuje, že výsledky sa zdajú byť relevantnejšie pre viditeľný podiel používateľov v značnom počte dopytov, údajov bez zohľadnenia faktorov závislých od používateľov, potom Yandex alebo Google začnú poskytovať takéto výsledky.

„Byť lepší“ v kontexte tohto článku neznamená „byť lepší vo všetkom“. Áno, v mnohých ohľadoch sú naši hrdinovia ďaleko od Yandexu (dokonca aj Bing je ďaleko). Ale na druhej strane, každá z týchto služieb dáva užívateľovi niečo, čo giganti vyhľadávacieho priemyslu nedokážu ponúknuť. Určite poznáte aj vy podobné projekty. Podeľte sa s nami - budeme diskutovať.

Úvod

V súčasnosti internet spája stovky miliónov serverov, na ktorých sa nachádzajú miliardy rôznych stránok a jednotlivé súbory obsahujúce rôzne druhy informácií. Je to obrovské úložisko informácií. Na internete existujú rôzne spôsoby vyhľadávania informácií.

Vyhľadajte známu adresu. Potrebné adresy sú prevzaté z adresárov. Keď poznáte adresu, stačí ju zadať adresný riadok Prehliadač.

Príklad 1. www.gov.ru je serverom ruských štátnych orgánov.

Vytvorenie adresy používateľom. Keď poznáte systém vytvárania adries na internete, môžete ich vytvárať pri vyhľadávaní webových stránok.

K kľúčovému slovu musí byť pridaná tematická alebo geografická doména (názov spoločnosti, podniku, organizácie alebo jednoduché anglické podstatné meno) a intuícia.

Príklad 2. Adresy komerčných webových stránok:

www.samsung.com (spoločnosť SAMSUNG),

www.mtv.com (Hudobné správy MTV).

Príklad 3. Adresy vzdelávacích inštitúcií:

www.ntu.edu ( Národná univerzita USA).

Vyhľadávače Internet

Na vyhľadávanie informácií na internete boli vyvinuté špeciálne systémy na vyhľadávanie informácií. Vyhľadávače majú pravidelnú adresu a zobrazujú sa ako webová stránka obsahujúca špeciálne prostriedky organizovať vyhľadávanie (reťazec vyhľadávania, katalóg predmetov, odkazy). Ak chcete zavolať vyhľadávač, zadajte jeho adresu do panela s adresou v prehliadači.

Podľa štatistickej služby LiveInternet.ru je distribúcia vyhľadávacích nástrojov v Rusku približne nasledovná:

2) Google - 35,0%

3) Hľadať na Mail.ru - 8,3%

4) Rambler - 0,9%

Podľa spôsobu organizácie informácií sú systémy získavania informácií rozdelené do dvoch typov: klasifikácia (rubrikátory) a slovník.

Rubikátory (klasifikátory)- vyhľadávače, ktoré používajú hierarchickú (stromovú) organizáciu informácií. Pri vyhľadávaní informácií používateľ prezerá tematické nadpisy a postupne zužuje vyhľadávacie pole (napríklad ak potrebujete nájsť význam slova, najskôr musíte v klasifikátore nájsť slovník a potom nájsť požadované slovo. v ňom).



Slovníkové vyhľadávače sú výkonné automatické hardvérové ​​a softvérové ​​systémy. S ich pomocou sa informácie prezerajú (skenujú) na internete. Údaje o umiestnení týchto alebo týchto informácií sa zadávajú do špeciálnych indexov referenčných kníh. V odpovedi na dotaz sa vykoná vyhľadávanie podľa reťazca dotazu. V dôsledku toho sa používateľovi ponúknu adresy (URL), na ktorých bolo v čase skenovania nájdené hľadané slovo alebo skupina slov. Výberom ktoréhokoľvek z navrhovaných odkazov na adresy URL môžete prejsť na nájdený dokument. Väčšina moderných vyhľadávacích nástrojov je zmiešaná.

Najslávnejšie a najpopulárnejšie vyhľadávače:

Existujú systémy špecializujúce sa na vyhľadávanie informačných zdrojov v rôznych oblastiach.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com atď.

Predmetové vyhľadávače:

Vyhľadávanie softvér:

Adresáre (tematické zbierky odkazov s anotáciami):

http://www.atrus.ru

Požiadajte o pravidlá vykonávania

V každom vyhľadávacom nástroji poskytuje časť Pomocník informácie o tom, ako hľadať a ako zostaviť reťazec dopytu. Nasledujú informácie o typickom „priemernom“ dotazovacom jazyku.

Jednoduchý dotaz

Zadajte jedno slovo definujúce tému vášho hľadania. Napríklad vo vyhľadávači Rambler.ru stačí zadať: automatické.

Existujú dokumenty obsahujúce slová uvedené v žiadosti. Uznávajú sa všetky formy slov v ruskom jazyku, prípad písmen sa spravidla ignoruje.

V dotaze môžete použiť znak „*“ alebo „?“. Podpísať "?" v kľúčovom slove sa nahradí jeden znak, ktorý je možné nahradiť akýmkoľvek písmenom, a znak „*“ je postupnosť znakov.

Dotaz automatic * vám napríklad umožní nájsť dokumenty, ktoré obsahujú slová automatické, automatické atď.

Zložitý dotaz

Na získanie konkrétnejších informácií je často potrebné kombinovať kľúčové slová. V tomto prípade sa používajú ďalšie prepojovacie slová, funkcie, operátory, symboly, kombinácie operátorov oddelené zátvorkami.

Napríklad dotaz hudba & (beatles beatles) znamená, že používateľ hľadá dokumenty obsahujúce slová hudba a beatles alebo hudba a beatles.

Zoznam vyhľadávacích nástrojov a adresárov

Adresa Popis
www.excite.com Vyhľadávač s recenziami stránok a sprievodcami
www.alta-vista.com Vyhľadávací server, k dispozícii sú rozšírené možnosti vyhľadávania
www.hotbot.com Vyhľadávací server
www.ifoseek.com Vyhľadávač (jednoduché použitie)
www.ipl.org Internetová knižnica Publik, verejná knižnica prevádzkovaná projektom World Village
www.wisewire.com WiseWire - Organizácia vyhľadávania pomocou umela inteligencia
www.webcrawler.com WebCrawler - vyhľadávací nástroj, jednoduché použitie
www.yahoo.com Webový adresár a rozhranie na prístup k fulltextovému vyhľadávaniu na serveri AltaVista
www.aport.ru Aport - vyhľadávací server v ruskom jazyku
www.yandex.ru Yandex - vyhľadávací server v ruskom jazyku
www.rambler.ru Rambler - vyhľadávací server v ruskom jazyku
Zdroje online pomoci
www.yellow.com Internetové zlaté stránky
monk.newmail.ru Vyhľadávače rôznych profilov
www.top200.ru Najlepších 200 webových stránok
www.allru.net
www.ru Katalóg ruských internetových zdrojov
www.allru.net/z09.htm Vzdelávacie zdroje
www.students.ru Server ruských študentov
www.cdo.ru/index_new.asp Centrum dištančného vzdelávania
www.open.ac.uk Otvorená univerzita vo Veľkej Británii
www.ntu.edu Americká národná univerzita
www.translate.ru Elektronický prekladač texty
www.pomorsu.ru/guide.library.html Zoznam odkazov na sieťové knižnice
www.elibrary.ru Vedecká elektronická knižnica
www.citforum.ru Digitálna knižnica
www.infamed.com/psy Psychologické testy
www.pokoleniye.ru Internetová federácia vzdelávania
www.metod.narod.ru Vzdelávacie zdroje
www.spb.osi.ru/ic/distant Dištančné vzdelávanie na internete
www.examen.ru Skúšky a testy
www.kbsu.ru/~book/ Učebnica informatiky
Mega.km.ru Encyklopédie a slovníky

Profesionálne vyhľadávanie informácií na internete

Vyhľadávanie informácií je jednou z najbežnejších a zároveň najťažších úloh, s ktorými sa musí každý používateľ na internete stretnúť. Ak je však pre bežného člena siete požadovaná, ale zďaleka nie povinná, znalosť efektívnych metód získavania informácií, pre informačných profesionálov je schopnosť rýchlo sa orientovať v internetových zdrojoch a nájsť požadované zdroje jednou zo základných kvalifikácií.

Príčinu ťažkostí, s ktorými sa stretávame pri získavaní informácií na internete, určujú dva hlavné faktory. Po prvé, počet zdrojov na webe je extrémne veľký. Na konci roku 2001 najhrubšie odhady odhadovali na 7,5 miliardy dokumentov umiestnených na serveroch po celom svete. Za druhé, množstvo informácií na webe je nielen objemných, ale aj mimoriadne dynamických. Za pol minúty, ktoré ste strávili čítaním prvých riadkov tejto sekcie, sa vo virtuálnom vesmíre objavila asi stovka nových alebo zmenených dokumentov, desiatky boli presunuté na nové adresy a niektoré prestali navždy existovať. Internet nikdy „nespí“, ako nikdy „nespí“ naša planéta, na ktorej sa v súlade so zmenou časových pásiem neustále valí vlna podnikateľskej aktivity ľudstva.

Na rozdiel od stabilnej a kontrolovanej zbierky dokumentov v knižnici sa na webe stretávame s obrovským a neustále sa meniacim informačným poľom, ktorého hľadanie údajov je veľmi, veľmi náročný proces. Situácia je často veľmi podobná známemu problému nájdenia ihly v kope sena a niekedy informácie veľkej hodnoty zostanú nevyžiadané iba kvôli ťažkosti s ich nájdením.

Väčšina používateľov z celého sveta počítačové siete... Amatéri aj profesionáli často používajú rovnaké nástroje. Výsledky prieskumov a čas strávený nad nimi sa však líšia vo veľmi veľkej miere.

Cieľom tejto časti je podrobne sa zoznámiť s nástrojmi a metódami získavania informácií a rozvíjať udržateľné zručnosti pre profesionálne vyhľadávanie na webe pre všetky typy údajov: od textov v akomkoľvek formáte až po video a animáciu.

Stroje musia fungovať.
Ľudia musia premýšľať.

Kurz „Profesionálne internetové vyhľadávanie“ je pohodlný spôsob, ako sa naučiť kompetentne a efektívne vyhľadávať a nachádzať potrebné informácie na webe.

Čo profesionálne Vyhľadávanie?

Paradox internetu spočíva v tom, že informácia sa stáva každou sekundou Viac ale nájsť nevyhnutné informácia sa stáva stále ťažšie... Profesionálne vyhľadávanie je efektívne vyhľadávanie nevyhnutné a spoľahlivý informácie.
V modernom svete sa informácie stávajú kapitálom a internet je pohodlným prostriedkom na ich získanie, a preto schopnosť nájsť hodnotné informácie charakterizuje človeka ako profesionál na vysokej úrovni... Profesionálne vyhľadávanie by malo byť vždy efektívne. Profesionáli navyše počas vyhľadávania nielen hľadajú miesto, kde sú informácie uložené, ale tiež hodnotia autoritu zdroja, relevantnosť, presnosť a úplnosť zverejnených informácií. V tomto nám pomáha internetová heuristika - súbor užitočných pravidiel vyhľadávania, kritérií pre výber a vyhodnocovanie informácií o sieti.

Čo sa naučíte a čo sa naučíte?

Hľadali ste a nenašli ste? Potom bude kurz pre vás mimoriadne užitočný. Dostaneš podrobné pokyny na vyhľadávanie toho, čo už je na internete, ale na prvý pohľad sa zdá, že nájsť ho je jednoducho nemožné ... Možno! Naučíš sa, ako hľadať nájsť! Každá lekcia je postavená na kombinácii znalostí a skúseností, všetky prijaté znalosti sú preverené v praxi.

V triede Naučíš sa ako sa vyvíja moderný internet a ako sa distribuujú elektronické informácie, ako sa vytvárajú adresáre a ako fungujú vyhľadávače, prečo sú potrebné systémy metasearch a odkiaľ pochádza „skrytý“ web, v čom sa fóra líšia od blogov a čo je získavanie finančných prostriedkov.

Počas workshopov Naučíš sa používajte správne dopytovací jazyk, vyberte správne kľúčové slová, nájdite informácie na „skrytom“ webe, nájdite potrebné obrázky a súbory, vyhodnotte verejný názor v blogosfére, hľadať osobné informácie, a čo je najdôležitejšie - správne posúdiť spoľahlivosť, relevantnosť a úplnosť nájdených informácií.

Kurz internetového vyhľadávania vám umožní výrazne rozvinúť vaše kognitívne, informačné a komunikačné schopnosti.

Aké témy sú zahrnuté v kurze Profesionálne vyhľadávanie?

Cieľom kurzu je za jeden mesiac naučiť možnosti a jemnosti moderného vyhľadávania profesionálnych informácií na webe.

Každá lekcia (modul) obsahuje prednáška, seminár vo formáte fóra, test o asimilácii odovzdaného materiálu, ako aj niekoľko cvičení a pátracích úloh.

V aktualizovanom kurze sa budú týždenne konať hodinové webináre - interaktívne virtuálne online semináre zamerané na diskusiu o kľúčových úlohách profesionálneho vyhľadávania na internete.

Každý tréningový modul je vybavený užitočné dodatočné materiály na témy kurzov a ľahko tlačiteľné podklady.

Tematický plán kurzov pozostáva z 10 navzájom prepojených modulov:

1. Internet: História, technológia a výskum internetu.

2. Vyhľadávanie informácií... Vyhľadajte adresáre.

3. Systémy získavania informácií... Detailný popis IPS (Google, Yandex a ďalšie).

4. Metasearch systémy a programy.

5. Internetový informačný úrad: vecné hľadanie v encyklopédiách, príručkách, slovníkoch.

6. Bibliografické vyhľadávanie: knižnice, katalógy, programy.

7. Dokumentárne vyhľadávanie: elektronické dokumenty, elektronické knižnice, elektronické časopisy.

8. Skrytý web: Vyhľadávanie multimédií, databáz, databáz znalostí a súborov.

9. Hľadať novinky(blogy a fóra), kontakty, inštitúcie, získavanie finančných prostriedkov.

10. Stratégie získavania informácií: zovšeobecnenie internetových heuristických schopností.

Prečo diaľkový kurz?

Diaľkový kurz má celok niekoľko výhod.

Po prvé, každá lekcia nie je rozdelená na jednu alebo dve akademické hodiny týždenne, ale celý týždeň... Pomaly si môžete osvojiť a osvojiť si prednáškový materiál, vykonávať cvičenia a vyhľadávacie úlohy.

Za druhé, diaľkový kurz interaktívne... To znamená, že sa môžete vždy opýtať, objasniť, naučiť sa od učiteľa, čo si myslíte, že je dôležité. Vaša otázka nezostane nezodpovedaná a náročné vyhľadávacie úlohy môže prediskutovať celá skupina, aby každá zručnosť porovnala.

Po tretie, môžete študujte vo vhodnom čase pre vás a nemusíte strácať čas dochádzaním do triedy. Okrem toho môžete cvičiť kdekoľvek na svete, kde je prístup na internet.

Aká je nominálna hodnota kurzu?

Kurz „Internetová heuristika“ bude trvať jeden mesiac a bude pozostávať z 10 modulov, každý z modulov pozostáva z lekcií - „kvantá“ - umožňujú vám udržať tempo nevyhnutné pre zvládnutie nového materiálu). Cena každého modulu je iba 300 rubľov Za všetky triedy zaplatíte iba 3 000 rubľov. Upozorňujeme, že si nemusíte kupovať ďalšie učebnice, kurz je plne vybavený všetkými potrebnými učebnými materiálmi. V prípade úspešného absolvovania kurzu získate certifikát MSU o absolvovaní kurzu „Profesionálne vyhľadávanie na internete“.

Ak sa chcete naučiť vynaliezavosti na internete, musíte si vybrať vhodný čas na kurz a zaregistrovať sa (stačí kliknúť na odkaz na registráciu oproti vhodnému časovému úseku v hornej časti stránky)!

Po registrácii budete mať ešte čas premýšľať a urobiť konečné rozhodnutie. Mimochodom, môžete sa s nimi zoznámiť

PROFESIONÁLNE VYHĽADÁVANIE INFORMÁCIÍ NA INTERNETE

Vyhľadávanie na internete je dôležitým prvkom webu. Presný počet webových zdrojov moderný internet to vie sotva niekto. V každom prípade ide účet v miliardách. Aby ste v danej chvíli mohli použiť informácie, ktoré potrebujete, bez ohľadu na to, či už na obchodné alebo zábavné účely, musíte ich najskôr nájsť v tomto neustále sa dopĺňanom oceáne zdrojov.

Aby bolo vyhľadávanie na internete úspešné, musia byť splnené dve podmienky: dopyty musia byť dobre formulované a musia byť kladené na správnych miestach. Inými slovami, od používateľa sa vyžaduje na jednej strane schopnosť preložiť svoje záujmy v oblasti vyhľadávania do jazyka vyhľadávacieho dopytu a na druhej strane dobrá znalosť vyhľadávacích nástrojov, dostupných vyhľadávacích nástrojov, ich výhod a nevýhod , ktorý mu umožní v každom prípade zvoliť najvhodnejší spôsob vyhľadávania ....

V súčasnosti neexistuje jediný zdroj, ktorý by spĺňal všetky požiadavky na internetové vyhľadávanie. Preto seriózny prístup k vyhľadávaniu nevyhnutne musí používať rôzne nástroje, pričom každý používa v tom najvhodnejšom prípade.

Hlavný internetové vyhľadávacie nástrojemožno rozdeliť do nasledujúcich hlavných skupín:

Vyhľadávače;

Webové adresáre;

Zdroje pomoci;

Miestne programy na vyhľadávanie na internete.

Najpopulárnejšími vyhľadávacími nástrojmi súvyhľadávače- takzvané internetové vyhľadávače (vyhľadávače). Traja svetoví lídri sú celkom stabilní - Google, Yahoo! a Bing. Mnoho krajín pridáva do tohto zoznamu svoje vlastné miestne vyhľadávače, ktoré sú optimalizované pre miestny obsah. S ich pomocou teoreticky môžete nájsť akékoľvek konkrétne slovo na stránkach mnohých miliónov stránok. Z užívateľského hľadiska je hlavnou nevýhodou vyhľadávacích nástrojov nevyhnutná prítomnosťinformačný šumvo výsledkoch. Je teda zvykom volať výsledky, ktoré sú z jedného alebo iného dôvodu vo vyhľadávacom zozname, ktoré nezodpovedajú požiadavke.

Napriek mnohým rozdielom všetky internetové vyhľadávače pracujú na podobných princípoch a z technického hľadiska pozostávajú z podobných subsystémov. Prvá štrukturálna časť vyhľadávača je špeciálne programy slúži na automatické vyhľadávanie a následné indexovanie webových stránok. Takéto programy sa bežne označujú ako pavúky alebo roboty. Naskenujú kód webových stránok, nájdu na nich umiestnené odkazy a objavia tak nové webové stránky. Existujú alternatívny spôsob zaradenie stránky do indexu. Mnoho vyhľadávacích nástrojov ponúka vlastníkom zdrojov možnosť pridať web do svojej databázy samostatne. Nech je to akokoľvek, webové stránky sa stiahnu, analyzujú a indexujú. V nich sú zvýraznené štrukturálne prvky, nájdené kľúčové slová, určené ich odkazy na iné stránky a webové stránky. Vykonávajú sa aj ďalšie operácie, ktorých výsledkom je vytvorenie indexovej základne vyhľadávača. Táto základňa je druhým hlavným prvkom každého vyhľadávača. V súčasnosti neexistuje žiadna úplne úplná indexová základňa, ktorá by obsahovala informácie o všetkom obsahu internetu. Pretože používajú rôzne vyhľadávače rôzne programy Ak vyhľadávate webové stránky a vytvárate ich index pomocou rôznych algoritmov, indexové základne vyhľadávacích nástrojov sa môžu výrazne líšiť. Niektoré stránky sú indexované niekoľkými vyhľadávačmi, ale vždy existuje určité percento zdrojov, ktoré sú súčasťou iba jedného vyhľadávacieho nástroja. Skutočnosť, že každý vyhľadávací nástroj má takú originálnu a neprekrývajúcu sa časť indexu, nám umožňuje urobiť dôležitý praktický záver: ak používate iba jeden, dokonca aj najväčší vyhľadávací nástroj, určite prídete o určité percento užitočných odkazov.

Ďalšou časťou internetového vyhľadávača sú samotné programy na vyhľadávanie a triedenie. Tieto programy riešia dve hlavné úlohy: po prvé, nájdu stránky a súbory v databáze, ktoré zodpovedajú prijatej požiadavke, a potom zoradia výsledné pole údajov podľa rôznych kritérií. Úspech pri dosahovaní cieľov vyhľadávania do značnej miery závisí od efektívnosti ich práce.

Posledným prvkom internetového vyhľadávača je používateľské rozhranie. Okrem bežných požiadaviek na estetiku a praktickosť akéhokoľvek webu existuje ešte jedna dôležitá požiadavka na rozhrania vyhľadávacích nástrojov: musia ponúkať rôzne nástroje na vytváranie a spresňovanie dotazov, ako aj triedenie a filtrovanie výsledkov. Výhodou vyhľadávacích nástrojov je vynikajúce pokrytie zdrojov, relatívne rýchla aktualizácia obsahu databázy a dobrá voľba doplnkové funkcie.

Hlavným nástrojom pre prácu s vyhľadávačmi je dotaz.

Na internetové vyhľadávanie sa používajú aj špeciálne aplikácie, ktoré sú nainštalované na miestny počítač... Môže to byť ako jednoduché programy a pomerne komplexné komplexy vyhľadávania a analýzy údajov. Najbežnejšie vyhľadávacie doplnky pre prehliadače, panely prehliadača navrhnuté tak, aby fungovali s konkrétnou vyhľadávacou službou, a balíky metasearch s možnosťami analýzy výsledkov.

Webové adresáre - sú to zdroje, v ktorých sú stránky rozdelené do tematických kategórií. Ak používateľ pracuje s vyhľadávačmi iba prostredníctvom dopytov, potom má katalóg možnosť úplne prezerať tematické sekcie. Druhý zásadný rozdiel katalógy z automatických vyhľadávacích nástrojov - to znamená, že ľudia sú spravidla priamo zapojení do svojho obsahu, ktorí prezerajú zdroje a odkazujú web na jednu alebo inú kategóriu. Je obvyklé rozdeľovať webové adresáre na univerzálne a tematické. Universal snažte sa pokryť čo najviac tém. Obsahujú všetko od webových stránok s poéziou až po počítačové zdroje... Inými slovami, majú maximálnu šírku vyhľadávania. Predmetné adresáre sa naopak špecializujú na konkrétnu tému a poskytujú maximálnu hĺbku vyhľadávania znížením šírky pokrytia zdrojov.

Výhody adresárov - porovnateľne vysoká kvalita zdrojov, pretože každú stránku na nich si prezerá a vyberá osoba. Tematické zoskupenie stránok vám umožňuje pohodlne usporiadať weby so súvisiacimi témami. Tento režim činnosti je vhodný na objavovanie nových stránok pre vás na tému, ktorá vás zaujíma - je presnejšia ako pomocou vyhľadávacieho nástroja. Odporúča sa použiť webové adresáre na prvé zoznámenie sa s akoukoľvek oblasťou záujmu, ako aj na vyhľadávanie fuzzy dotazov - budete mať možnosť „blúdiť“ po častiach adresára a presnejšie určiť, čo presne potrebujete.

Nevýhody webových adresárov sú dobre známe. V prvom rade ide o pomalé dopĺňanie databázy, pretože zaradenie stránky do katalógu si vyžaduje ľudskú účasť. Pokiaľ ide o účinnosť, webový adresár nie je konkurentom vyhľadávacích nástrojov. Webové adresáre sú navyše z hľadiska veľkosti databáz výrazne nižšie ako vyhľadávače.

Keď hovoríme o internetovom vyhľadávaní, nemožno ignorovať množstvo výrazov, ktoré s touto oblasťou úzko súvisia a často sa používajú na opis a hodnotenie vyhľadávacích nástrojov. Napríklad: zemepisnej šírky a hĺbky internetové vyhľadávanie. Vyhľadávanie sa nazýva široké, ak zachytí čo najviac zdrojov informácií. V tomto prípade sa považuje za dostatočnú aspoň zmienka o konkrétnej požiadavke na web. Hĺbka vyhľadávania sa týka podrobností indexovania a následného vyhľadávania pre každý konkrétny zdroj. Mnoho vyhľadávacích nástrojov má napríklad odlišný prístup k indexovaniu rôznych stránok. Veľké a obľúbené stránky sú indexované v maximálnej miere, roboti sa snažia nevynechať ani jednu stránku takéhoto zdroja. Na iných weboch je zároveň možné indexovať iba titulnú stránku a niekoľko stránok s obsahom. Tieto okolnosti, prirodzene, ovplyvňujú následné vyhľadávanie. Hĺbkové vyhľadávanie funguje na princípe „je lepšie zahrnúť do výsledkov nepotrebné informácie, ako vynechať akékoľvek údaje súvisiace s témou vyhľadávania“.

Pomerne často môžete nájsť pojmy ako napr globálne a lokálne internetové vyhľadávanie. Miestne internetové vyhľadávania zohľadňujú geografickú polohu používateľa a uprednostňujú výsledky, ktoré nejakým spôsobom súvisia s konkrétnou krajinou alebo oblasťou. Pri globálnom vyhľadávaní sa tieto informácie neberú do úvahy a vyhľadávanie sa vykonáva vo všetkých dostupných zdrojoch.

Pri zostavovaní dotazu v internetových vyhľadávačoch fungujú rôzne režimy vyhľadávania. K typickým režimom vyhľadávania, ktoré sa nachádzajú na väčšine internetových počítačov, patrí jednoduché a pokročilé Vyhľadávanie. Jednoduché vyhľadávanie vám umožňuje zadať iba jeden hľadaný výraz do jedného dotazu. Pokročilé vyhľadávanie umožňuje zostaviť dopyt z niekoľkých podmienok a prepojiť ich s logickými operátormi.

Na spresnenie vyhľadávacích dopytov rôzne filtre ... Filtre sú tie alebo iné pomôcky na vytváranie dopytov, ktoré sa netýkajú obsahovej stránky podmienok dopytu, ale obmedzujú výsledky vyhľadávania na niektoré formálne funkcie. Napríklad pri použití filtra typu súboru počas vyhľadávania používateľ nepovedie o systémových informáciách týkajúcich sa predmetu jeho požiadavky, ale jednoducho obmedzí získané výsledky na konkrétny typ súboru špecifikovaný v podmienkach jeho požiadavky.

Univerzálne vyhľadávače sú pre väčšinu používateľov hlavným a často jediným prostriedkom internetového vyhľadávania. Ponúkajú dobré pokrytie zdrojov a tiež sadu nástrojov postačujúcich na základné úlohy vyhľadávania.

Trh s univerzálnymi vyhľadávačmi je dostatočne veľký. Pokúsili sme sa analyzovať najznámejšie vyhľadávače a výsledky sme predstavili vo forme tabuľky 1.

Pri výbere univerzálneho vyhľadávacieho nástroja hrá dôležitú úlohu kvalita zdrojov, ktoré sa s ním nájdu. Preferovaný vyhľadávací nástroj pre konkrétne úlohy môžete určiť pomocou „metódy značky“. Jeho podstata spočíva v tom, že sa najskôr vypracuje určitý tematický vyhľadávací dotaz, po ktorom sa vypočúva skupina ľudí - odborníkov v tejto oblasti, aby identifikovala najlepšie internetové zdroje podľa ich názoru na zvolenú tému. Na základe údajov z prieskumu sa vytvorí zoznam značkovacích miest, ktoré sú zaručene relevantné pre žiadosť a obsahujú vysokokvalitné informácie. Potom sa žiadosť odošle testovaným vyhľadávacím nástrojom. Logika hodnotenia je jednoduchá: čím vyššie sú značkovacie stránky umiestnené vo výsledkoch vyhľadávania, tým lepšie je konkrétny zdroj vhodný na nájdenie informácií o testovacej téme.


Alexey Kutovenko

Profesionálne internetové vyhľadávanie

Úvod

Vyhľadávanie na internete je dôležitým prvkom webu. Málokto pozná presný počet webových zdrojov na modernom internete. V každom prípade ide účet v miliardách. Aby ste v danej chvíli mohli použiť informácie, ktoré potrebujete, bez ohľadu na to, či už na obchodné alebo zábavné účely, musíte ich najskôr nájsť v tomto neustále sa dopĺňanom oceáne zdrojov. Nie je to vôbec ľahká úloha, pretože informácie na modernom webe nie sú štruktúrované, čo spôsobuje problémy s ich hľadaním. Nie je náhoda, že svojrázne „okná“ do toho informačný priestor Internetové vyhľadávače sa stali.

Existuje len málo používateľov internetu, ktorí nikdy nepoužívali veľké univerzálne vyhľadávacie nástroje. Mená Google, Yandex a pár ďalších veľkých strojov má každý na perách. Odvádzajú skvelú prácu pri každodennom internetovom vyhľadávaní a používatelia sa často ani neobťažujú hľadať náhradu. Internetové vyhľadávače sa v dnešnej dobe pohybujú v tisíckach. Dôvody tejto rozmanitosti alternatívnych strojov majú rôzne korene. Niektoré projekty sa pokúšajú priamo súťažiť s lídrami globálneho trhu prostredníctvom starostlivej práce s národnými internetovými zdrojmi. Iní ponúkajú možnosti dotazovania, ktoré sa nenachádzajú v známych vyhľadávacích nástrojoch. Značný počet alternatívnych strojov sa špecializuje na vyhľadávanie konkrétnej tematickej oblasti alebo konkrétneho typu obsahu a pri riešení týchto problémov dosahuje pôsobivé výsledky. Nech je to akokoľvek, zaradenie takýchto vyhľadávacích nástrojov do vlastného arzenálu internetových vyhľadávacích nástrojov používateľa môže výrazne zlepšiť jeho kvalitu. Tu však existuje jedna nuansa: musíte o takýchto strojoch vedieť a vedieť využiť ich schopnosti.

Predpokladáme, že čitatelia tejto knihy sú už celkom dobre oboznámení s technikou vyhľadávania pomocou univerzálnych vyhľadávacích nástrojov. Tak dobre, že pocítili obmedzenia súvisiace s ich používaním. S najväčšou pravdepodobnosťou sa takíto ľudia už pokúsili vyhľadať a použiť určité ďalšie nástroje. Tlačené slovo neignoruje tému internetového vyhľadávania: oba články sa pravidelne objavujú a vychádzajú knihy. Hrdinovia, ktorých majú, sú však spravidla rovnakí - niekoľko popredných univerzálnych vyhľadávacích nástrojov. Naša kniha je iná v tom, že sa pokúša pokryť celé spektrum moderných riešení vyhľadávania. Tu nájdete popisy a odporúčania na používanie najlepších moderných služieb zameraných na riešenie najčastejších problémov s vyhľadávaním. Táto kniha je pre ľudí, ktorí veľa pracujú na internete a používajú web na nájdenie potrebných informácií - či už ide o podnikanie, štúdium alebo hobby.

Aby bolo vyhľadávanie na internete úspešné, musia byť splnené dve podmienky: dopyty musia byť dobre formulované a musia byť kladené na správnych miestach. Inými slovami, od používateľa sa vyžaduje na jednej strane schopnosť preložiť svoje záujmy v oblasti vyhľadávania do jazyka vyhľadávacieho dopytu a na druhej strane dobrá znalosť vyhľadávacích nástrojov, dostupných vyhľadávacích nástrojov, ich výhod a nevýhod , ktorý mu umožní v každom prípade zvoliť najvhodnejší spôsob vyhľadávania ....

V súčasnosti neexistuje jediný zdroj, ktorý by spĺňal všetky požiadavky na internetové vyhľadávanie. Preto seriózny prístup k vyhľadávaniu nevyhnutne musí používať rôzne nástroje, pričom každý používa v tom najvhodnejšom prípade.

K dispozícii je mnoho vyhľadávacích nástrojov. Môžu byť kombinované do niekoľkých skupín, z ktorých každá má určité výhody a nevýhody. Kapitoly našej knihy sú venované hlavným skupinám moderných internetových vyhľadávačov.

Kapitola 1, „Univerzálne internetové vyhľadávače“, je venovaná veľkým univerzálnym vyhľadávačom pre informácie na webe. Hlavný dôraz je kladený na ich najmodernejšie nástroje, ktoré väčšinou širokej verejnosti zmiznú z očí. Prehľad schopností známych strojov nám dáva akési východisko a umožňuje nám jasne si predstaviť rozsah aplikácie alternatívnych riešení vyhľadávania.

Kapitola 2, „Vertikálne vyhľadávanie“, hovorí o systémoch, ktoré sa špecializujú na konkrétne oblasti alebo konkrétne typy obsahu.

Kapitola 3, „Metasearch“, sa zaoberá metasearch enginemi, ktoré môžu odoslať požiadavku viacerým internetovým vyhľadávačom súčasne, a potom zbierať a spracovávať výsledky získané v jednom rozhraní.

Kapitola 4, „Sémantické a vizuálne internetové vyhľadávače“, poskytuje prehľad experimentálnych systémov, ktoré ponúkajú pôvodné používateľské rozhrania a zaujímavé prístupy k spracovaniu dotazov.

Kapitola 5, „Odporúčacie motory“, pojednáva o nedávno spustenom vyhľadávacom nástroji s príznačným názvom Discovery Engines. S ich pomocou môžete spracovať množstvo dopytov, ktoré sú pre ostatné typy internetových vyhľadávačov „príliš náročné“.

Ak vám žiadny hotový výrobok nevyhovuje, môžete si vytvoriť vlastný internetový vyhľadávač. Kapitola 6, Osobné vyhľadávače, je venovaná tvorbe takýchto osobných strojov.

Niekoľko kapitol našej knihy je venovaných hľadaniu rôznych typov online obsahu. Kapitola 7, Vyhľadávanie obrázkov, pojednáva o súčasných trendoch vo vyhľadávaní obrázkov na internete, ako aj o možnostiach súvisiacich experimentálnych systémov. Kapitola 8 „Video Search“ poskytuje prehľad nástrojov na vyhľadávanie videa popredných univerzálnych internetových vyhľadávacích nástrojov a najlepších špecializovaných systémov v tejto oblasti.

Kapitola 9, Hľadanie skrytého obsahu, je prehľad systémov, ktoré vám umožňujú vyhľadávať obsah, ktorý všeobecné vyhľadávače „nevidia“. Medzi taký „skrytý“ obsah patria napríklad torrenty alebo súbory hostované na serveroch FTP a hostiteľ súborov.

Kapitola 10, „Vyhľadávanie na webe 3.0“, pojednáva o tom, ako môže internet vyhľadávať údaje vo formátoch „sémantický web“.

Vyhľadávanie sa nekončí iba získaním výsledkov z jedného alebo iného vyhľadávacieho nástroja. Posledná kapitola našej knihy je venovaná nástrojom na spracovanie a ukladanie výsledkov - Kapitola 11, „Pomocné programy“.

Pred začatím príbehu o konkrétnych produktoch má zmysel porozumieť klasifikácii moderných nástrojov na vyhľadávanie na internete a definovať pojmy, ktoré sa neustále nachádzajú na stránkach našej knihy.

Základné nástroje internetového vyhľadávania je možné rozdeliť do nasledujúcich hlavných skupín:

Vyhľadávače;

Webové adresáre;

Zdroje pomoci;

Miestne programy na vyhľadávanie na internete.

Najpopulárnejším vyhľadávačom sú vyhľadávače - takzvané internetové vyhľadávače (Search Engines). Traja svetoví lídri sú celkom stabilní - Google, Yahoo! a Bing. Mnoho krajín pridáva do tohto zoznamu svoje vlastné miestne vyhľadávače, ktoré sú optimalizované pre miestny obsah. S ich pomocou teoreticky môžete nájsť akékoľvek konkrétne slovo na stránkach mnohých miliónov stránok.

Napriek mnohým rozdielom všetky internetové vyhľadávače pracujú na podobných princípoch a z technického hľadiska pozostávajú z podobných subsystémov.

Prvou štrukturálnou časťou vyhľadávača sú špeciálne programy používané na automatické vyhľadávanie a následné indexovanie webových stránok. Takéto programy sa bežne označujú ako pavúky alebo roboty. Naskenujú kód webových stránok, nájdu na nich umiestnené odkazy a objavia tak nové webové stránky. Existuje aj alternatívny spôsob zahrnutia stránky do indexu. Mnoho vyhľadávacích nástrojov ponúka vlastníkom zdrojov možnosť pridať web do svojej databázy samostatne. Nech je to akokoľvek, webové stránky sa stiahnu, analyzujú a indexujú. V nich sú zvýraznené štrukturálne prvky, nájdené kľúčové slová, určené ich odkazy na iné stránky a webové stránky. Vykonávajú sa aj ďalšie operácie, ktorých výsledkom je vytvorenie indexovej základne vyhľadávača. Táto základňa je druhým hlavným prvkom každého vyhľadávača. V súčasnosti neexistuje žiadna úplne úplná indexová základňa, ktorá by obsahovala informácie o všetkom obsahu internetu. Pretože rôzne vyhľadávacie nástroje používajú na vyhľadávanie webových stránok a vytváranie indexov pomocou rôznych algoritmov rôzne programy, základy indexov vyhľadávacích nástrojov sa môžu výrazne líšiť. Niektoré stránky sú indexované niekoľkými vyhľadávacími nástrojmi, ale vždy existuje určité percento zdrojov, ktoré sú súčasťou iba jedného vyhľadávacieho nástroja. Skutočnosť, že každý vyhľadávací nástroj má tak originálnu a neprekrývajúcu sa časť indexu, nám umožňuje dospieť k dôležitému praktickému záveru: ak používate iba jeden, aj ten najväčší vyhľadávací nástroj, určite prídete o určité percento užitočných odkazov.