Ips je... Účel a funkce informačních vyhledávačů

Moderní člověk si těžko dokáže představit život bez internet a téměř okamžitý přístup ke zdrojům informací. Uživatel málokdy přemýšlí o hledání požadovaného obsahu v síti. Ale to je velmi zajímavé.

Informační vyhledávač (IPS) je komplexní softwarový a hardwarový komplex, který provádí výběr informací na žádost uživatele. Informace jsou uloženy na serverech digitálně, jak knihy dříve stály na policích knihoven. Systém se skládá z mnoha subsystémů. Každý plní svůj úkol v procesu zpracování požadavku uživatele a poskytování informací v textové nebo zvukové podobě. Komplexnost řešených problémů je způsobena složitostí architektury moderních IPS (zkratka informačního vyhledávače). Takovýho "černá skříňka": na vstupu - text dotazu, který je uvnitř-Neznámý, na výstupu-komplexní informace.

Kartotéka v Realu Madrid

Vstupní toky

Žádosti o informace, které osoba vytvoří v textové podobě na obrazovce svého gadgetu, tvoří malou část dotazů zpracovávaných vyhledávačem. Základní pole dotazů pro vyhledávání tvoří roboti přijímající lidský dotaz a provádějící vícestupňové vyhledávání a zpětnou vazbu od uživatele. Informační a vyhledávací stroje zahrnují známé všem Google, "Yandex" a další, kteří denně zpracovávají miliony žádostí.

Původní vyhledávací objekty

Sada zdrojových objektů zájmu o vyhledávání jsou dokumenty, záznamy, videa, obrázky a další. Jsou vytvářeny mimo IPS. Obecný systém pro ukládání a vyhledávání informací by měl mít vestavěný bibliografický systém-jakýsi adresář, který umožňuje vyhledávat jakýkoli druh objektů.

Objekty nebo jejich digitální transformace se stávají "zdroj přihlášení" v IPS. To mezi nimi vybírá informace, které uživatel potřebuje.

Hledání informací

Externí zdroje

Zobrazení výběru informací využívá externí zdroje znalostí. Toto jsou informace, které uživatel hledá. Název filmu, citát z knihy a další. Pro počítačové vyhledávání musí být tyto informace přeloženy do dotazu v algoritmickém jazyce. V IPS se to provádí pomocí bloku vytváření, indexování a vývoje dotazů.

V ideálním případě by tyto tři procesy-reprezentace, indexování a vývoj dotazů - měly vycházet ze stejných zdrojů znalostí, ale v praxi je to nedosažitelné.

Zdroje znalostí musí být neustále revidovány a aktualizovány, přičemž aktualizace musí být identická a synchronizovaná. Ano, a externí zdroj znalostí vždy chronologicky předchází jeho použití ve vyhledávačích pro dotaz, někdy o několik let.

Vyhledávač informací

Divadelní představení

Reprezentace zdrojových objektů jsou sestaveny ze vstupů do určité kombinace nebo transformovány podle pravidel a algoritmů konkrétního informačního-vyhledávače.

Pohledy jsou víceméně převedené kopie původního vyhledávacího objektu. Ve sbírce neupravených úplných textů je každý text vlastní reprezentací. Ve sbírce objektů muzejních exponátů a artefaktů může být reprezentací transformovaný popis objektu s jeho obrazem. V některých případech může být reprezentace částečně odvozena z původního objektu a částečně z popisu: v bibliografických vyhledávacích systémech jsou reprezentace odvozeny od objektu - například název, jméno autora bude kombinováno s anotací díla.

Hledání správného

Prohledávatelný index

Vzhledem k tomu, že informace ve vyhledávačích informací jsou uloženy ve formě prezentace, je logické předpokládat, že vyhledávání se provádí podle zobrazení a po výběru je uživateli vydáno. V praxi to tak není. Například aktuální adresáře síťových knihoven obvykle omezují vyhledávání na více polí: autor, Nadpis a podnadpisy uvnitř pohledu obsahujícího další pole, kde se vyhledávání neprovádí. To je dostatečný důvod, proč je nutné rozlišovat mezi prohledávatelným pohledem a indexem, který je vyhledávací částí pohledu. Definuje vše, co by mělo být prohledávatelný. Prohledávatelný index, jako je pohled a zdrojový objekt, lze rozdělit na samostatné subindexy, aby bylo možné přesnější a cílenější vyhledávání

Vyhledávače mají obvykle syntetickou strukturu uvnitř, aby odpovídaly platným výsledkům vyhledávání. Tato struktura je druhou prohledávatelnou složkou indexu.

Procedurálně lze proces indexování implementovat různými způsoby: prohledávatelný index lze získat:

  • doslovné kopírování pohledu k dispozici pro vyhledávání;
  • kopírováním podrobností pohledu. Může to být část nebo všechny pohledy, které fyzicky existují pouze jako fragmenty distribuované podle pravidel vytváření indexu pro vyhledávání, které budou v případě potřeby shromážděny.
Správa vyhledávání

Pravidla pro návrh dotazů a formální dotazy

Vývoj dotazů je funkce, která zprostředkovává mezi požadavkem uživatele a formálním dotazem. Převede dotaz uživatele a před extrakcí jej sladí se slovníky příkazů pro extrakci, specifikací indexu a indexem. V počátcích IPS byla tato role tradičně přidělena kvalifikovaným IT profesionálům.

Vývoj počítačových dotazů, které mohou odpovídat dotazům se slovníkem v index prohledávatelného systému, se obvykle nazývá modul "zadání slovníku". Automatizace této funkce je slibná a nabízí příležitosti pro odborné a pravděpodobnostní metody vyhledávání.

Formální dotaz se stane po převodu požadavku uživatele. Příklady takových formálních transformace zahrnují zkrácení, substituci, normalizaci, vektorizaci a další transformace "externí" reprezentace v "vnitřní" pohledy na počítač IPS (dešifrování-informační vyhledávač).

Extrahované sady odkazů na dokumenty

Výsledná sada zdrojů informací je logicky podmnožinou pohledů vytvořených podle pravidel shody aplikovaných na formální dotaz prohledávatelným indexem.

Obvykle, ale ne nutně, existuje samostatný proces třídění obnovené sady informací. Online katalogy knihoven obvykle přeskupují výsledné sady abecedně podle autora před zobrazením. V systémech vyhledávání informací, které vytvářejí přísné hodnocení, předchází pořadí pořadí jakémukoli přeskupení.

Analýza dat

Výstupní proudy

Výstup výsledků vyhledávání se provádí tradičně na displeji, častěji jako tok objektů, které mají být použity jinde nebo pro některé jiné účely, dokončí hlavní vyhledávací cyklus.Taková vlákna mohou být směrována na zobrazovací zařízení, úložiště pro následné zpracování nebo použití jako vstupní toky do jiných výběrových služeb.

Informační vyhledávače umožňují zpětnou vazbu s výstupem jakéhokoli výběrového procesu. Výstup jakéhokoli procesu může představovat zpětnou vazbu k jiným procesům. Zpětná vazba může poskytnout základ pro odborný úsudek v jakékoli fázi.

Články na téma