Bayesovské sítě: definice, příklady a principy práce

Síť víry, řešení, bayesovský (ian) model nebo pravděpodobnostně orientovaný acyklický grafický model je variační schéma( Typ statistického modelu), které představuje soubor proměnných a jejich podmíněných závislostí prostřednictvím řízeného acyklického grafu (DAG).

Například bayesovská síť může představovat pravděpodobnostní vztahy mezi nemocemi a příznaky. Vzhledem k posledně jmenovaným lze síť použít k výpočtu možnosti různých nemocí. Ve videu níže vidíte příklad Bayesovské důvěryhodné sítě s výpočty.

Účinnost

Efektivní algoritmy mohou provádět výstup a učení v Bayesovských sítích. Sítě, které modelují proměnné (například řečové signály nebo proteinové sekvence), se nazývají dynamické. Zobecnění Bayesovských sítí, které mohou představovat a řešit problémy za podmínek nejistoty, se nazývají diagramy vlivu.

Podstata

Formálně Bayesovské sítě jsou skupiny dostupnosti databází, jejichž uzly představují proměnné v bayesovském smyslu: mohou to být pozorované veličiny, skryté proměnné, neznámé parametry nebo hypotézy. Proto je to velmi zajímavé.

Příklad Bayesovské sítě

Vlhkost trávy mohou způsobit dvě události: aktivní postřikovač nebo déšť. Déšť má přímý vliv na použití postřikovače (jmenovitě, že když prší, postřikovač obvykle není aktivní). Tuto situaci lze modelovat pomocí Bayesovské sítě.

Typický vzorec

Modelování

Protože bayesovská síť je úplným modelem pro její proměnné a jejich vztahy, lze ji použít k zodpovězení pravděpodobnostních požadavků na ně. Lze jej například použít k aktualizaci znalostí o stavu podmnožiny proměnných, když jsou pozorována jiná data (proměnné důkazu). Tento zajímavý proces se nazývá pravděpodobnostní závěr.

Zadní poskytuje univerzální dostatečnou statistiku pro detekční aplikace při výběru hodnot pro podmnožinu proměnných. Tento algoritmus lze tedy považovat za mechanismus pro automatické použití Bayesovy věty na složité problémy. Na obrázcích v článku můžete vidět příklady Bayesovských sítí důvěry.

Praktická bayesovská síť

Výstupní metody

Nejběžnější metody přesného odvození jsou: vyloučení proměnných, které eliminují (integrací nebo sčítáním) nepozorované parametry, které se nevztahují na dotaz, jeden po druhém rozdělením součtu podle produktu.

Šíření "stromu" kliknutí, které ukládá výpočty do mezipaměti, takže mnoho proměnných může být požadováno najednou a nové důkazy mohou být rychle šířeny; a rekurzivní přizpůsobení a / nebo vyhledávání, které umožňují najít kompromis mezi prostorem a časem a odpovídají účinnosti vyloučení proměnných, když je použito dostatek místa.

Všechny tyto metody mají zvláštní složitost, která exponenciálně závisí na délce sítě. Nejběžnější přibližné inferenční algoritmy jsou způsoby, jako je eliminace mini segmentů, cyklické šíření víry, zobecněné šíření posledně jmenovaných a variační metody.

Druhy sítí

Práce se sítěmi

Aby bylo možné plně specifikovat bayesovskou síť, a tak plně reprezentovat společné rozdělení pravděpodobnosti, musí být pro každý uzel x specifikováno rozdělení pravděpodobnosti pro X podmíněné rodiči x.

Distribuce x podmíněně podle jeho rodičů může mít jakoukoli formu. Je běžné pracovat s diskrétními nebo gaussovými distribucemi, protože to usnadňuje výpočet. Někdy jsou známa pouze omezení distribuce. Entropii lze poté použít k určení jediné distribuce, která má největší entropii s ohledem na omezení.

Podobně v konkrétním kontextu dynamické Bayesovské sítě je podmíněné rozdělení pro časový vývoj latentního stavu obvykle dáno k maximalizaci rychlosti entropie implikovaného náhodného procesu.

Bayesovská síť důvěry

Přímá maximalizace pravděpodobnosti (nebo zadní pravděpodobnosti) je často obtížná vzhledem k přítomnosti nepozorovaných proměnných. To je zvláště charakteristické pro bayesovskou síť rozhodování.

Klasický přístup

Klasickým přístupem k tomuto problému je algoritmus maximalizace očekávání, který střídá výpočet očekávaných hodnot nepozorovaných proměnných závislých na pozorovaných datech s maximalizací celkové pravděpodobnosti (nebo zadní hodnoty) za předpokladu, že dříve vypočítané očekávané hodnoty jsou správné. Za mírných pravidelností tento proces konverguje na maximální (nebo maximální zadní) hodnoty parametrů.

Úplnější bayesovský přístup k parametrům je považovat je za další nepozorovatelné proměnné a vypočítat úplnou zadní distribuci napříč všemi uzly s přihlédnutím k pozorovaným datům a poté integrovat parametry. Tento přístup může být nákladný a vést k velkým modelům, díky nimž jsou klasické přístupy k nastavení parametrů dostupnější.

V nejjednodušším případě je bayesovská síť definována odborníkem a poté použita k provedení výstupu. V jiných aplikacích je úkol definice pro člověka příliš obtížný. V tomto případě musí být mezi daty studována struktura Bayesovské neuronové sítě a parametry lokálních distribucí.

Bayesovské sítě

Alternativní metoda

Alternativní metoda strukturálního učení používá optimalizační vyhledávání. To vyžaduje použití funkce hodnocení a strategie vyhledávání. Běžným vyhodnocovacím algoritmem je zadní pravděpodobnost struktury s přihlédnutím k tréninkovým datům, jako je BIC nebo BDeu.

Požadovaný čas pro vyčerpávající vyhledávání, které vrací strukturu, která maximalizuje odhad, je superexponenciální v počtu proměnných. Strategie místního vyhledávání provádí postupné změny zaměřené na zlepšení hodnocení struktury. Friedman a jeho kolegové zvažovali použití vzájemných informací mezi proměnnými k nalezení správné struktury. Omezují nábor rodičovských kandidátů na uzly a provádějí v nich důkladné vyhledávání.

Obzvláště rychlou metodou pro přesné učení BN je představit problém jako optimalizační problém a vyřešit jej pomocí celočíselného programování. Omezení acyklicity se přidávají do celočíselného programu (IP) během řešení ve formě řezných rovin. Tato metoda dokáže zpracovat problémy s přesností na 100 proměnných.

Grafy a sítě

Řešení problémů

Pro řešení problémů s tisíci proměnných je nutný jiný přístup. Jedním z nich je, nejprve vyberte jedno pořadí a poté najděte optimální strukturu BN vzhledem k tomuto pořadí. To znamená pracovat v prostoru hledání možného uspořádání, což je výhodné, protože je menší než prostor síťových struktur. Několik objednávek je poté vybráno a vyhodnoceno. Tato metoda se ukázala jako nejlepší dostupná v literatuře, když je počet proměnných obrovský.

Další metodou je zaměřit se na podtřídu rozložitelných modelů, pro které MLE mají uzavřený tvar. Pak je možné detekovat konzistentní strukturu pro stovky proměnných.

Zkoumání Bayesovských sítí s omezenou šířkou tří řádků nezbytné pro zajištění přesné, interpretovatelné odvození, protože jeho složitost je v nejhorším případě exponenciální v délce stromu k (podle hypotézy exponenciálního času). Jako globální vlastnost grafu však výrazně zvyšuje složitost procesu učení. V této souvislosti lze k-strom použít k efektivnímu učení.

Krátká síť

Rozvoj

Vývoj Bayesovské důvěryhodné sítě často začíná vytvořením DAG G, takže X splňuje Markovovu místní vlastnost ve vztahu k G. Někdy je to kauzální DAG. Odhadované distribuce podmíněné pravděpodobnosti každé proměnné podle jejích rodičů v G. V mnoha případech, zejména když jsou proměnné diskrétní, pokud je společné rozdělení X součinem těchto podmíněných distribucí, pak se X stane bayesovskou sítí vzhledem k G.

Markovskoye "přikrývka uzlu" - je to spousta uzlů. Markovova deka činí uzel nezávislým na zbytku ve formě stejnojmenného uzlu a je dostatečným vědomím pro výpočet jeho distribuce. X je bayesovská síť s ohledem na G, pokud je každý uzel podmíněně nezávislý na všech ostatních uzlech, vzhledem k jeho markovově přikrývce.

Články na téma