changeset 83:c44aaf95f303

add some construction comments
author Markus Kaiser <markus.kaiser@in.tum.de>
date Sun, 10 Feb 2013 19:59:04 +0100
parents cb13dcc5afdd
children adf844b82be8
files bayesian_networks/term_paper.tex
diffstat 1 files changed, 11 insertions(+), 5 deletions(-) [+]
line wrap: on
line diff
--- a/bayesian_networks/term_paper.tex	Sun Feb 10 19:02:02 2013 +0100
+++ b/bayesian_networks/term_paper.tex	Sun Feb 10 19:59:04 2013 +0100
@@ -61,8 +61,7 @@
 \input{titlepage}
 
 \begin{abstract}
-Bayesnetze repräsentieren mehrdimensionale Zufallsvariablen platzsparend aber exakt. Diese Arbeit führt die notwendigen Begriffe der Wahrscheinlichkeitstheorie ein und definiert den Begriff der bedingten Unabhängigkeit, anhand derer mithilfe der d-Separation die Semantik der Bayesnetze erarbeitet und deren Konstruktion erläutert wird. Schließlich wird ein Algorithmus zur exakten Inferenz vorgestellt, die im allgemeinen Fall NP-vollständig ist, auf Polytrees jedoch in Linearzeit ausgeführt werden kann.
-\todo{Konstruktion}
+Bayesnetze repräsentieren mehrdimensionale Zufallsvariablen platzsparend aber exakt. Diese Arbeit führt die notwendigen Begriffe der Wahrscheinlichkeitstheorie ein und definiert die bedingte Unabhängigkeit, anhand derer mithilfe der d-Separation die Semantik der Bayesnetze erarbeitet wird. Schließlich wird ein einfacher Algorithmus zur exakten Inferenz vorgestellt, die im allgemeinen Fall NP-vollständig ist, auf Polytrees jedoch in Linearzeit ausgeführt werden kann.
 \end{abstract}
 
 \vspace{3em}
@@ -463,8 +462,14 @@
     Die am Beispiel vorgeführte Konstruktion stützt sich nur auf \ref{thm:bayes-independence} und die Existenz einer topologischen Sortierung, die in jedem DAG existiert. Sie lässt sich also auf jedes Bayesnetz übertragen. Ein exakterer Beweis wird in \cite{Görz} geführt.
 \end{proof}
 
-Durch die Konstruktion der gemeinsamen Verteilung wurde gezeigt, dass Bayesnetze eine mehrdimensionale komplett und exakt beschreiben, wenn alle Abhängigkeiten korrekt repräsentiert sind.
-\todo[inline]{Blubberbla zu Repräsentation an dn Knoten}
+Durch die Konstruktion der gemeinsamen Verteilung wurde gezeigt, dass Bayesnetze eine mehrdimensionale Zufallsvariable komplett und exakt beschreiben, wenn alle Abhängigkeiten korrekt repräsentiert sind. Zwar können auf diese weise prinzipiell beliebige Verteilungen modelliert werden, bei der Konstruktion von performanten Netzen ist jedoch eine Abwägung zwischen Exaktheit und Effizienz notwendig.
+
+Die Größe der gemeinsamen Verteilung einer Zufallsgröße mit $n$ binären Dimensionen ist $2^n$ Einträge. Um zu vermeiden, dass auch im Bayesnetz exponentiell viele Einträge existieren, muss lokale Struktur geschaffen werden. Wird davon ausgegangen, dass es eine Konstante $k$ gibt sodass alle Knoten maximal $k$ Eltern haben, so enthalten die bedingten Wahrscheinlichkeitsverteilungen gemeinsam $n \dot 2^k$ Einträge, wachsen also nurnoch linear mit der Größe des Netzwerks.
+
+Dies kann erreicht werden, indem einersetis gute Heuristiken beim Ordnen der Netzknoten angewendet werden (zum Beispiel eine Orientierung der Eltern-Kind Beziehung an Ursache-Wirkung Zusammenhängen) und andererseits indem geringe oder unwichtige Abhängigkeiten ignoriert werden.
+
+Um kurze Laufzeiten zu erhalten, muss auch darauf geachtet werden, die Knotenverteilungen effizient zu repräsentieren. Während in dieser Arbeit nur binäre Verteilungen behandelt werden, erklärt \cite{Russel} wie auch komplizierte kontinuierliche Verteilungen mit kleinen Netzen behandelt werden können, indem kanonische Verteilungen wie die Normalverteilung geschickt kombiniert werden.
+
 
 \section{Exakte Inferenz in Bayesnetzen}
 Beim Umgang mit mehrdimensionalen Zufallsvariablen ist nicht nur das Ermitteln von Einträgen in der gemeinsamen Verteilung interessant. Das Ermitteln von A-posteriori-Wahrscheinlichkeiten stellt eine zweite wichtige Anwendung dar, wobei bestimmte Evidenzen bekannt sind und die Wahrscheinlichkeisverteilungen für weitere Zufallsvariablen bestimmt werden soll.
@@ -668,7 +673,8 @@
 
 Eine Alternative stellen approximative Algorithmen dar, bei denen zwar kein exaktes Ergebnis erreicht werden kann, die jedoch auch auf großen oder topologisch ungünstigen Netzen einsetzbar sind. Der direkte Ansatz, bei dem sukzessive anhand der bedingten Verteilungen zufällig Belegungen erzeugt und mitgezählt werden lässt sich dabei verbessern, indem Schätzvariablen oder Markovketten eingesetzt werden, um schneller konvergierende Verfahren zu erhalten.
 
-\newpage
+\hfill
+
 \bibliographystyle{alpha}
 \bibliography{term_paper}