Was ist der Unterschied zwischen Regressionsanalyse und Dichteschätzung?


Antwort 1:

Sie haben nicht wirklich viel gemeinsam.

Regression ist eine ganze Familie von Techniken, bei denen die Beziehung zwischen einer oder mehreren abhängigen Variablen und einer oder mehreren unabhängigen Variablen ermittelt wird. Der häufigste Fall ist, dass Sie eine einzige stetige abhängige Variable und eine oder mehrere unabhängige Variablen (die von einem beliebigen Typ sein können) haben und die Beziehung mit gewöhnlichen kleinsten Quadraten schätzen. Die Regression kann jedoch nicht parametrisch sein (z. B. multivariate adaptive Regressionssplines) und kann kategorisch abhängige Variablen (z. B. logistische Regression) umfassen. Es ist eine riesige Methodenfamilie.

Die Dichteschätzung ist ein Versuch, die Form einer Verteilung zu finden. Dies kann eine univariate oder multivariate Verteilung sein. Es ist auch eine riesige Methodenfamilie. Die wahrscheinlich häufigste ist die Schätzung der Kerneldichte. Aber es gibt auch einen nächsten Nachbarn, ein paar andere. Die Dichteschätzung kennt keine abhängigen und unabhängigen Variablen - sie behandelt alle Variablen gleich.



Antwort 2:

Dichteschätzung ist der Versuch, eine Schätzung vorzunehmen, indem zunächst versucht wird, die Häufigkeit von Daten, üblicherweise mit einer Fenstertechnik, an eine Wahrscheinlichkeitsdichtefunktion anzupassen. Die Schätzung wird dann unter Verwendung der Auftrittswahrscheinlichkeit aus der Funktion vorgenommen. Obwohl ich dies nie mit mehr als einer Variablen versucht habe, sehe ich keinen Grund dafür, warum man dies nicht mehrdimensional tun könnte.

Eine Regression basiert auf der Annahme einer Funktion zwischen zwei oder mehr Variablen und der anschließenden Parametrisierung dieser Funktion unter Verwendung einer Methode der kleinsten Fehlerquadrate. Wenn dann Schätzungen gemacht werden, werden diese durch Auswertung der parametrisierten Funktion gemacht.



Antwort 3:

Dichteschätzung ist der Versuch, eine Schätzung vorzunehmen, indem zunächst versucht wird, die Häufigkeit von Daten, üblicherweise mit einer Fenstertechnik, an eine Wahrscheinlichkeitsdichtefunktion anzupassen. Die Schätzung wird dann unter Verwendung der Auftrittswahrscheinlichkeit aus der Funktion vorgenommen. Obwohl ich dies nie mit mehr als einer Variablen versucht habe, sehe ich keinen Grund dafür, warum man dies nicht mehrdimensional tun könnte.

Eine Regression basiert auf der Annahme einer Funktion zwischen zwei oder mehr Variablen und der anschließenden Parametrisierung dieser Funktion unter Verwendung einer Methode der kleinsten Fehlerquadrate. Wenn dann Schätzungen gemacht werden, werden diese durch Auswertung der parametrisierten Funktion gemacht.