3.4 Conway-Maxwell Poisson (COMP)

Definition 3.7 (Conway-Maxwell-Poisson Modell (CMP)) Nach Shmueli u. a. (2005) (p. 129):

\[\begin{align} P(X = x) &= \frac{\lambda^x}{(x!)^\nu} \frac{1}{Z(\lambda, \nu)}, \quad x = 0, 1, 2, \ldots \\ Z(\lambda, \nu) &= \sum_{j = 0}^\infty \frac{\lambda^j}{(j!)^\nu} \\ \\ \lambda > 0&, \nu \ge 0 \end{align}\]

Mit (im Unterschied zur Poisson) nichtlinearer Zerfallsrate \(\nu\) rate of decay, so dass:

\[\begin{equation} \frac{P(X = x -1)}{P(X = x)} = \frac{x^\nu}{\lambda} \end{equation}\]

Der Zusammenhang zwischen \(\nu\) und \(\lambda\) nach Sellers und Shmueli (2010) (p. 946) legt Nahe, dass \(\nu\) ähnlich \(\alpha\) in NB-Modellen die Dispersion bestimmt:

\[\begin{align*} \mathrm{Var}(Y_i) =& \lambda_i \frac{\partial}{\partial \lambda_i} \mathbb{E}(Y_i) \approx \lambda_i \frac{\partial}{\partial \lambda_i} \left( \lambda_i^{\frac{1}{\nu}} - \frac{\nu - 1}{2 \nu} \right) \\ =& \frac{1}{\nu} \lambda^{\frac{1}{\nu}} \approx \frac{1}{\nu} \mathbb{E}(Y_i) \end{align*}\]

Als link wird \(\log \lambda\) verwendet, da so die links für Poisson- und logistische Regression Spezialfälle der COMP sind.

Die Verteilung hat als Spezialfälle:

  • \(\nu = 1 \Longrightarrow Z(\lambda, \nu) = exp(\lambda)\): Poisson
  • \(\nu \to \infty \Longrightarrow Z(\lambda, \nu) \to 1 + \lambda\): Bernoulli mit \(P(X = 1) = \frac{\lambda}{1+\lambda}\)
  • \(\nu = 0,\ \lambda < 1\): Geometrisch mit \(P(X = x) = \lambda^x (1 - \lambda)\)

Vorteile:

  • “Brücke” zwischen logistischer und Poisson-Regression (Sellers und Shmueli 2010)

Although the logistic regression is a limiting case \((\nu \to \infty)\), in practice, fitting a COM-Poisson regression to binary data yields estimates and predictions that are practically identical to those from a logistic regression.

Sellers und Shmueli (2010), p. 945

  • “Low cost”, i.e. “nur” ein zusätzlicher Parameter
  • Einfach zu handhaben (wenn in GLM mit MLE statt MCMC estimation)
  • Over- und underdispersion abbildbar
  • Zero-inflation abbildbar

Software:

  • CompGLM::glm.comp: Funktioniert, aber crasht RStudio wenn nuFormula spezifiziert wird
  • compoisson::com.fit: Entweder generell nicht geeignet oder unfassbar langsam (und deshalb nicht geeignet)
  • COMPoissonReg (GitHub: lotze/COMPoissonReg): Scheint zu funktionieren

Da die COMP-Wahrscheinlichkeitsfunktion eine unendliche Summe \(Z(\lambda, \nu)\) enthält, kann es bei der Anwendung in Software durchaus dazu kommen, dass keine Konvergenz erreicht wird. Wie viele Iterationen für die Konvergenz der Summe benötigt werden hängt zum einen von \(\nu\) ab: Je größer, desto schneller die Konvergenz. Das Gegenteil gilt für \(\lambda\) – je größer, desto langsamer die Konvergenz (High 2018, p. 4).

Siehe auch

  • Sellers und Shmueli (2010) für eine gute Übersicht
  • Lord, Geedipally, und Guikema (2010), Lord, Guikema, und Geedipally (2008) für eine Anwendung
  • Shmueli u. a. (2005)

Literatur

High, Robin. 2018. „Alternative Variance Parameterizations in Count Data Models with the NLMIXED Procedure“. In. https://www.semanticscholar.org/paper/Alternative-Variance-Parameterizations-in-Count-the-High/1224075e77acdee9eef91643e0bbfe869406a35d.

Lord, Dominique, Srinivas Reddy Geedipally, und Seth D. Guikema. 2010. „Extension of the Application of Conway-Maxwell-Poisson Models: Analyzing Traffic Crash Data Exhibiting Underdispersion“. Risk Analysis 30 (8): 1268–76. https://doi.org/10.1111/j.1539-6924.2010.01417.x.

Lord, Dominique, Seth D. Guikema, und Srinivas Reddy Geedipally. 2008. „Application of the Conway-Maxwell-Poisson Generalized Linear Model for Analyzing Motor Vehicle Crashes“. Accident Analysis & Prevention 40 (3): 1123–34. https://doi.org/10.1016/j.aap.2007.12.003.

Sellers, Kimberly F., und Galit Shmueli. 2010. „A Flexible Regression Model for Count Data“. The Annals of Applied Statistics 4 (2): 943–61. https://doi.org/10.1214/09-AOAS306.

Shmueli, Galit, Thomas P. Minka, Joseph B. Kadane, Sharad Borle, und Peter Boatwright. 2005. „A Useful Distribution for Fitting Discrete Data: Revival of the Conway-Maxwell-Poisson Distribution“. Journal of the Royal Statistical Society: Series C (Applied Statistics) 54 (1): 127–42. https://doi.org/10.1111/j.1467-9876.2005.00474.x.