3.3 Generalized Poisson (GP)

Die Verteilung besitzt auch einen zusätzlichen Dispersionsparameter (analog NB, PIG), allerdings kann dieser hier auch negative Werte annehmen, womit die GP für alle Dispersionsarten (bzw. insbesondere underdispersion) geeignet ist.

Definition 3.5 (Generalized Poisson) Aus Hilbe (2014) (p. 211) und Harris, Yang, und Hardin (2012):

Eine Variable \(Y\) ist generalized Poisson verteilt mit der PMF:

\[\begin{equation*} P(Y = y_i) = \frac{\theta_i \left(\theta_i + \delta y_i\right)^{y_i - 1}}{y_i !} \exp(-\theta_i - \delta y_i), \quad y_i = 1, 2, 3, \ldots \end{equation*}\]

\[\begin{align*} \theta_i > 0, \quad \max(-1, \frac{-\theta_i}{4}) < \delta < 1 \\[2em] \mu_i = \mathbb{E}(Y_i) &= \frac{\theta_i}{1 - \delta} \\ \mathrm{Var}(Y_i) &= \frac{\theta}{(1 - \delta)^3} = \frac{1}{(1 - \delta)^2} \mathbb{E}(Y_i) = \Phi \mathbb{E}(Y_i) \end{align*}\]

Wobei \(\Phi = \frac{1}{(1 - \theta)^2}\) als Dispersionsparameter dient.

Es gilt außerdem

\[\begin{align*} \delta = 0 &\Longrightarrow \text{Equidispersion (Poisson)} \\ \delta < 0 &\Longrightarrow \text{Underdispersion} \\ \delta > 0 &\Longrightarrow \text{Overdispersion} \end{align*}\]

Auch hier kann ein Likelihood-Ratio Test auf \(\delta = 0\) durchgeführt werden, analog \(\alpha = 0\) für die NB – wobei \(\delta\) hier keine Restriktion hat (siehe BLR, Definition 4.3).

Eine alternative Darstellung unter Verwendung von Parametern \(\mu\) und \(sigma\) findet sich in Stasinopoulos und Rigby (2007), der Grundlage für das R-package gamlss (“Generalized additive models for location, scale and shape”):

Definition 3.6 (Generalized Poisson (GAMLSS)) \[\begin{equation*} f(y\ |\ \mu,\sigma)= \left(\frac{\mu}{(1+\sigma+\mu)}\right)^y \frac{(1+\sigma y)^{(y-1)}}{y!} \exp\left(-\mu \frac{(1+\sigma y)}{(1+\sigma+\mu)}\right) \end{equation*}\]

Für \(y=0,1,2,\ldots\) mit \(\mu > 0\) und \(\sigma > 0\).

Software:

  • R: VGAM: vgam(..., family = genpoisson())]
    • Hier wird das obige \(\delta\) als \(\lambda\) bezeichnet (Verwechslungsgefahr mit Poisson-Parameter)
    • Numerisch instabil für \(\lambda\) nahe 0 oder 1
    • Siehe ?VGAM::genpoisson
  • Alternativ via gamlss: gamlss(..., family = GPO)

In beiden R-Varianten habe ich bisher nicht geschafft \(\theta\), den Dispersionsparameter, zu extrahieren – auch wenn die Koeffizientien aus dem Stata-Beispiel in (Hilbe 2014, p. 213f) reproduzierbar sind.

Allgemein scheint die Parametrisierung (und Notation der Parameter) zu variieren.

Literatur

Harris, Tammy, Zhao Yang, und James W. Hardin. 2012. „Modeling Underdispersed Count Data with Generalized Poisson Regression“. The Stata Journal 12 (4): 736–47. https://doi.org/10.1177/1536867X1201200412.

Hilbe, Joseph M. 2014. Modeling Count Data. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139236065.

Stasinopoulos, D. Mikis, und Robert A. Rigby. 2007. „Generalized Additive Models for Location Scale and Shape (GAMLSS) in R“. Journal of Statistical Software 23 (1): 1–46. https://doi.org/10.18637/jss.v023.i07.