Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
A Bayesian mixture of experts approach to covariate misclassification
Ist Teil von
Canadian journal of statistics, 2020-12, Vol.48 (4), p.731-750
Ort / Verlag
Hoboken, USA: Wiley
Erscheinungsjahr
2020
Quelle
Wiley Online Library
Beschreibungen/Notizen
This article considers misclassification of categorical covariates in the context of regression analysis; if unaccounted for, such errors usually result in mis-estimation of model parameters. With the presence of additional covariates, we exploit the fact that explicitly modelling non-differential misclassification with respect to the response leads to a mixture regression representation. Under the framework of mixture of experts, we enable the reclassification probabilities to vary with other covariates, a situation commonly caused by misclassification that is differential on certain covariates and/or by dependence between the misclassified and additional covariates. Using Bayesian inference, the mixture approach combines learning from data with external information on the magnitude of errors when it is available. In addition to proving the theoretical identifiability of the mixture of experts approach, we study the amount of efficiency loss resulting from covariate misclassification and the usefulness of external information in mitigating such loss. The method is applied to adjust for misclassification on self-reported cocaine use in the Longitudinal Studies of HIV-Associated Lung Infections and Complications.
Les auteurs considèrent la mauvaise classification de covariables catégorielles dans le contexte d’une analyse de régression. Si elles sont ignorées, de telles erreurs conduisent habituellement à une mauvaise estimation des paramètres du modèle. En présence d’autres covariables, les auteurs exploitent le fait que la modélisation explicite d’une mauvaise classification non différentielle en fonction de la réponse produit une représentation par mélange de régression. Dans le contexte d’un mélange d’experts, ils permettent aux probabilités de reclassification de varier en fonction des autres covariables, une situation pouvant survenir en présence d’une mauvaise classification différentielle pour certaines covariables ou lorsqu’une dépendance lie les covariables additionnelles à la mauvaise classification. Avec l’inférence bayésienne, l’approche par mélange combine l’apprentissage venant des données avec de l’information sur la magnitude des erreurs lorsque celle-ci est disponible. En plus de prouver l’identifiabilité théorique de l’approche par mélange d’experts, les auteurs étudient la perte d’efficacité résultant de la mauvaise classification des covariables, et l’utilité de l’information externe dans la mitigation de cette perte. Ils appliquent également leur méthode pour ajuster la mauvaise classification dans la consommation de cocaïne autodéclarée dans les études longitudinales des infections et complications pulmonaires associées au VIH.