Reference : Sur l'erreur résiduelle obtenue en régression linéaire multiple.
Scientific conferences in universities or research centers : Scientific conference in universities or research centers
Life sciences : Multidisciplinary, general & others
http://hdl.handle.net/2268/100890
Sur l'erreur résiduelle obtenue en régression linéaire multiple.
French
Akossou, A. Y. J. [> >]
Palm, Rodolphe mailto [Faculté Universitaire des Sciences Agronomiques de Gembloux - FUSAGx > Sciences agronomiques > Statistique, Informatique et Mathématique appliquées > >]
Fonton, N. H. [> >]
Claustriaux, Jean-Jacques mailto [Faculté Universitaire des Sciences Agronomiques de Gembloux - FUSAGx > Sciences agronomiques > Statistique, Informatique et Mathématique appliquées > >]
2007
International
Premier colloque de l'UAC des Sciences, Cultures et Technologies
du 25 au 29 juin 2007
Abomey-Calavi
Bénin
[en] Regression ; Residual error ; Sample size ; Estimation ; Simulation ; Simulation
[fr] Régression ; Erreur résiduelle ; Structure des données
[en] The residual error is one of the most used criteria for the choice of regression model. The large majority of the criteria for model selection are also functions of the usual variance estimate for a regression model, as Akaike criterion information [Akaike, 1973] and Mallows’ criterion [Mallows, 1964]. The effectiveness of these criteria to approach the theoretical model is related to the good estimate of the theoretical residual error of the model. This efficiency is often limited by the sample size used for the estimates. The choice of a invalid model can have bad consequences on the objective of the research in particular on the forecasts, interpretations and the conclusions.

We studied by Monte Carlo simulation the effects of the data structure on the quality of the residual error obtained in multiple linear regression.

The results showed that the estimator is a good estimator when the model is established without selection of variables, but becomes biased when the model results from a selection of variables.

Colinearity between the explanatory variables and the index which measure the importance of the variables in the true model do not have an influence on the quality of the estimator.
[fr] L’erreur résiduelle est l’un des critères les plus utilisés pour le choix d’un modèle de régression. Elle intervient également dans la plupart des autres critères de sélection de modèles, notamment dans le critère d’information d’Akaike [Akaike, 1973] et le critère [Mallows, 1964]. L’efficacité de ces critères à approcher le modèle théorique est liée à la bonne estimation de l’erreur résiduelle théorique du modèle. Cette efficacité est souvent limitée par la taille de l’échantillon utilisé lors des estimations. Le choix d’un mauvais modèle peut avoir des conséquences néfastes sur l’objectif de la recherche en particulier sur les prévisions, les interprétations et les conclusions.

Par simulation, nous étudions à travers une gamme variée de jeux de données l’influence de la structure des données sur l’estimateur de l’erreur résiduelle obtenue en régression linéaire multiple.

Les résultats ont montré que l’estimateur de l’erreur résiduelle se comporte bien lorsque le modèle est établi sans sélection de variables, mais devient biaisé lorsque le modèle est issu d’une sélection de variables.

La colinéarité entre les variables explicatives et l'indice de décroissance des coefficients de régression, qui mesure l'importance des variables dans le modèle théorique n'ont pas d’influence sur la qualité de cet estimateur.
http://hdl.handle.net/2268/100890

There is no file associated with this reference.

Bookmark and Share SFX Query

All documents in ORBi are protected by a user license.