Modelos PCA a partir de conjuntos de datos con información faltante. ¿Se afectan sus propiedades?
En este trabajo se aborda la problemática de la construcción de modelos PCA (Principal Component Analysis) a partir de conjuntos de datos con información faltante. Se trabaja sobre tres situaciones diferentes con relación a la matriz de datos originales. En cada situación se generaron pérdidas a tra...
Saved in:
Published in: | SaberEs (Rosario, Argentina) no. 2; pp. 105 - 109 |
---|---|
Main Authors: | , |
Format: | Journal Article |
Language: | English Spanish |
Published: |
Facultad de Ciencias Económicas y Estadística. Universidad Nacional del Rosario
15-10-2010
|
Subjects: | |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | En este trabajo se aborda la problemática de la construcción de modelos PCA (Principal Component Analysis) a partir de conjuntos de datos con información faltante. Se trabaja sobre tres situaciones diferentes con relación a la matriz de datos originales. En cada situación se generaron pérdidas a través de mecanismos aleatorios y no aleatorios, en diferentes porcentajes en una sola variable por vez, seleccionada mediante dos criterios: la que más contribuye y menos contribuye en la formación de la primera componente principal. A partir de cada conjunto de datos incompletos se construye el modelo PCA utilizando: Casos Completos, Nonlinear Iterative Partial Least Squares (NIPALS) y Expectation Maximization (EM). Se comparan los resultados con los obtenidos a través del conjunto de datos originales. Se definen una serie de medidas para estudiar cómo se afectan los resultados según la dimensión de la matriz de datos, el porcentaje y el mecanismo de pérdida, con relación a: bondad del ajuste, bondad de predicción, vectores cargas, ortonormalidad de la matriz de cargas y ortogonalidad de la matriz de “scores”. |
---|---|
ISSN: | 1852-4184 1852-4222 1852-4222 |
DOI: | 10.35305/s.v0i2.39 |