Photo by AbsolutVision on Unsplash Hace algún tiempo que estoy pensando en el problema de - en el contexto de las encuestas de hogares - cómo estimar aproximadamente bien los errores de muestreo de un estimador cuando la base de datos únicamente incorpora los factores de expansión y omite la información de las unidades primarias de muestreo (UPMs) … Sigue leyendo ¿Análisis de encuestas sin UPMs y sin estratos?
Técnicas básicas de estimación en dominios VS enfoque de postestratificación (R::TeachingSampling)
Photo by Ilya Pavlov on Unsplash Es cierto, lo he comprobado, ¡he visto La Luz y quema! Después de haber definido las similitudes y diferencias entre los subgrupos poblaciones, en este post quiero que mis lectores entiendan que existe una gran precio que se paga al utilizar las técnicas básicas de la estimación en dominios, … Sigue leyendo Técnicas básicas de estimación en dominios VS enfoque de postestratificación (R::TeachingSampling)
Cifras sospechosas con un CVE mayor al 15%
Es evidente que para tener un sistema de estadísticas oficiales confiables y precisas se debe utilizar criterios de calidad para establecer cuándo una estimación, resultante de una encuesta de hogares, puede ser publicada o suprimida. En algunos institutos de estadísticas se han adoptado políticas consistentes en advertir al usuario acerca de la pertinencia y credibilidad … Sigue leyendo Cifras sospechosas con un CVE mayor al 15%
Más importante que el principio de representatividad
Quiero retomar mi actividad bloguera abordando un tema casi filosófico que ha marcado mi práctica profesional desde siempre. Se trata del principio de representatividad y cuándo es pertinente utilizarlo. Si ante un fenómeno desconocido, fuera posible observar de forma exhaustiva a toda la población, no dudaríamos ni un instante en utilizar la estadística descriptiva para … Sigue leyendo Más importante que el principio de representatividad
Calibración de personas en encuestas de hogares
A la hora de analizar encuestas de hogares, uno de los tópicos más importantes está relacionado con la calibración de los factores de expansión. Como es bien sabido, este tópico es importante porque, cuando se utiliza bien esta técnica (ver Silva (2004) para una discusión de las consecuencias de mal-utilizar este método), además de reducir … Sigue leyendo Calibración de personas en encuestas de hogares
Scatter plots in survey sampling
When it comes to analyzing survey data, you have to take into account the stochastic structure of the sample that was selected to obtain the data. Plots and graphics should not be an exception. The main aim of such studies is to try to infer about how the behavior of the outcomes of interest in … Sigue leyendo Scatter plots in survey sampling
dplyr and the design effect in survey samples
Blogdown entry here.For those guys like me who are not such R geeks, this trick could be of interest. The package dplyr can be very useful when it comes to data manipulation and you can extract valuable information from a data frame. For example, when using if you want to count how many humans have … Sigue leyendo dplyr and the design effect in survey samples
Automatic output format in Rmarkdown
I am writing a Rmarkdown document with plenty of tables, and I want them in a decent format, e.g. kable. However I don't want to format them one by one. For example, I have created the following data frame in dplyrdata2 %>% group_by(uf) %>% summarise(n = n(), ) %>% arrange(desc(n)) One solution to the output format … Sigue leyendo Automatic output format in Rmarkdown
Sampling weights and multilevel modeling in R
So many things have been said about weighting, but on my personal view of statistical inference processes, you do have to weight. From a single statistic until a complex model, you have to weight, because of the probability measure that induces the variation of the sample comes from an (almost always) complex sampling design that … Sigue leyendo Sampling weights and multilevel modeling in R
Small Area Estimation 101
Small area estimation (SAE) has become a widely used technique in official statistics since the last decade of past century. When the sample size is not enough to provide reliable estimates at a very particular level, the power of models and auxiliary information must be applied with no hesitation. In a nutshell, SAE tries to … Sigue leyendo Small Area Estimation 101
Regression to the mean (or at the end, people are not as smart as you could expect)
Francis Galton very cleverly coined the term "regression to (or towards) the mean" meaning that if a variable is shown extreme in a first measurement, then the following observed values of that very variable will tend to get closer to the average of its distribution. The classical example is height: a tall child will have … Sigue leyendo Regression to the mean (or at the end, people are not as smart as you could expect)
Multilevel regression with poststratification (Gelman’s MrP) in R – What is this all about?
Multilevel regression with poststratification (MrP) is a useful technique to predict a parameter of interest within small domains through modeling the mean of the variable of interest conditional on poststratification counts. This method (or methods) was first proposed by Gelman and Little (1997) and is widely used in political science where the voting intention is … Sigue leyendo Multilevel regression with poststratification (Gelman’s MrP) in R – What is this all about?