Tablas asombrosas con la libreria {gt}

Alex Bajaña

Bienvenidos 🖖

⏲️ El taller va a tener una duración de 2h

🪐 Descarga el material de este taller en:

Repositorio del taller

Ya que estás por ahí puedes dejarnos tu ⭐

Si necesitas ayuda levanta tu mano 🖐️

Algunas reglas generales

  • ❔ No dudes en preguntar, la forma más chevere de aprender es en conjunto

  • 👨‍💻 Si no tienes computador no te preocupes, el taller quedará gravado y lo podrás seguir en casa.

  • 📹 Para acceder al material audiovisual. Envianos un correo a:

    alexvbr@ergostats.org

  • 🤫 Si requieres salir, hazlo de forma respetuosa y sin aviso.

Alex Vinicio Bajaña Rivera

  • Tengo 30 años

  • 7 de experiencia

  • Actualmente soy investigador para el Banco Mundial y fundador del Centro de Inestigación Estadística ERGOSTATS

  • \@AlexBajaa5

  • alexvbr@ergostats.org

Agenda

11:00 - 11:30 Introducción y presentación del taller
11:30 - 12:00 La librería {gt} para crear tablas que cuentan una historia
12:00 - 12:30 De una tabla sencilla a una tabla asombrosa
12:30 - 13:00 Recapitulación y futuros pasos
13:00 - ???? ¿Bielas?

Recursos

Documentación {gt}

Documentación {gtsummary}

El blog de Thomas Mock

R para ciencia de datos

Ambiente de trabajo

Esta presentación se realizó con la versión de R:

               _                                
platform       x86_64-w64-mingw32               
arch           x86_64                           
os             mingw32                          
crt            ucrt                             
system         x86_64, mingw32                  
status                                          
major          4                                
minor          2.0                              
year           2022                             
month          04                               
day            22                               
svn rev        82229                            
language       R                                
version.string R version 4.2.0 (2022-04-22 ucrt)
nickname       Vigorous Calisthenics            

Para este taller necesitamos cualquier versión desde la R 4.2.0

Ambiente de trabajo

Librerías:

# Para nuestras tablas

library(gt)

# Para nuestras tablas
library(gtExtras)

# Para manejar los insumos de nuestras tablas
library(tidyverse)

# Para formatos cheveres
library(scales)

# Para resumen de modelos
library(broom)

# Para leer desde spss
library(haven)

Manos a la obra

Algunos ejemplos

Algunos ejemplos

Algunos ejemplos

Instancias 🧑‍🔬

Análisis exploratorio

Instancias 🧑‍🔬

Análisis exploratorio

Modelado:

Instancias 🧑‍🔬

Análisis exploratorio

Modelado:

Comunicación

Las 6 etapas del análisis de datos 🏗️

Esto no es una receta, ni está escrito en piedra

  • Partimos de una pregunta cuya solución se encuentre en los datos (🤞). 

  • Luego, recolectamos y preparamos nuestros datos.

  • A continuación procesamos los datos, y los estructuramos para el análisis. 

  • En el análisis buscamos patrones y evidencia 🔍.

  • No hay análisis sin comunicación por eso necesitamos compartir nuestros hallazgos.

  • Seguros de la evidencia actuamos en función de la información. 🎉

El flujo de trabajo {tidyverse}

El flujo de trabajo {gt}

  • Los datos, incluso resumidos pueden ser muy densos de digerir

  • Después del trabajo duro, es necesario comunicar

Siendo sinceros, la mayoria del tiempo estamos así

Pregunta de análisis 📓

¿En que medida la inversión en tecnologías de la información (TIC) promueven un cambio en la capacidad de una empresa para generar ganancias?

Dos mecanismos principales:

  1. Incremento de los agregados (ventas, ganancias) a traves del acceso de oportunidades de crecimiento debido al uso TIC’s 📈

  2. Creación de ventajas competitivas por la reducción de costos relacionada al uso de TIC’s 📉

Tenemos tecnología

La ENESEM 🏢

La Encuesta Estructural Empresarial (ENESEM) tiene 2 objetivos:

Calcular agregados económicos 💸

  • Producción

  • Consumo intermedio

  • Valor agregado

  • Entre otros.

Presentar información sobre: 🧑‍🏭

  • Materias primas y productos elaborados

  • Mercaderías y servicios vendidos

  • Uso de tecnologías y comunicación (TIC)

Limites: 🚨

  • La encuesta está dirigida a empresas.

  • Se incluyen todas las actividades económicas clasificadas con CIIU salvo por:

    • A. Agricultura, ganadería, silvicultura y pesca.

    • O. Administración pública y defensa; planes de seguridad social de afiliación obligatoria.

    • T. Actividades de los hogares como empleadores; actividades no diferenciadas de los hogares como productores de bienes y servicios para uso propio.

    • U. Actividades de organizaciones y órganos extraterritoriales

Últimos detalles:

  • Universo de analisis

    • Las empresas de tamaño grande, mediana A y mediana B que cumplen con los criterios de clasificación de cobertura temática para el año 2019.
  • Unidades de analisis

    • Empresas
  • Tipo de muestreo

    • Muestreo probabilístico de elementos con selección aleatoria.

Procesamiento

Para este análisis se unieron dos fuentes de información:

  • El Tomo I de la ENESEM para empresas

  • El módulo de TIC de la ENESEM

Explora el archivo de procesamiento de datos en el archivo que llamaremos con la función source()

source("scripts/01_procesamiento_enesem.R")

Como funciona {gt}

Más sobre {gt}

¿Quieres aprender más?

Enlaces:

https://es.r4ds.hadley.nz/

https://www.danieldsjoberg.com/gtsummary/

https://gt.rstudio.com/

https://themockup.blog/

  • Siguenos en Facebook, Twitter, Youtube y TikTok como:

    @ergostats