{"id":33334,"date":"2025-07-07T20:05:23","date_gmt":"2025-07-07T20:05:23","guid":{"rendered":"http:\/\/toposuranos.com\/material\/?p=33334"},"modified":"2025-07-08T20:27:04","modified_gmt":"2025-07-08T20:27:04","slug":"de-toy-datasets-a-mini-proyecto-de-investigacion-con-r","status":"publish","type":"post","link":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/","title":{"rendered":"De toy datasets a mini-proyecto de investigaci\u00f3n con R"},"content":{"rendered":"<p><head><\/p>\n<style>\n  \/* ====== ESTILOS B\u00c1SICOS (heredados de tus clases previas) ====== *\/\n  p, ul, ol { text-align: justify; }\n  h1 { text-align: center; text-transform: uppercase; }\n  h2 { text-align: center; text-transform: uppercase; font-size: 24pt; }\n  h3 { text-align: center; text-transform: uppercase; font-size: 24px !important; }\n<\/style>\n<p><\/head><\/p>\n<p><body><br \/>\n<!-- ====== T\u00cdTULO PRINCIPAL DE LA CLASE ====== --><\/p>\n<h1>De toy datasets a mini-proyecto de investigaci\u00f3n con R<\/h1>\n<p><!-- ====== OBJETIVOS DE APRENDIZAJE (solo estructura) ====== --><\/p>\n<p style=\"text-align:center;\"><strong>Objetivos de aprendizaje<\/strong><\/p>\n<ol>\n<li>Descubrir y cargar toy datasets integrados en R y en paquetes populares.<\/li>\n<li>Explorar y resumir variables clave con funciones base y tidyverse.<\/li>\n<li>Plantear una pregunta de investigaci\u00f3n clara y viable con datos de juguete.<\/li>\n<li>Dise\u00f1ar un flujo de trabajo reproducible desde la exploraci\u00f3n hasta la visualizaci\u00f3n.<\/li>\n<li>Comunicar hallazgos en un breve informe R Markdown.<\/li>\n<\/ol>\n<p><!-- ====== \u00cdNDICE DE CONTENIDOS ====== --><\/p>\n<p style=\"text-align:center;\"><strong><u>\u00cdndice de contenidos<\/u><\/strong><\/p>\n<p style=\"text-align:center;\">\n  <a href=\"#1\">1. Introducci\u00f3n a los toy datasets en R<\/a><br \/>\n  <a href=\"#2\">2. Selecci\u00f3n del dataset y planteamiento del problema<\/a><br \/>\n  <a href=\"#3\">3. Exploraci\u00f3n inicial y limpieza m\u00ednima<\/a><br \/>\n  <a href=\"#4\">4. An\u00e1lisis descriptivo guiado<\/a><br \/>\n  <a href=\"#5\">5. Visualizaci\u00f3n r\u00e1pida con ggplot2<\/a><br \/>\n  <a href=\"#6\">6. De la pregunta a la mini-investigaci\u00f3n<\/a>\n<\/p>\n<p><!-- ====== SECCIONES PRINCIPALES (ESQUELETO) ====== --><\/p>\n<p><a name=\"1\"><\/a><\/p>\n<h2>1. Introducci\u00f3n a los toy datasets en R<\/h2>\n<p><!-- ====== 1.1 \u00bfQU\u00c9 ES UN TOY DATASET Y POR QU\u00c9 USARLO? ====== --><\/p>\n<h3>1.1 \u00bfQu\u00e9 es un toy dataset y por qu\u00e9 usarlo?<\/h3>\n<p>\nUn <strong>toy dataset<\/strong> (conjunto de datos \u201cde juguete\u201d) es un conjunto peque\u00f1o, limpio y bien documentado que viene incluido en R base o en paquetes muy difundidos. Est\u00e1 pensado para practicar funciones, demostrar conceptos estad\u00edsticos y construir ejemplos reproducibles sin la sobrecarga de <em>data wrangling<\/em> complejo. En esencia, son \u201carenas de juego\u201d seguras donde puedes:\n<\/p>\n<ul>\n<li><strong>Aprender sintaxis<\/strong> sin preocuparte de permisos, licencias o tama\u00f1os gigantes.<\/li>\n<li><strong>Probar modelos<\/strong> de manera r\u00e1pida antes de aplicarlos a datos reales m\u00e1s ruidosos.<\/li>\n<li><strong>Compartir c\u00f3digo reproducible<\/strong>: cualquier persona con R puede ejecutar el mismo script y obtener id\u00e9nticos resultados.<\/li>\n<li><strong>Ense\u00f1ar estad\u00edstica<\/strong> o programaci\u00f3n sin exponer datos sensibles.<\/li>\n<li><strong>Comparar m\u00e9todos<\/strong> (base R vs. tidyverse, etc.) en igualdad de condiciones.<\/li>\n<\/ul>\n<div class=\"note\">\n<p><strong>En clase:<\/strong> Usaremos toy datasets para construir un <em>pipeline<\/em> completo \u2014desde la exploraci\u00f3n hasta la visualizaci\u00f3n\u2014 y luego extrapolaremos la metodolog\u00eda a proyectos con datos reales.<\/p>\n<p>Un <em>pipeline<\/em> es una secuencia ordenada de pasos que automatiza el recorrido de los datos desde que se cargan hasta que se presentan los resultados. Cada etapa \u2014limpieza, transformaci\u00f3n, an\u00e1lisis y visualizaci\u00f3n\u2014 toma la salida de la fase anterior y la usa como entrada, de modo que el flujo avanza sin intervenci\u00f3n manual repetitiva. Esto garantiza reproducibilidad (cualquier persona puede volver a ejecutar todo el proceso y obtener los mismos resultados) y eficiencia (las tareas se encadenan de forma clara y l\u00f3gica, evitando errores de \u201ccopiar-pegar\u201d o trabajos duplicados).<\/p>\n<\/div>\n<hr\/>\n<p><!-- ====== 1.2 PRINCIPALES FUENTES INTEGRADAS ====== --><\/p>\n<h3>1.2 Principales fuentes integradas (<code>datasets<\/code>, <code>palmerpenguins<\/code>, <code>gapminder<\/code>, etc.)<\/h3>\n<p>\nA continuaci\u00f3n se listan los paquetes m\u00e1s populares que distribuyen toy datasets de acceso inmediato, junto con un vistazo r\u00e1pido a su contenido principal y una l\u00ednea de c\u00f3digo para cargarlos.\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Paquete \/ Dataset<\/th>\n<th>Tama\u00f1o (filas \u00d7 variables)<\/th>\n<th>Tem\u00e1tica<\/th>\n<th>Carga r\u00e1pida<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>R base \u2013 <code>datasets<\/code><\/strong><\/td>\n<td>\u2248 20+ datasets<br \/><em>(iris 5\u00d7150, mtcars 11\u00d732\u2026)<\/em><\/td>\n<td>Bot\u00e1nica, autom\u00f3viles, series temporales<\/td>\n<td><code>data(iris)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong><code>palmerpenguins<\/code> \u2013 <code>penguins<\/code><\/strong><\/td>\n<td>344 \u00d7 8<\/td>\n<td>Mediciones morfol\u00f3gicas de ping\u00fcinos en la Ant\u00e1rtica<\/td>\n<td><code>library(palmerpenguins)<br \/>data(penguins)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong><code>gapminder<\/code> \u2013 <code>gapminder<\/code><\/strong><\/td>\n<td>1 704 \u00d7 6<\/td>\n<td>Indicadores socio-econ\u00f3micos (1952-2007)<\/td>\n<td><code>library(gapminder)<br \/>data(gapminder)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong><code>nycflights13<\/code> \u2013 <code>flights<\/code><\/strong><\/td>\n<td>336 776 \u00d7 19<\/td>\n<td>Vuelos que salen de NYC en 2013<\/td>\n<td><code>library(nycflights13)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong><code>babynames<\/code> \u2013 <code>babynames<\/code><\/strong><\/td>\n<td>\u2248 1,9 M \u00d7 5<\/td>\n<td>Nombres de beb\u00e9s en EE. UU. (1880-2022)<\/td>\n<td><code>library(babynames)<\/code><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nPara descubrir qu\u00e9 datasets incluye cualquier paquete, basta con inspeccionar su documentaci\u00f3n:\n<\/p>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">library(help = &quot;datasets&quot;)      # lista todo lo integrado en R base\r\ndata(package = &quot;palmerpenguins&quot;)# lista datasets del paquete indicado\r\n<\/pre>\n<p>\nEn las siguientes secciones elegiremos uno de estos conjuntos, formularemos una pregunta de investigaci\u00f3n y recorreremos todo el flujo anal\u00edtico hasta generar un mini-informe reproducible.\n<\/p>\n<p><a name=\"2\"><\/a><\/p>\n<h2>2. Selecci\u00f3n del dataset y planteamiento del problema<\/h2>\n<p><!-- ====== 2.1 CRITERIOS DE SELECCI\u00d3N ====== --><\/p>\n<h3>2.1 Criterios de selecci\u00f3n: tama\u00f1o, tem\u00e1tica y variables<\/h3>\n<p>\nAntes de lanzarte a programar conviene detenerte y elegir cuidadosamente el toy dataset que usar\u00e1s. Un buen punto de partida asegura que el resto del flujo (el <em>pipeline<\/em>) sea fluido y que las conclusiones tengan sentido. A continuaci\u00f3n se resumen los criterios pr\u00e1cticos m\u00e1s importantes:\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Criterio<\/th>\n<th>Preguntas gu\u00eda<\/th>\n<th>Consejo r\u00e1pido<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>Tama\u00f1o (n filas \u00d7 variables)<\/strong><\/td>\n<td>\u00bfPuedes examinar las primeras filas a simple vista?<br \/>\u00bfTarda m\u00e1s de 1 s en cargarse?<\/td>\n<td>Para ejercicios de aula, busca &lt; 10 000 filas y &lt; 50 columnas.<\/td>\n<\/tr>\n<tr>\n<td><strong>Tem\u00e1tica o contexto<\/strong><\/td>\n<td>\u00bfTe resulta interesante o relevante?<br \/>\u00bfHay un p\u00fablico que valore los hallazgos?<\/td>\n<td>Elige un tema que motive: ecolog\u00eda (ping\u00fcinos), salud, econom\u00eda, etc.<\/td>\n<\/tr>\n<tr>\n<td><strong>Variable objetivo<\/strong><\/td>\n<td>\u00bfTienes claro qu\u00e9 variable quieres explicar, comparar o predecir?<br \/>\u00bfEs num\u00e9rica o categ\u00f3rica?<\/td>\n<td>Aseg\u00farate de que exista al menos una variable dependiente claramente definida.<\/td>\n<\/tr>\n<tr>\n<td><strong>Calidad y documentaci\u00f3n<\/strong><\/td>\n<td>\u00bfIncluye <code>?dataset_name<\/code> con descripci\u00f3n completa?<br \/>\u00bfConoces la unidad de medida y las categor\u00edas?<\/td>\n<td>Prefiere datasets bien documentados para evitar supuestos dudosos.<\/td>\n<\/tr>\n<tr>\n<td><strong>Variedad de tipos<\/strong><\/td>\n<td>\u00bfContiene algo de \u201ctodo\u201d: num\u00e9rico, categ\u00f3rico, fechas?<br \/>\u00bfPermite practicar filtros, tablas y gr\u00e1ficos distintos?<\/td>\n<td>Cuanto m\u00e1s heterog\u00e9neo, m\u00e1s rico para ejercitar distintas funciones.<\/td>\n<\/tr>\n<tr>\n<td><strong>Ausencia de valores perdidos<\/strong><\/td>\n<td>\u00bfLa columna clave tiene muchos <code>NA<\/code>?<br \/>\u00bfNecesitar\u00e1s limpieza pesada?<\/td>\n<td>En un toy dataset conviene minimizar la fase de limpieza para centrarse en el an\u00e1lisis.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nSi un conjunto cumple la mayor\u00eda de estos criterios, lo m\u00e1s probable es que puedas ir del \u201chello world\u201d al informe final en una sola sesi\u00f3n de trabajo.\n<\/p>\n<hr\/>\n<p><!-- ====== 2.2 PREGUNTAS DE INVESTIGACI\u00d3N POTENTES PERO PEQUE\u00d1AS ====== --><\/p>\n<h3>2.2 Ejemplos de preguntas de investigaci\u00f3n \u201cpeque\u00f1as pero potentes\u201d<\/h3>\n<p>\nLa clave de un mini-proyecto exitoso no es la complejidad, sino la claridad. Tu pregunta debe ser lo bastante concreta para responderla en unas cuantas l\u00edneas de c\u00f3digo, pero lo bastante interesante para contar una historia. Aqu\u00ed van ideas listas para usar o adaptar:\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Dataset<\/th>\n<th>Pregunta sugerida<\/th>\n<th>Tipo de an\u00e1lisis<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><code>iris<\/code><\/td>\n<td>\u00bfQu\u00e9 especie muestra mayor variabilidad en el largo del s\u00e9palo?<\/td>\n<td>Descriptivo + boxplot<\/td>\n<\/tr>\n<tr>\n<td><code>palmerpenguins::penguins<\/code><\/td>\n<td>\u00bfDifieren significativamente los pesos medios entre <em>Ad\u00e9lie<\/em> y <em>Gentoo<\/em>?<\/td>\n<td>t-test + viol\u00edn plot<\/td>\n<\/tr>\n<tr>\n<td><code>gapminder<\/code><\/td>\n<td>\u00bfC\u00f3mo cambi\u00f3 la esperanza de vida en Latinoam\u00e9rica entre 1952 y 2007?<\/td>\n<td>L\u00ednea temporal + resumen por a\u00f1o<\/td>\n<\/tr>\n<tr>\n<td><code>mtcars<\/code><\/td>\n<td>\u00bfLos autos con transmisi\u00f3n autom\u00e1tica consumen m\u00e1s combustible que los manuales?<\/td>\n<td>Gr\u00e1fico de densidad + prueba U de Mann-Whitney<\/td>\n<\/tr>\n<tr>\n<td><code>nycflights13::flights<\/code><\/td>\n<td>\u00bfCu\u00e1l de los tres aeropuertos de NYC presenta el mayor retraso promedio en enero?<\/td>\n<td>Filtrado + tabla de medias<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nObserva que cada pregunta cumple tres requisitos b\u00e1sicos:<\/p>\n<ol>\n<li><strong>Alcance limitado:<\/strong> una o dos variables principales.<\/li>\n<li><strong>Acci\u00f3n clara:<\/strong> comparar, describir o correlacionar.<\/li>\n<li><strong>Resultado interpretable:<\/strong> la respuesta cabe en un par de frases y un gr\u00e1fico.<\/li>\n<\/ol>\n<div class=\"note\">\n<p><strong>Tu turno:<\/strong> Elige un dataset, revisa sus variables con <code>str()<\/code> y formula tu propia pregunta en una sola l\u00ednea. Ese ser\u00e1 el eje de tu mini-proyecto.<\/p>\n<\/div>\n<p><a name=\"3\"><\/a><\/p>\n<h2>3. Exploraci\u00f3n inicial y limpieza m\u00ednima<\/h2>\n<p><!-- ====== 3.1 INSPECCI\u00d3N DE ESTRUCTURA ====== --><\/p>\n<h3>3.1 Inspecci\u00f3n de estructura con <code>str()<\/code> y <code>skimr::skim()<\/code><\/h3>\n<p>\nEl primer paso de cualquier <em>pipeline<\/em> es <strong>mirar<\/strong> los datos: confirmar cu\u00e1ntas filas y columnas hay, qu\u00e9 tipos de variable existen y si aparecen <code>NA<\/code>. Dos funciones cubren la mayor\u00eda de necesidades iniciales:\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Funci\u00f3n<\/th>\n<th>Qu\u00e9 muestra<\/th>\n<th>Cu\u00e1ndo usarla<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><code>str()<\/code><\/td>\n<td>Clase del objeto, n\u00famero de filas, tipo y muestra de cada columna.<\/td>\n<td>Exploraci\u00f3n r\u00e1pida en cualquier instalaci\u00f3n base de R.<\/td>\n<\/tr>\n<tr>\n<td><code>skimr::skim()<\/code><\/td>\n<td>Resumen extendido: <em>missing<\/em>, media, p50, p99, long\/short strings\u2026<\/td>\n<td>Diagn\u00f3stico completo que evita calcular <code>summary()<\/code> por separado.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h4>Ejemplo con <code>palmerpenguins::penguins<\/code><\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\n# Cargar paquetes\r\nlibrary(palmerpenguins)   # datos\r\nlibrary(skimr)            # resumen extendido\r\n\r\n# 1. Vista estructural r\u00e1pida\r\nstr(penguins)\r\n\r\n# 2. Resumen extendido\r\nskim(penguins)\r\n<\/pre>\n<p>\nLa salida de <code>str()<\/code> revela, por ejemplo, que <code>species<\/code> y <code>sex<\/code> son factores con varios <code>NA<\/code>, mientras que <code>bill_length_mm<\/code> es num\u00e9rica. Con <code>skim()<\/code> ver\u00e1s de inmediato valores faltantes y estad\u00edsticas \u00fatiles como cuartiles y n\u00famero de categor\u00edas \u00fanicas.\n<\/p>\n<hr\/>\n<p><!-- ====== 3.2 TRATAMIENTO R\u00c1PIDO DE NA Y TIPOS ====== --><\/p>\n<h3>3.2 Tratamiento r\u00e1pido de valores faltantes y tipos de datos<\/h3>\n<p>\nLos toy datasets ya vienen bastante limpios, pero casi siempre ver\u00e1s algo de <code>NA<\/code> o columnas mal tipadas (por ejemplo, a\u00f1os como n\u00fameros cuando conviene factor). La estrategia expr\u00e9s consiste en:\n<\/p>\n<ol>\n<li><strong>Detectar NA<\/strong> por variable.<\/li>\n<li><strong>Eliminar o imputar<\/strong> solo si son pocos y no arruinan la muestra.<\/li>\n<li><strong>Corregir tipos<\/strong> con <code>as.factor()<\/code>, <code>as.numeric()<\/code>, etc.<\/li>\n<\/ol>\n<h4>1&nbsp;\u2022&nbsp;Localizar los <code>NA<\/code><\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\n# Conteo de NA por columna\r\ncolSums(is.na(penguins))\r\n<\/pre>\n<h4>2&nbsp;\u2022&nbsp;Decidir: \u00bfquitar filas o imputar?<\/h4>\n<p>\nPara un an\u00e1lisis exploratorio breve es aceptable <em>eliminar<\/em> filas con valores faltantes en las variables clave:\n<\/p>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nlibrary(dplyr)\r\n\r\npenguins_clean &lt;- penguins %&gt;% \r\n  tidyr::drop_na(bill_length_mm, bill_depth_mm, sex)\r\n<\/pre>\n<p>\nSi el porcentaje de NA supera ~10&nbsp;% en una variable importante, sustit\u00fayelos por un valor \u201cseguro\u201d (media, mediana o categor\u00eda \u201cDesconocido\u201d):\n<\/p>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\n# Reemplazar NA en &#039;sex&#039; por &quot;unknown&quot;\r\npenguins$sex &lt;- forcats::fct_explicit_na(penguins$sex, na_level = &quot;unknown&quot;)\r\n<\/pre>\n<h4>3&nbsp;\u2022&nbsp;Ajustar tipos de datos<\/h4>\n<p>\nCuando la variable representa un grupo finito (a\u00f1o de estudio, isla, transmisi\u00f3n), conviene usar factor; cuando sea c\u00f3digo ID, convi\u00e9rtelo a <code>character<\/code> para evitar promedios absurdos.\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Situaci\u00f3n<\/th>\n<th>C\u00f3digo de correcci\u00f3n<\/th>\n<th>Motivo<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>A\u00f1o que act\u00faa como categor\u00eda<\/td>\n<td><code>penguins$year &lt;- as.factor(penguins$year)<\/code><\/td>\n<td>Permite facetas y barras por a\u00f1o sin orden num\u00e9rico enga\u00f1oso.<\/td>\n<\/tr>\n<tr>\n<td>Columna num\u00e9rica le\u00edda como texto<\/td>\n<td><code>df$ingreso &lt;- as.numeric(df$ingreso)<\/code><\/td>\n<td>Habilita c\u00e1lculos de media y desviaci\u00f3n est\u00e1ndar.<\/td>\n<\/tr>\n<tr>\n<td>ID con ceros a la izquierda<\/td>\n<td><code>df$id &lt;- as.character(df$id)<\/code><\/td>\n<td>Evita que \u201c0012\u201d se convierta en 12.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h4>Ejemplo completo de limpieza m\u00ednima<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\npenguins_min &lt;- penguins %&gt;% \r\n  # 1. Conservar solo variables clave\r\n  select(species, island, sex, bill_length_mm, body_mass_g) %&gt;% \r\n  \r\n  # 2. Eliminar filas con NA en variables num\u00e9ricas\r\n  drop_na(bill_length_mm, body_mass_g) %&gt;% \r\n  \r\n  # 3. Reetiquetar NA en &#039;sex&#039;\r\n  mutate(sex = forcats::fct_explicit_na(sex, na_level = &quot;unknown&quot;)) %&gt;% \r\n  \r\n  # 4. Asegurar que &#039;island&#039; sea factor ordenado alfab\u00e9ticamente\r\n  mutate(island = factor(island, levels = sort(unique(island))))\r\n<\/pre>\n<p>\nDespu\u00e9s de esta <em>limpieza m\u00ednima<\/em> el dataset queda listo para describir, modelar o visualizar sin interferencias de NA ni tipos inconsistentes. El objetivo no es perfeccionar cada celda, sino despejar r\u00e1pidamente los obst\u00e1culos que impedir\u00edan avanzar al an\u00e1lisis.\n<\/p>\n<p><a name=\"4\"><\/a><\/p>\n<h2>4. An\u00e1lisis descriptivo guiado<\/h2>\n<p><!-- ====== 4.1 TABLAS Y TENDENCIA CENTRAL ====== --><\/p>\n<h3>4.1 Tablas de frecuencia y medidas de tendencia central<\/h3>\n<p>\nCon el dataset ya depurado llega el momento de responder la primera bater\u00eda de preguntas descriptivas: <em>\u00bfQu\u00e9 tan frecuente es cada categor\u00eda?<\/em> y <em>\u00bfD\u00f3nde se concentra la distribuci\u00f3n de las variables num\u00e9ricas?<\/em>\n<\/p>\n<h4>4.1.1 Frecuencias con <code>table()<\/code> y <code>dplyr::count()<\/code><\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nlibrary(dplyr)\r\n\r\n# Frecuencia absoluta de especies\r\nfreq_species &lt;- table(penguins_min$species)\r\nfreq_species\r\n\r\n# La misma operaci\u00f3n, versi\u00f3n tidy\r\npenguins_min %&gt;%\r\n  count(species, name = &quot;n&quot;) %&gt;%\r\n  mutate(pct = round(n \/ sum(n) * 100, 1))\r\n<\/pre>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>species<\/th>\n<th>n<\/th>\n<th>%<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Adelie<\/td>\n<td>152<\/td>\n<td>44.9<\/td>\n<\/tr>\n<tr>\n<td>Chinstrap<\/td>\n<td>68<\/td>\n<td>20.1<\/td>\n<\/tr>\n<tr>\n<td>Gentoo<\/td>\n<td>119<\/td>\n<td>35.0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nA simple vista se aprecia que <strong>Adelie<\/strong> es la especie dominante (~45 %), mientras que <strong>Chinstrap<\/strong> es la menos representada. Esta tabla de dos columnas (<code>n<\/code> y <code>%<\/code>) suele bastar para el informe final.\n<\/p>\n<h4>4.1.2 Tendencia central para variables num\u00e9ricas<\/h4>\n<p>\nLas medidas de tendencia central m\u00e1s habituales se obtienen con <code>mean()<\/code> y <code>median()<\/code>. Para tablas m\u00faltiples usaremos <code>dplyr::summarise()<\/code>.\n<\/p>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\npenguins_min %&gt;%\r\n  summarise(\r\n    n              = n(),\r\n    bill_mean_mm   = mean(bill_length_mm, na.rm = TRUE),\r\n    bill_median_mm = median(bill_length_mm, na.rm = TRUE),\r\n    mass_mean_g    = mean(body_mass_g, na.rm = TRUE),\r\n    mass_median_g  = median(body_mass_g, na.rm = TRUE)\r\n  )\r\n<\/pre>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>n<\/th>\n<th>bill_mean_mm<\/th>\n<th>bill_median_mm<\/th>\n<th>mass_mean_g<\/th>\n<th>mass_median_g<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>339<\/td>\n<td>43.9<\/td>\n<td>44.5<\/td>\n<td>4201<\/td>\n<td>4050<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nObserva la ligera diferencia entre media (43.9 mm) y mediana (44.5 mm) para <code>bill_length_mm<\/code>; su cercan\u00eda indica que no existen valores extremos exagerados en esta variable.\n<\/p>\n<hr\/>\n<p><!-- ====== 4.2 COMPARACIONES ENTRE GRUPOS ====== --><\/p>\n<h3>4.2 Comparaciones b\u00e1sicas entre grupos con <code>dplyr<\/code><\/h3>\n<p>\nDespu\u00e9s del paneo general viene la comparaci\u00f3n: <em>\u00bfcambia el patr\u00f3n seg\u00fan especie, sexo o isla?<\/em> Gracias a <code>dplyr<\/code> podemos agrupar y resumir en una sola l\u00ednea.\n<\/p>\n<h4>4.2.1 Media y mediana por especie<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\npenguins_min %&gt;%\r\n  group_by(species) %&gt;%\r\n  summarise(\r\n    count     = n(),\r\n    bill_avg  = round(mean(bill_length_mm), 1),\r\n    mass_med  = median(body_mass_g)\r\n  )\r\n<\/pre>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>species<\/th>\n<th>count<\/th>\n<th>bill_avg&nbsp;(mm)<\/th>\n<th>mass_med&nbsp;(g)<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Adelie<\/td>\n<td>152<\/td>\n<td>38.8<\/td>\n<td>3700<\/td>\n<\/tr>\n<tr>\n<td>Chinstrap<\/td>\n<td> 68<\/td>\n<td>48.8<\/td>\n<td>3700<\/td>\n<\/tr>\n<tr>\n<td>Gentoo<\/td>\n<td>119<\/td>\n<td>47.6<\/td>\n<td>5075<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nLa Gentoo destaca por un <em>body mass<\/em> claramente m\u00e1s alto (mediana \u2248 5 kg), mientras que Adelie presenta picos de longitud de pico menores. Estos contrastes ya apuntan a hip\u00f3tesis sobre diferenciaci\u00f3n ecol\u00f3gica.\n<\/p>\n<h4>4.2.2 Tabla r\u00e1pida de diferencias por sexo<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\npenguins_min %&gt;%\r\n  group_by(sex) %&gt;%\r\n  summarise(across(c(bill_length_mm, body_mass_g),\r\n                   list(mean = ~mean(.x, na.rm = TRUE),\r\n                        sd   = ~sd(.x,   na.rm = TRUE)),\r\n                   .names = &quot;{.col}_{.fn}&quot;))\r\n<\/pre>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>sex<\/th>\n<th>bill_length_mm_mean<\/th>\n<th>bill_length_mm_sd<\/th>\n<th>body_mass_g_mean<\/th>\n<th>body_mass_g_sd<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>female<\/td>\n<td>42.1<\/td>\n<td>4.5<\/td>\n<td>3862<\/td>\n<td>560<\/td>\n<\/tr>\n<tr>\n<td>male<\/td>\n<td>45.9<\/td>\n<td>5.1<\/td>\n<td>4545<\/td>\n<td>775<\/td>\n<\/tr>\n<tr>\n<td>unknown<\/td>\n<td>44.4<\/td>\n<td>4.8<\/td>\n<td>4219<\/td>\n<td>628<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nLos machos en promedio presentan picos m\u00e1s largos y mayor masa, diferencias coherentes con la literatura biol\u00f3gica. La columna <code>unknown<\/code> \u2014creada en la limpieza\u2014 permite mantener la muestra completa sin descartar registros.\n<\/p>\n<h4>4.2.3 Rango intercuart\u00edlico por isla<\/h4>\n<p>\nPara variables susceptibles de sesgo, como <code>body_mass_g<\/code>, conviene usar el rango intercuart\u00edlico (IQR) como medida de dispersi\u00f3n robusta:\n<\/p>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\npenguins_min %&gt;%\r\n  group_by(island) %&gt;%\r\n  summarise(\r\n    mass_iqr = IQR(body_mass_g, na.rm = TRUE)\r\n  )\r\n<\/pre>\n<p>\nUn IQR elevado indica mayor heterogeneidad de tama\u00f1os entre individuos de la misma isla: un punto de partida para explorar nichos ecol\u00f3gicos o gradientes de alimento.\n<\/p>\n<div class=\"note\">\n<p><strong>Pr\u00f3ximo paso:<\/strong> Si alguna de estas diferencias te resulta llamativa, avanza a pruebas de hip\u00f3tesis (t-test, ANOVA) o visualizaciones (<code>ggplot2<\/code>) para confirmar y comunicar tus hallazgos.<\/p>\n<\/div>\n<p><a name=\"5\"><\/a><\/p>\n<h2>5. Visualizaci\u00f3n r\u00e1pida con ggplot2<\/h2>\n<p>\nUna vez obtenidas las tablas y descriptivos, la forma m\u00e1s eficaz de comunicar patrones es con una <em>buena<\/em> gr\u00e1fica. El paquete <code>ggplot2<\/code> \u2014incluido en el <code>tidyverse<\/code>\u2014 ofrece una sintaxis coherente basada en la gram\u00e1tica de los gr\u00e1ficos, lo que facilita la producci\u00f3n de figuras claras y reproducibles. <\/p>\n<p><!-- ====== 5.1 GR\u00c1FICOS FUNDAMENTALES ====== --><\/p>\n<h3>5.1 Gr\u00e1ficos fundamentales para variables categ\u00f3ricas y num\u00e9ricas<\/h3>\n<h4>5.1.1 Barras para una variable categ\u00f3rica<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nlibrary(ggplot2)\r\n\r\n# Distribuci\u00f3n de especies\r\nggplot(penguins_min, aes(x = species, fill = species)) +\r\n  geom_bar() +\r\n  labs(title = &quot;Distribuci\u00f3n de especies de ping\u00fcinos&quot;,\r\n       x = &quot;Especie&quot;, y = &quot;Frecuencia&quot;) +\r\n  scale_fill_brewer(palette = &quot;Set2&quot;) +\r\n  theme_minimal()\r\n<\/pre>\n<ul>\n<li><code>geom_bar()<\/code> cuenta registros autom\u00e1ticamente (<code>stat = \"count\"<\/code>).\n<li>La paleta <code>Set2<\/code> es apta para dalt\u00f3nicos y da contraste inmediato.<\/li>\n<\/ul>\n<h4>5.1.2 Histograma para una variable num\u00e9rica<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nggplot(penguins_min, aes(x = body_mass_g)) +\r\n  geom_histogram(binwidth = 200, fill = &quot;#4682B4&quot;, colour = &quot;white&quot;) +\r\n  labs(title = &quot;Distribuci\u00f3n de masa corporal&quot;,\r\n       x = &quot;Masa (g)&quot;, y = &quot;N\u00famero de individuos&quot;) +\r\n  theme_classic()\r\n<\/pre>\n<p>\nElegir un <code>binwidth<\/code> apropiado evita \u201cpicos\u201d artificiales. La regla de Silverman o la de Freedman\u2013Diaconis pueden automatizar la selecci\u00f3n, pero un valor redondo (200 g) suele ser suficiente para toy datasets.\n<\/p>\n<h4>5.1.3 Boxplot comparativo (num\u00e9rico \u2715 categ\u00f3rico)<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nggplot(penguins_min, aes(x = species, y = body_mass_g, fill = species)) +\r\n  geom_boxplot(outlier.color = &quot;red&quot;, alpha = .7) +\r\n  labs(title = &quot;Masa corporal por especie&quot;,\r\n       x = NULL, y = &quot;Masa (g)&quot;) +\r\n  scale_fill_brewer(palette = &quot;Pastel1&quot;) +\r\n  theme_minimal(base_size = 12) +\r\n  theme(legend.position = &quot;none&quot;)\r\n<\/pre>\n<ul>\n<li>Los puntos rojos indican <em>outliers<\/em> seg\u00fan 1.5 \u00d7 IQR.<\/li>\n<li>Eliminar la leyenda evita redundancia cuando el llenado replica el eje X.<\/li>\n<\/ul>\n<h4>5.1.4 Diagrama de dispersi\u00f3n con codificaci\u00f3n doble<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nggplot(penguins_min,\r\n       aes(x = bill_length_mm, y = body_mass_g,\r\n           colour = species, shape = sex)) +\r\n  geom_point(size = 2.5, alpha = .8) +\r\n  labs(title = &quot;Longitud del pico vs. masa corporal&quot;,\r\n       x = &quot;Longitud pico (mm)&quot;, y = &quot;Masa (g)&quot;,\r\n       colour = &quot;Especie&quot;, shape = &quot;Sexo&quot;) +\r\n  scale_colour_brewer(palette = &quot;Dark2&quot;) +\r\n  theme_light()\r\n<\/pre>\n<p>\nEste gr\u00e1fico revela clusters claros por especie y, con <code>shape<\/code>, las diferencias<br \/>\nentre sexos sin recargar con facetas.\n<\/p>\n<p><!-- ====== 5.2 BUENAS PR\u00c1CTICAS ====== --><\/p>\n<h3>5.2 Buenas pr\u00e1cticas de est\u00e9tica y etiquetado<\/h3>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Recomendaci\u00f3n<\/th>\n<th>Por qu\u00e9 importa<\/th>\n<th>Ejemplo en ggplot2<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><strong>T\u00edtulos y subt\u00edtulos descriptivos<\/strong><\/td>\n<td>Contextualizan la lectura sin acudir al texto principal.<\/td>\n<td><code>labs(title = \"...\", subtitle = \"...\")<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong>Ejes con unidades claras<\/strong><\/td>\n<td>Evita ambig\u00fcedad (p.&nbsp;ej. g vs.&nbsp;kg).<\/td>\n<td><code>scale_x_continuous(labels = scales::comma)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong>Paletas accesibles<\/strong><\/td>\n<td>Garantiza legibilidad para personas con daltonismo.<\/td>\n<td><code>scale_fill_brewer(palette = \"Set2\")<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong>Leyendas \u00fatiles, no redundantes<\/strong><\/td>\n<td>Reducen ruido visual.<\/td>\n<td><code>theme(legend.position = \"none\")<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong>Temas coherentes<\/strong><\/td>\n<td>Unifica el estilo (fondos, tipograf\u00edas).<\/td>\n<td><code>theme_minimal(base_size = 11)<\/code><\/td>\n<\/tr>\n<tr>\n<td><strong>Guardar en alta resoluci\u00f3n<\/strong><\/td>\n<td>Evita pixelaci\u00f3n en informes y presentaciones.<\/td>\n<td><code>ggsave(\"plot.png\", dpi = 300, width = 6, height = 4)<\/code><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nCon estas pr\u00e1cticas, incluso un <em>toy dataset<\/em> luce profesional y comunica una historia clara. Recuerda: una buena gr\u00e1fica <strong>no<\/strong> lo dice todo, pero impulsa a preguntar m\u00e1s \u2014y ah\u00ed comienza la investigaci\u00f3n.\n<\/p>\n<p><a name=\"6\"><\/a><\/p>\n<h2>6. De la pregunta a la mini-investigaci\u00f3n<\/h2>\n<p>\nTodo el trabajo previo (elecci\u00f3n del toy dataset, limpieza m\u00ednima, descriptivos y gr\u00e1ficos) debe<br \/>\nconverger en <strong>una pregunta clara<\/strong>.  Esa pregunta se convierte<br \/>\nen una <em>hip\u00f3tesis<\/em>, y con la prueba estad\u00edstica adecuada<br \/>\npodemos aceptarla o rechazarla con evidencia.<br \/>\nEn esta secci\u00f3n se muestra el camino \u201cexpr\u00e9s\u201d para pasar del<br \/>\n\u201c\u00bfser\u00e1 que\u2026?\u201d al \u201clos datos sugieren que\u2026\u201d.\n<\/p>\n<p><!-- ====== 6.1 FORMULACI\u00d3N DE HIP\u00d3TESIS ====== --><\/p>\n<h3>6.1 Formulaci\u00f3n de hip\u00f3tesis simples<\/h3>\n<p><strong>Hip\u00f3tesis nula (H<sub>0<\/sub>)<\/strong><br \/>\nEs la posici\u00f3n de partida: \u201cno hay diferencia \/ no hay efecto \/ todo es azar\u201d.<br \/>\n<strong>Hip\u00f3tesis alternativa (H<sub>A<\/sub>)<\/strong><br \/>\nLo que <em>esperamos<\/em> encontrar: \u201cs\u00ed hay diferencia \/ s\u00ed hay efecto\u201d.<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Ejemplo de pregunta<\/th>\n<th>H<sub>0<\/sub><\/th>\n<th>H<sub>A<\/sub><\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>\u00bfLa masa corporal media difiere entre ping\u00fcinos Ad\u00e9lie y Gentoo?<\/td>\n<td>\u03bc<sub>Ad\u00e9lie<\/sub> = \u03bc<sub>Gentoo<\/sub><\/td>\n<td>\u03bc<sub>Ad\u00e9lie<\/sub> \u2260 \u03bc<sub>Gentoo<\/sub><\/td>\n<\/tr>\n<tr>\n<td>\u00bfLa preferencia por \u201cCaf\u00e9\u201d depende del g\u00e9nero?<\/td>\n<td>La proporci\u00f3n de fan\u00e1ticos del caf\u00e9 es igual en hombres y mujeres.<\/td>\n<td>La proporci\u00f3n de fan\u00e1ticos del caf\u00e9 difiere entre g\u00e9neros.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nMant\u00e9n las hip\u00f3tesis <strong>espec\u00edficas<\/strong>, <strong>medibles<\/strong> y <strong>binarias<\/strong>: o se rechaza H<sub>0<\/sub> o no se rechaza (nunca \u201cse acepta\u201d H<sub>0<\/sub>; simplemente no hay evidencia suficiente en su contra).\n<\/p>\n<p><!-- ====== 6.2 SELECCI\u00d3N DE PRUEBAS B\u00c1SICAS ====== --><\/p>\n<h3>6.2 Selecci\u00f3n de pruebas b\u00e1sicas (t-test, chi-cuadrado \u201clight\u201d)<\/h3>\n<p>\nCon toy datasets bastan dos test cl\u00e1sicos \u2014 f\u00e1ciles de ejecutar,<br \/>\ninterpretar y reportar:\n<\/p>\n<table class=\"table-limites\">\n<thead>\n<tr>\n<th>Situaci\u00f3n t\u00edpica<\/th>\n<th>Prueba recomendada<\/th>\n<th>Funci\u00f3n en R<\/th>\n<th>Supuestos clave<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Comparar medias de <em>una<\/em> variable num\u00e9rica entre dos grupos.<\/td>\n<td><strong>t-test de dos muestras<\/strong> (Student o Welch).<\/td>\n<td><code>t.test(x ~ grupo)<\/code><\/td>\n<td>Independencia, aproximada normalidad y varianzas similares (o usar Welch).<\/td>\n<\/tr>\n<tr>\n<td>Comparar frecuencias de dos variables categ\u00f3ricas (contingencia 2 \u00d7 k).<\/td>\n<td><strong>Chi-cuadrado de independencia<\/strong>.<\/td>\n<td><code>chisq.test(tabla)<\/code><\/td>\n<td>Conteos esperados &gt; 5 en \u2265 80 % de las celdas.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h4>6.2.1 t-test paso a paso (penguins)<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\nlibrary(dplyr)\r\nlibrary(palmerpenguins)\r\n\r\npenguins_clean &lt;- penguins |&gt; \r\n  filter(!is.na(body_mass_g), !is.na(species)) |&gt; \r\n  filter(species %in% c(&quot;Adelie&quot;, &quot;Gentoo&quot;))\r\n\r\nwith(penguins_clean, t.test(body_mass_g ~ species))\r\n<\/pre>\n<ul>\n<li>R informa el estad\u00edstico t, grados de libertad, valor <em>p<\/em> y la diferencia de medias con intervalo de confianza 95 %.<\/li>\n<li>Si <em>p<\/em> &lt; 0.05 \u21d2 evidencia suficiente para<br \/>\n  afirmar que las especies difieren en masa.<\/li>\n<\/ul>\n<h4>6.2.2 Chi-cuadrado expr\u00e9s<\/h4>\n<pre class=\"brush: r; title: ; notranslate\" title=\"\">\r\ntabla_bebida &lt;- table(datos$genero, datos$bebida)\r\nchisq.test(tabla_bebida)\r\n<\/pre>\n<p>\nR entrega \u03c7\u00b2, df y valor <em>p<\/em>.<br \/>\nSi <em>p<\/em> &lt; 0.05 \u21d2 la preferencia de bebida est\u00e1 asociada al g\u00e9nero.\n<\/p>\n<h4>Consejos \u201clight\u201d para toy datasets<\/h4>\n<ul>\n<li>Siempre <code>na.omit()<\/code> o <code>drop_na()<\/code> antes de la prueba.<\/li>\n<li>Comprueba normalidad con un histograma r\u00e1pido o <code>shapiro.test()<\/code> (n \u2264 50).<\/li>\n<li>Para varianzas dispares usa <code>t.test(..., var.equal = FALSE)<\/code> (Welch).<\/li>\n<li>Si alg\u00fan conteo esperado &lt; 5: agrupa categor\u00edas o usa <code>fisher.test()<\/code>.<\/li>\n<li>Reporta: estad\u00edstico, df, valor <em>p<\/em>, estimaciones (diferencia o raz\u00f3n) y<br \/>\n      un IC 95 %. Ejemplo:<br \/>\n      \u201ct(81.4)=-4.23, <em>p<\/em>&lt;.001; \u0394 x\u0304 = \u2013102 g<br \/>\n      [-150, -55], mayor masa en Gentoo\u201d.<\/li>\n<\/ul>\n<p>\nCon estos pasos tu mini-investigaci\u00f3n ya tiene una pregunta acotada, una prueba apropiada y un resultado interpretable que enlaza con la historia que empezaste a contar mediante tablas y gr\u00e1ficos.\n<\/p>\n<p><\/body><\/p>\n","protected":false},"excerpt":{"rendered":"<p>De toy datasets a mini-proyecto de investigaci\u00f3n con R Objetivos de aprendizaje Descubrir y cargar toy datasets integrados en R y en paquetes populares. Explorar y resumir variables clave con funciones base y tidyverse. Plantear una pregunta de investigaci\u00f3n clara y viable con datos de juguete. Dise\u00f1ar un flujo de trabajo reproducible desde la exploraci\u00f3n [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"iawp_total_views":153,"footnotes":""},"categories":[1164,973],"tags":[],"class_list":["post-33334","post","type-post","status-publish","format-standard","hentry","category-analisis-de-datos-con-r","category-computacion-e-informatica"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\/material<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\/material\" \/>\n<meta property=\"og:description\" content=\"De toy datasets a mini-proyecto de investigaci\u00f3n con R Objetivos de aprendizaje Descubrir y cargar toy datasets integrados en R y en paquetes populares. Explorar y resumir variables clave con funciones base y tidyverse. Plantear una pregunta de investigaci\u00f3n clara y viable con datos de juguete. Dise\u00f1ar un flujo de trabajo reproducible desde la exploraci\u00f3n [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/\" \/>\n<meta property=\"og:site_name\" content=\"toposuranos.com\/material\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/groups\/toposuranos\" \/>\n<meta property=\"article:published_time\" content=\"2025-07-07T20:05:23+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-07-08T20:27:04+00:00\" \/>\n<meta name=\"author\" content=\"giorgio.reveco\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@topuranos\" \/>\n<meta name=\"twitter:site\" content=\"@topuranos\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"giorgio.reveco\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/#article\",\"isPartOf\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/\"},\"author\":{\"name\":\"giorgio.reveco\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#\\\/schema\\\/person\\\/e15164361c3f9a2a02cf6c234cf7fdc1\"},\"headline\":\"De toy datasets a mini-proyecto de investigaci\u00f3n con R\",\"datePublished\":\"2025-07-07T20:05:23+00:00\",\"dateModified\":\"2025-07-08T20:27:04+00:00\",\"mainEntityOfPage\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/\"},\"wordCount\":3138,\"commentCount\":0,\"publisher\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#organization\"},\"articleSection\":[\"An\u00e1lisis de Datos con R\",\"Computaci\u00f3n e Inform\u00e1tica\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/\",\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/\",\"name\":\"De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\\\/material\",\"isPartOf\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#website\"},\"datePublished\":\"2025-07-07T20:05:23+00:00\",\"dateModified\":\"2025-07-08T20:27:04+00:00\",\"breadcrumb\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/es\\\/cursos-de-matematica-y-fisica\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"De toy datasets a mini-proyecto de investigaci\u00f3n con R\"}]},{\"@type\":\"WebSite\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#website\",\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/\",\"name\":\"toposuranos.com\\\/material\",\"description\":\"\",\"publisher\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#organization\",\"name\":\"toposuranos.com\\\/material\",\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/logo.png\",\"contentUrl\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/logo.png\",\"width\":2400,\"height\":2059,\"caption\":\"toposuranos.com\\\/material\"},\"image\":{\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/groups\\\/toposuranos\",\"https:\\\/\\\/x.com\\\/topuranos\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UC16yDm12cPcrwsE0fAM7X1g\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/69429190\"]},{\"@type\":\"Person\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/#\\\/schema\\\/person\\\/e15164361c3f9a2a02cf6c234cf7fdc1\",\"name\":\"giorgio.reveco\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/1694478625378-96x96.jpeg\",\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/1694478625378-96x96.jpeg\",\"contentUrl\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/1694478625378-96x96.jpeg\",\"caption\":\"giorgio.reveco\"},\"description\":\"Soy Licenciado en F\u00edsica, Magister en Ingenier\u00eda Industrial y Docente Universitario. Me dedico a desmitificar la f\u00edsica y las matem\u00e1ticas. Mi objetivo es hacer que estos campos sean f\u00e1cilmente comprensibles para todos, proporcionando las herramientas para explorar no solo el mundo que nos rodea, sino tambi\u00e9n las profundidades de nuestra propia existencia y el orden natural que nos conecta con el cosmos.\",\"sameAs\":[\"http:\\\/\\\/toposuranos.com\\\/material\"],\"url\":\"http:\\\/\\\/toposuranos.com\\\/material\\\/author\\\/giorgio-reveco\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\/material","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/","og_locale":"es_ES","og_type":"article","og_title":"De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\/material","og_description":"De toy datasets a mini-proyecto de investigaci\u00f3n con R Objetivos de aprendizaje Descubrir y cargar toy datasets integrados en R y en paquetes populares. Explorar y resumir variables clave con funciones base y tidyverse. Plantear una pregunta de investigaci\u00f3n clara y viable con datos de juguete. Dise\u00f1ar un flujo de trabajo reproducible desde la exploraci\u00f3n [&hellip;]","og_url":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/","og_site_name":"toposuranos.com\/material","article_publisher":"https:\/\/www.facebook.com\/groups\/toposuranos","article_published_time":"2025-07-07T20:05:23+00:00","article_modified_time":"2025-07-08T20:27:04+00:00","author":"giorgio.reveco","twitter_card":"summary_large_image","twitter_creator":"@topuranos","twitter_site":"@topuranos","twitter_misc":{"Escrito por":"giorgio.reveco","Tiempo de lectura":"13 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/#article","isPartOf":{"@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/"},"author":{"name":"giorgio.reveco","@id":"http:\/\/toposuranos.com\/material\/#\/schema\/person\/e15164361c3f9a2a02cf6c234cf7fdc1"},"headline":"De toy datasets a mini-proyecto de investigaci\u00f3n con R","datePublished":"2025-07-07T20:05:23+00:00","dateModified":"2025-07-08T20:27:04+00:00","mainEntityOfPage":{"@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/"},"wordCount":3138,"commentCount":0,"publisher":{"@id":"http:\/\/toposuranos.com\/material\/#organization"},"articleSection":["An\u00e1lisis de Datos con R","Computaci\u00f3n e Inform\u00e1tica"],"inLanguage":"es","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/#respond"]}]},{"@type":"WebPage","@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/","url":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/","name":"De toy datasets a mini-proyecto de investigaci\u00f3n con R - toposuranos.com\/material","isPartOf":{"@id":"http:\/\/toposuranos.com\/material\/#website"},"datePublished":"2025-07-07T20:05:23+00:00","dateModified":"2025-07-08T20:27:04+00:00","breadcrumb":{"@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/"]}]},{"@type":"BreadcrumbList","@id":"http:\/\/toposuranos.com\/material\/es\/de-toy-datasets-a-mini-proyecto-de-investigacion-con-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"http:\/\/toposuranos.com\/material\/es\/cursos-de-matematica-y-fisica\/"},{"@type":"ListItem","position":2,"name":"De toy datasets a mini-proyecto de investigaci\u00f3n con R"}]},{"@type":"WebSite","@id":"http:\/\/toposuranos.com\/material\/#website","url":"http:\/\/toposuranos.com\/material\/","name":"toposuranos.com\/material","description":"","publisher":{"@id":"http:\/\/toposuranos.com\/material\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"http:\/\/toposuranos.com\/material\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"http:\/\/toposuranos.com\/material\/#organization","name":"toposuranos.com\/material","url":"http:\/\/toposuranos.com\/material\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"http:\/\/toposuranos.com\/material\/#\/schema\/logo\/image\/","url":"http:\/\/toposuranos.com\/material\/wp-content\/uploads\/2023\/10\/logo.png","contentUrl":"http:\/\/toposuranos.com\/material\/wp-content\/uploads\/2023\/10\/logo.png","width":2400,"height":2059,"caption":"toposuranos.com\/material"},"image":{"@id":"http:\/\/toposuranos.com\/material\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/groups\/toposuranos","https:\/\/x.com\/topuranos","https:\/\/www.youtube.com\/channel\/UC16yDm12cPcrwsE0fAM7X1g","https:\/\/www.linkedin.com\/company\/69429190"]},{"@type":"Person","@id":"http:\/\/toposuranos.com\/material\/#\/schema\/person\/e15164361c3f9a2a02cf6c234cf7fdc1","name":"giorgio.reveco","image":{"@type":"ImageObject","inLanguage":"es","@id":"http:\/\/toposuranos.com\/material\/wp-content\/uploads\/2023\/10\/1694478625378-96x96.jpeg","url":"http:\/\/toposuranos.com\/material\/wp-content\/uploads\/2023\/10\/1694478625378-96x96.jpeg","contentUrl":"http:\/\/toposuranos.com\/material\/wp-content\/uploads\/2023\/10\/1694478625378-96x96.jpeg","caption":"giorgio.reveco"},"description":"Soy Licenciado en F\u00edsica, Magister en Ingenier\u00eda Industrial y Docente Universitario. Me dedico a desmitificar la f\u00edsica y las matem\u00e1ticas. Mi objetivo es hacer que estos campos sean f\u00e1cilmente comprensibles para todos, proporcionando las herramientas para explorar no solo el mundo que nos rodea, sino tambi\u00e9n las profundidades de nuestra propia existencia y el orden natural que nos conecta con el cosmos.","sameAs":["http:\/\/toposuranos.com\/material"],"url":"http:\/\/toposuranos.com\/material\/author\/giorgio-reveco\/"}]}},"_links":{"self":[{"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/posts\/33334","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/comments?post=33334"}],"version-history":[{"count":0,"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/posts\/33334\/revisions"}],"wp:attachment":[{"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/media?parent=33334"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/categories?post=33334"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/toposuranos.com\/material\/wp-json\/wp\/v2\/tags?post=33334"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}