Guía Esencial para Empezar en R con RStudio. Parte 1
Rosa Molina
En esta entrada del blog de R para biólogos veremos cómo prepararnos para empezar a hacer estadística y visualización de datos en R desde cero. Es imperativo comenzar con lo esencial para que más adelante en el blog podamos hablar de temas más avanzados.
Esta es la PARTE 1, donde hablaremos de la instalación de R y RStudio, comenzaremos un tour por la interfaz, veremos los tipos de datos (data types) básicos y terminaremos hablando un poco sobre funciones. Vamos allá.
ADVERTISEMENT
Instalar R y RStudio
Lo primero que hay que hacer si no tienes instalado R es descargar la versión más reciente. Esta entrada fue hecha con la versión 3.6.3 para Windows, la cual es la más estable al momento de la realización de este artículo.
Ahora lo siguiente es instalar RStudio. Esto es algo clave: R es el lenguaje de programación y RStudio es el entorno de desarrollo. Repito:
R es el lenguaje de programación y RStudio es el entorno de desarrollo.
R es como la línea de comandos (símbolo del sistema) en Windows, puedes hacer muchas cosas desde ahí, pero normalmente usas el explorador y trabajas con ventanas (lo que sería RStudio). Descarga RStudio.
RStudio. Tour Express Parte 1. Operaciones básicas
Cuando abrimos RStudio, se ve algo más o menos así:
Puede ser abrumador, pero si lo vemos por partes será más ameno.
Primero el script. Por defecto es la ventana superior izquierda y en esta ventana escribimos los comandos que queremos que R ejecute. Todo lo que escribas aquí se puede guardar como archivo de texto con la extensión .R para que lo compartas con tus amigos.
Para ejecutar una línea (un renglón) de comandos de un script, presionamos el botón de
Run o el atajo Ctrl
+ ENTER
. Cuando ejecutamos una línea, lo que sucede es que pasamos del script a la consola.
La consola es la ventana inferior izquierda, y donde R despliega los resultados de los comandos ejecutados.
En esta ventana también podemos escribir comandos directamente y ejecutarlos presionando ENTER
. Además, podemos ver nuestro historial de comandos si presionamos la tecla de flecha arriba.
Llegó la hora de la verdad, vamos a escribir las siguientes líneas en la ventana del script:
#La hora de la verdad
2 + 3 - 4
Y ejecutarlas presionando Ctrl
+ ENTER
:
1
Voilá. ¿Te fijaste en la línea que comienza con el #? Es un comentario. Los comentarios sirven para dejar notas (ya sea para ti mismo o los demás) sobre lo que trata el script. R no ejecuta nada que esté tras un # en una línea.
Subamos de nivel:
2 * 2 / 4
1
Con R podemos hacer multiplicaciones (con el signo *, no lo olvides) y divisiones, potencias (^) y raíces, operaciones con vectores y matrices, y mucho, mucho, MUCHO más.
¡Ah, pero ya nos estamos adelantando! A continuación veremos los tipos de datos.
Tipos de datos (data types)
Los tipos de datos que necesitas conocer por ahora son tres: numérico (numeric), lógico (logical) y caracteres (character).
- Numérico: se refiere a los números reales. 10, 999, 1.5, -100.
- Lógico: se refiere a si algo es verdadero o falso. TRUE, FALSE
- Caracteres: se refiere a cualquier texto, siempre y cuando esté en comillas simples ('') o dobles (""). 'a', "hola", '20', "TRUE"
Ahora probemos los diferentes tipos de datos mientras aprendemos sobre funciones.
Funciones
Una función ejecuta una tarea específica. Por ejemplo:
class(100)
"numeric"
La función class()
devuelve el tipo de dato, en este caso numérico, del valor que escribas.
Las funciones constan de cuatro partes:
- Nombre: es el texto que se usa para invocar a la función. En nuestro ejemplo sería "class".
- Argumentos: son los valores que necesita una función para poder ejecutarse. En nuestro ejemplo sería el valor numérico 100.
-
Cuerpo: es el código que define a la función. No lo vemos, pero detrás de nuestra función
class()
hay un conjunto de comandos que establecen lo que hace. - Salida: es el resultado que devuelve la función, también está definido en el cuerpo. En nuestro ejemplo la salida corresponde al texto: "numeric".
R contiene por defecto muchas funciones, como class()
, pero puedes definir tus propias funciones para tus necesidades. Incluso puedes acceder a funciones desarrolladas por otras personas por medio de librerías/paquetes. Pero ya nos estamos adelantando de nuevo. En la próxima entrada seguiremos con variables, estructuras de datos y terminaremos el tour por las demás ventanas de RStudio, así que no te lo pierdas.
Comentarios finales
La mayoría de lo que tratamos hoy es básico, pero es esencial. Lo más avanzado requiere que dominemos estos conceptos pues es construido a partir de éstos. No va a haber un día que programes en R y no uses algún tipo de dato o una función. Sugiero guardar esta página en favoritos si te sirve, porque a todos se nos olvidan estas cosas de vez en cuando.
Si el blog te ha ayudado de alguna manera, por favor considera compartirlo en redes. Nos ayudas mucho haciéndolo.
Por último, quisiera recomendarte recursos muy buenos (en inglés) para consultar:
- DataNovia. Tutoriales de estadística y visualización de datos.
- Quick-R. Lectura y manejo de datos, estadística y visualización.
- r-statistics.co. Machine learning y estadística computacional.
- The R Graph Gallery. Visualización de datos.
- from Data to Viz. Visualización de datos.
- RStudio Cheatsheets.
- R Tutorial. Estadística y visualización.
- R Tutorial. Programación, estadística y visualización.
Eso es todo, ¡gracias por leer!
Esta publicación fue hecha usando R versión 3.6.3 (2020-02-29).
ADVERTISEMENT
- 0 comentarios
- Categorías:
- Básico
- R para biólogos