Curso de introducción a R - 3ª edición

Barcelona, 28-30 Septiembre 2005

INSCRIPCIONES CERRADAS.

Introducción

R se ha convertido en los últimos años en una herramienta ampliamente utilizada en la investigación en estadística y otros campos con una fuerte componente aplicada. Se trata de un software gratuito, derivado del lenguaje S, que se caracteriza por su versatilidad y por la participación constante de una comunidad de investigadores en su desarrollo. Por otro lado, el hecho de no disponer de un interfaz basado en menús hace que el proceso de aprendizaje sea más costoso respecto a otros paquetes comerciales (S-PLUS, SPSS, …). Una vez superado este aprendizaje, R se convierte en una herramienta ideal para el análisis estadístico, programación de funciones y para la representación gráfica de resultados. Además, una gran cantidad de código en R, desarrollado por investigadores particulares, se encuentra accesible libremente via la web del proyecto (www.r-project.org) lo que le convierte en una plataforma ideal para la implementación y difusión de nuevos métodos estadísticos.

Objetivos

Familiarizar al alumno con el entorno R y con sus principales utilidades, tanto en el análisis estadístico como en el aspecto de la programación y de los gráficos. Cuando acabe el curso, el alumno será capaz de desenvolverse con facilidad en el entorno R, habiendo asimilado los conceptos fundamentales.

Dirigido a

Estudiantes, profesores e investigadores con conocimientos de estadística, que deseen introducirse en el uso de R por cualquier motivo: análisis de datos, investigación y/o docencia. Determinados conocimientos de estadística y de programación básica, aunque no son imprescindibles, sin duda permitirán un mayor aprovechamiento del curso.

Metodología del curso

Curso eminentemente práctico, exponiéndose los principios conceptuales. Se realizará en una sala de PC’s de forma que la interacción alumno-ordenador será continua. El curso se dividirá en sesiones temáticas, con una duración media de una hora. Cada una de las sesiones consistirá en una exposición teórica inicial de los conceptos más relevantes, y donde los alumnos ya podrán experimentar con el sotware. La sesión finalizará con la proposición de unos ejercicios prácticos, que deberán ser resueltos por los alumnos con la ayuda del profesorado. Los asistentes al curso recibirán como material todas las diapositivas de las exposiciones teóricas, así como el enunciado y la solución de todos los ejemplos resueltos y propuestos.

Fechas y horario

El curso tendrá una duración total de 24 horas. Se impartirá los días 28, 29 y 30 de septiembre de 2005, con el siguiente horario:

Programa (preliminar)

Día
Sesión
Contenido
28/09/2005
1 - Introducción y preliminares
  • El entorno R.
  • Software relacionado: un poco de historia.
  • Distribuciones de R.
  • Primeras nociones: el help de R.
  • Primeras nociones: comandos, case-sensitivity.
  • Primeras nociones:ejecutar comandos desde/enviar salida a archivos.
  • Primeras nociones: permanencia de los datos y eliminación de objetos.
  • Primeras nociones: librerías de R.
  • Permanencia de los datos y eliminación de objetos.
2 - Manipulaciones simples: números y vectores
  • Vectores y asignaciones.
  • Aritmética de vectores.
  • Generación de secuencias regulares.
  • Valores missing.
  • Vectores lógicos.
  • Vectores de cadenas de caracteres (strings).
  • Indexación de vectores.
  • Coerción de tipos.
  • Otros tipos de objetos en R.
3 - Arrays y matrices
  • Arrays.
  • Indexación de arrays.
  • La función array().
  • Facilidades con matrices
4 - Listas y data frames
  • Listas.
  • Data frames.
  • Trabajando con data frames: attach y detach.
  • Factores.
5 - Lectura de datos de ficheros externos
  • La función read.table().
  • La función data().
  • La librería foreign.
6 - Procedimientos gráficos en R
  • Procedimientos gráficos.
  • Comandos gráficos de alto nivel.
  • La función plot.
  • Parámetros de los comandos de alto nivel.
  • Comandos gráficos de bajo nivel.
  • Interactuando con los gráficos.
  • Otros comandos de alto nivel.
29/09/2005
7 - Programación en R
  • Agrupación de expresiones.
  • Ejecución condicional: if.
  • Ejecución repetitiva (bucles): for, repeat y while.
  • Ejemplos de bucles.
  • Creación de nuevas funciones.
  • Un ejemplo de función simple.
  • Definición de nuevos operadores binarios.
  • Nombres de argumentos y valores por defecto.
8 - Distribuciones de probabilidad
  • Distribuciones de probabilidad.
  • Gráficos para distribuciones de probabilidad.
  • Generación de muestras aleatorias.
  • Estudio de la distribución de un conjunto de datos.
  • Estimación de densidades.
9 - Introducción a la estadística básica y gráficos
  • Estadísticos resumen.
  • Gráficos para una variable.
  • Estadísticos resumen por grupos.
  • Gráficos para datos agrupados.
  • Tablas.
  • Gráficos para tablas.
10 - Pruebas para una y dos muestras
  • T-test para una muestra.
  • Test de Wilcoxon.
  • T-test para dos muestras.
  • Comparación de varianzas.
  • Test de Wilcoxon para dos muestras.
  • T-test apareado.
  • Test de Wilcoxon apareado.
11 - Regresión lineal simple
  • Regresión lineal simple.
  • Correlación.
12 - Análisis de la varianza
  • One-way ANOVA.
  • Two-way ANOVA.
13 - Gráficos avanzados en R
  • Uso de parámetros gráficos.
  • Cambios permanentes: la función par().
  • Lista de parámetros gráficos.
  • Dispositivos gráficos (device drivers).
30/09/2005
14 - Programación avanzada en R
  • El argumento “…”.
  • Funciones recursivas.
  • Estrategias para evitar bucles.
  • Lexical scope.
  • Personalización del entorno.
  • Orientación a objetos.
  • Creación de nuevas clases.
15 - Pruebas para datos categóricos
  • Una proporción.
  • Dos proporciones independientes.
  • K proporciones, contraste para tendencia.
  • Tablas de contingencia.
16 - Regresión lineal mútliple
  • Variables explicativas contínuas.
  • Regresión polinómica.
17 - Regresión logística
  • Regresión logística.
  • Test de tendencia.
  • Regresión logística a partir de un dataset.
  • Predicción.
  • Validación.
18 - Análisis de supervivencia
  • Análisis de supervivencia.
  • Estimador de Kaplan-Meier.
  • Test del log-rank.
  • Modelo de Cox.
19 - Modelos lineales mixtos
  • Modelos lineales mixtos.
20 - Métodos de clasificación
  • Análisis de componentes principales.
  • Multidimensional scaling.
  • Métodos de clasificación.
  • Análisis de correspondencias.

Bibliografía

El programa del curso y los materiales están basados principalmente en los siguientes manuales, accesibles desde la web del proyecto:

Otras referencias utilizadas parcialmente son:

Profesorado

El curso está organizado y corrdinado por la Unidad de Bioestadística y Bioinformática del Servicio de Epidemiologia y Registro del Cáncer, del Instituto Catalán de Oncología. Los profesores del curso son:

Precio e inscripciones - INSCRIPCIONES CERRADAS.

Por la limitación de las aulas y de los recursos informáticos, el curso tiene una asistencia máxima de 30 personas. Las plazas serán entregadas en riguroso orden de inscripción. El precio de las inscripciones es el mismo para todos los asistentes y es de 200 €.

La inscripción del curso se tiene que realizar enviando un e-mail a cursoR@iconcologia.catsalut.net, poniendo "Inscripción curso R" en el asunto. Una vez nosotros respondamos informando de la disponibilidad de plazas se tendrá que hacer un ingreso en la cuenta corriente mencionada posteriomente. La inscripción no será definitiva hasta que no se reciba comprobante del ingreso bancario via Fax al número 93.260.77.87 (Att. Xavier Solé indicando "Curso R"). En el concepto del ingreso debe constar el texto "Curso R + nombre y apellidos" de la persona inscrita. Para evitar problemas con las inscripciones se recomienda hacer el ingreso tan pronto como se reciba el correo electrónico con la aceptación de la solicitud.

Forma de pago: Transferencia bancaria a Institut Català d'Oncologia - "Curso R" a la siguiente CC:

BBVA 0182-5734-33-0201111126 (para transferencias desde España)

BBVA ESMMXXXES16 01825734330201111126 (para transferencias desde fuera de España)

CERTIFICADO
Al finalizar el curso se entregará certificado de asistencia.

Lugar

El curso se desarrollará en las aulas de informática de la Facultad de Medicina de la Universitat Autònoma de Barcelona (UAB), en Bellaterra. La universidad se encuentra a unos 30 km del centro de Barcelona. La manera más fácil de llegar es con los trenes de RENFE o con los Ferrocarrils de la Generalitat de Catalunya (hay estaciones de ambos dentro del campus, la de los FGC cae más cerca). El trayecto desde el centro de Barcelona hasta el campus puede durar unos 45 minutos. En esta web del Servei d'Estadística de la UAB tenéis como llegar hasta allí de una manera más detallada.

Contacto e información adicional

El curso se impartirá íntegramente en castellano. Para cualquier información o duda acerca del curso se puede contactar telefónicamente o via e-mail a:

Servei d'Epidemiologia i Registre del Càncer
Institut Català d'Oncologia
Av Gran Via s/n km 2,7
08907 L'Hospitalet de Llobregat, Barcelona
Telf: 93-260 78 12 / 93-260 74 01
Fax: 93-260 77 87


Last updated
17-06-2005