Curso de primavera de análise de datos multivariantes e software da CRoNoS

3 de Abril de 2018 – 5 de Abril de 2018
Limassol, Chipre.
Datas: 3 de Abril-5 de abril de 2018 
Localización: Poseidonia Beach Hotel, Limassol, Chipre.
Organizadores: Ana Colubi e Erricos Kontoghiorghes, como representates da CRoNoS COST Action.
Poñentes: 
Anne Ruiz-Gazen, Toulouse School of Economics, France.
Simon Caton, National College of Ireland, Ireland.
Roland Fried, TU Dortmund University, Germany.
Cristian Gatu, Alexandru Ioan Cuza University of Iasi, Romania. 

Cursos:

  • Detección multivariante de datos atípicos mediante ICS (8 horas)
    Anne Ruiz-Gazen, Escola de Economía de Toulouse, Francia.
    Despois dunha introdución práctica do uso xeral de R para a análise de datos multivariante, o obxectivo do curso é presentar o método de Selección de Coordenadas Invariantes (ICS) como ferramenta para a detección datos atípicos multivariantes. O ICS foi proposto por Tyler et al. (2009) mostra propiedades notables para revelar estruturas de datos como outliers ou clusters. Está baseado na descomposición espectral simultánea de dúas matrices de dispersión e leva a un sistema de coordenadas invisible non fiable onde a distancia euclidiana corresponde a unha distancia Mahalanobis (MD) no sistema orixinal. Non obstante, a diferenza do MD, ICS fai posible seleccionar compoñentes relevantes. Isto resulta útil para detectar atípicos situados nun pequeno subespazo dimensional en conxuntos de datos de alta dimensión. Este contexto aparece, en particular, en contextos onde se require alta fiabilidade, como nos sectores da automoción, aeronáutica e aeroespacial. Neste contexto, o ICS pode ser útil para detectar anomalías cunha pequena proporción de falsos positivos. O método ilustrarase en varios conxuntos de datos artificiais e reais utilizando os recentes paquetes R ICSOutlier e ICSShiny.
  • Paralelización de modelos en R con h2o (7 horas)
    Simon Caton, National College of Ireland, Irlanda.
    A escala de modelos é cada vez máis necesaria, non só dado o aumento continuado das bases de datos, senón tamén para facilitar os aspectos fundamentais da construción, prototipado e selección de modelos. Nesta sesión, exploraremos a aplicación de paquete h2o para facilitar a paralelización de modelos en R. A sesión comezará paralelizando unha selección de métodos multivariantes utilizando múltiples núcleos nas máquinas dos participantes. A partir de aquí, avanzarase para aproveitar os recursos da nube aumentando así aínda máis a escalabilidade do modelo e os tempos de execución. O curso culminará co asesoramento sobre os usos apropiados da nube e outras arquitecturas paralelas para a construción de modelos.
  • robts – un paquete R para series de tempo robustas e changepoing analysis (2 horas)
    Roland Fried, Universidade TU, Dortmund, Alemaña.
    Este paquete traballa baixo a hipótese de dependencia de curto alcance e proporciona diferentes técnicas para unha estimación robusta de autocorrelacións, autocorrelacións parciais e densidades espectrais, para a estimación robusta de modelos de series autorregresivas, para a diagnose do modelo e tarefas de predición. Dado que moitos modelos de series temporais asumen a estacionariedade de segunda orde, inclúense probas robustas para comprobar a estacionariedade da media, a varianza e as autocovarianzas. Se propong como traballo futuro a extensión a series multivariantes.
  • Estratexias computacionais para a selección de modelos (2 horas)
    Cristian Gatu, Universidade Alexandru Ioan Cuza, Iasi, Rumanía.
    Ferramentas computacionais para estimar os mellores modelos mediante best-subset regression. Os algoritmos están baseados nunha estrutura de árbore de regresión que xera todos os modelos de subconxuntos posibles. É un algoritmo eficiente e razoado que atopa os mellores submodelos sen xerar toda a árbore. Específicamente, a carga computacional se reduce pola poda dos subárbones non óptimos. Estúdanse as estratexias e algoritmos aproximados que melloran o rendemento computacional. Ademais, estas estratexias están adaptadas para resolver o problema da selección de subconxuntos de regresión baixo a condición de coeficientes non negativos. A solución baséase nunha aproximación alternativa á programación cuadrática que deriva dos mínimos cadrados non negativos resolvendo as ecuacións normais para un número de subproblemas mínimos sen restricións. Este enfoque innovador é computacionalmente superior ao método directo que estimaría os mínimos cadrados non negativos correspondentes de todos os submodelos posibles para seleccionar o mellor. Se introduce e describe o paquete R "lmSubsets" para a selección do subconxunto de regresión. Esta librería ten como obxectivo proporcionar unha ferramenta versátil para a regresión de subconxuntos.


Prezos: 
 

  Ata o 15 de febreiro, 2018 Ata o 9 de marzal, 2018 Ata o 23 de marzal, 2018 Despois do 23 de marzal, 2018
Membros de CRoNoS 120€ 170€  250€  350€
Non membros do CRoNoS 250€  270€   350€ 450€

2019  SGAPEIO   globbers joomla templates