Escola de Regressão

Sessões Temáticas


ST1: “Modelos Assimétricos: A flexibilidade bate às portas da regressão

Coordenadora:  Rosangela H. Loschi (UFMG)


Moments of truncated scale mixtures of skew-normal distributions

- Celso R. B. Cabral (UFAM)

Joint work with Víctor H. Lachos and Aldo M. Garayb

We consider the problem of finding the moments of a doubly truncated member of the class of scale mixtures of skew-normal (TSMSN) distributions. We obtain a general result and then use it to derive the moments in the case of doubly truncated versions of skew-normal, skew-t, skew-slash and skew-contaminated normal distributions. Many properties of the TSMSN family are studied, inference procedures are developed and a simulation study is performed to assess the procedures. Two applications are also provided, one of them in the context of censored regression models and another in the field of actuarial sciences.

 

Semi-parametric models for heterogeneous degradation data 

- Cristiano C. Santos (UFMG)  

Joint work with Rosangela H. Loschi

Degradation data are commonly considered to make reliability assessments in highly reliable systems. General path models are a possible approach to model the degradation behavior. This class of models includes random effects in its structure to account for correlation among the measures in a single unit. Distributions for random effects, which may have a nice interpretation in terms of the degradation rate, are usually specified assuming that degradation comes from homogeneous populations. Homogeneity    can be a strong assumption if there is high variability in the manufacturing process or whenever there is no guarantee that the devices works on similar conditions. We develop a semi-parametric degradation model able to accommodate multimodality in degradation data. That is achieved by assuming a Dirichlet process mixture of both normal and skew-normal distributions for the random effects. We also prove that the proposed model account for multimodality in the lifetime distribution. We carry out simulation studies and data analysis to show the flexibility of the proposed model in modeling skewness, heavy tail and multi-modal behavior of the random effects. 

 

Scale and Shape Mixtures of Multivariate Skew-Normal Distributions

- Reinaldo B. Arellano-Valle (PUC-Chile)

Joint work with Clécio S. Ferreira  (UFJF) and Marc G. Genton (KAUST-Arabia Saudita). 

We introduce a broad and flexible class of multivariate distributions obtained by both scale and shape mixtures of multivariate skew-normal distributions. We present the probabilistic properties of this family of distributions in detail and lay down the theoretical foundations for subsequent inference with this model. In particular, we study linear transformations, marginal distributions, selection representations, stochastic representations and hierarchical representations. We also describe an EM-type algorithm for maximum likelihood estimation of the parameters of the model and demonstrate its implementation on a wind dataset. Our family of multivariate distributions unifies and extends many existing models of the literature that can be seen as submodels of our proposal. 

 

ST2: “Avanços em modelos  de regressão série de potência

Coordenador: Carlos Alberto Ribeiro Diniz (UFSCar)


Palestrantes:

Carlos Alberto Ribeiro Diniz (UFSCar)

Katiane Silva Conceição (ICMC/USP)

Marinho Gomes de Andrade Filho (ICMC/USP)


Resumo:

Análise de dados de contagem ocupa uma posição de destaque dentro da estatística aplicada, uma vez que muitos problemas reais envolvem dados desta natureza. Em alguns casos, na prática, a quantidade de uma determinada observação no conjunto de dados é maior (inflação)  ou  menor  (deflação)  que  o  esperado  ao  considerarmos certas  distribuições discretas. Consequentemente, torna-se  inadequada  a  suposição desta distribuição nestas situações.  Neste contexto, distribuições mais gerais devem ser  usadas.  Nesta sessão temática discutiremos extensões em modelos de regressão envolvendo a família de distribuição série de potência para dados de contagem com discrepência em uma determinada observação.  Entre os trabalhos apresentados discutiremos modelos de regressão k-modificados; modelos de regressão autorregressivo inflacionados de zero; e modelo zero-modificado com efeito aleatório para dados longitudinais. Devido à grande quantidade de problemas reais envolvendo modelos de regressão para dados de contagem, é importante o desenvolvimento de novos modelos, capazes de explicar satisfatoriamente o comportamento de conjuntos de dados com diferentes características. Assim, justifica-se a proposta dessa sessão.

 

ST3: “Recentes avanços na análise de sobrevivência

Coordenadores: Vera Tomazella (UFSCar) e Enrico Colosimo (UFMG)

 

Zero-adjusted defective regression models for modelling lifetime data

- Vinicius Fernando Calsavara ( A.C.Camargo Cancer Center, Centro Internacional de Pesquisa)

We introduce a defective regression model for survival data modeling with a proportion of early failures or zero-adjusted. Our approach enables us to accommodate three types of units, that is, patients with “zero”' survival times (early failures) and those who are susceptible or not susceptible to the event of interest. Defective distributions are obtained from standard distributions by changing the domain of the parameters of the latter in such a way that their survival functions are limited to pϵ(0,1). We consider the Gompertz and inverse Gaussian defective distributions, which allow modeling of data containing a cure fraction. Parameter estimation is performed by maximum likelihood estimation, and Monte Carlo simulation studies are conducted to evaluate the performance of the proposed models. We illustrate the practical relevance of the proposed models on two real data sets. The first is from a study of occlusion of endoscopic stenting in patients with pancreatic cancer performed at A.C.Camargo Cancer Center, and the other is from a study on insulin use in pregnant women diagnosed with gestational diabetes performed at São Paulo University Medical School. Both studies were performed in São Paulo, Brazil.

 

Aplicação do Modelo Poisson Birnbaum Saunders Reparametrizado em Dados de Fadiga

- Elizabeth Mie Hashimoto (Departamento Acadêmico de Matemática – UTFPR)

Joint work with Janaína Fracaro de Souza Gonçalves (Departamento Acadêmico de Mecânica – UTFPR), Milena Chanes e Souza (Centro de Competência em Manufatura – ITA)

Componentes mecânicos submetidos a uma carga cíclica estão sujeitos a eventuais falhas. Por essa razão, pesquisas são realizadas para avaliar o quanto um componente pode ser resistente.  Nesse contexto, o objetivo do estudo foi avaliar o efeito da força (kN) aplicado sobre o componente e a presença de rebarba. Dessa forma, os dados foram obtidos por meio de um experimento conduzido no Instituto Tecnológico de Aeronáutica e analisados utilizando um modelo de tempo promoção Poisson Birnbaum-Saunders reparametrizado. Os resultados da análise mostraram que, ao nível de significância de 5%, não há diferença significativa entre os corpos de prova com e sem rebarba. Por outro lado, a cada 1kN que aumentamos no nível de stress, esperamos uma redução de aproximadamente 9% no tempo de vida. Agora, considerando uma força maior do que 12kN, menos de 0,16% dos corpos de prova não são suscetíveis a falha. Por fim, concluímos que o modelo de tempo-promoção Poisson Birnbaum-Saunders reparametrizado é útil para analisar o efeito de variáveis explicativas no tempo de vida médio sem a necessidade da transformação logarítmica na variável resposta. Além disso, por meio do modelo, foi possível mostrar que a força reduz o tempo de vida dos corpos de prova e também diminui a proporção de corpos de provas não susceptíveis ao evento de interesse.

 

Log-symmetric regression models with allowance for correlated errors applied to mortality data

- Helton Saulo (Universidade de Brasilia-UnB)

Joint work with Roberto Vila - UnB

Log-symmetric regression models are particularly useful when the response variable is continuous, strictly positive and asymmetric. In this paper, we proposed a class of log-symmetric regression models in the context of correlated errors. The proposed models provide a novel alternative to the existing log-symmetric regression models due to its flexibility in accommodating correlation. We discuss some properties, parameter estimation by the conditional maximum likelihood method and goodness of fit of the proposed model. We also provide expressions for the observed Fisher information matrix. A Monte Carlo simulation study is presented to evaluate the performance of the conditional maximum likelihood estimators. Finally, a full analysis of a real-world mortality data set is presented to illustrate the proposed approach. 

 

ST4: “Inovação e Transferência de Tecnologia em Estatística

Sessão Temática proposta pelo CEPID – CeMEAI – Centro de Ciências Matemáticas Aplicadas à Indústria)

Coordenadores: Francisco Louzada (ICMC/USP) e Gleici Castro Perdona (FMRP - USP)


Palestrantes:

Francisco Louzada (ICMC - USP)

Júlio M. Stern (IME - USP)

Marcelo Lauretto (USP Leste)

Gleici Castro Perdona (FMRP - USP)

Nikolai Kolev (IME - USP)

 

Inovação e Transferência de Tecnologia em Estatística: O caso do CeMEAI (Centro de Ciências Matemáticas Aplicadas à Indústria)

Francisco Louzada

O Centro de Matemática e Estatística Aplicada à Indústria (CeMEAI) tem como missão o fornecimento de amplos recursos e mecanismos para conectar cientistas, engenheiros, matemáticos, estatísticos e especialistas em computação em um ambiente colaborativo e envolvente. Seus principais objetivos são formar recursos humanos de alto nível, desenvolver novas técnicas matemáticas e estatísticas transformadoras e explorar suas aplicações em benefício da sociedade e das indústrias e instituições nacionais.
Nessa conferência são apresentados os principais ações e atividades de inovação estatística que temos desenvolvido junto ao Centro de Matemática e Estatística Aplicadas à Industria (CeMEAI), no sentido de aproximar a academia, o setor produtivo e a população em geral. Os impactos sociais, culturais e financeiros de nossas ações e atividades são exemplificados por meio de casos reais de sucesso. 


Avaliação da aleatorização em distribuições de casos: análise de caso do Supremo Tribunal Federal

Julio Michael Stern

Métodos de sorteio têm sido amplamente empregados para a distribuição de processos judiciais, como uma barreira para impedir interferências ilegítimas entre as partes de um processo ou entre agentes do sistema. Nos sistemas judiciários dos países ocidentais modernos, procedimentos de aleatorização são empregados principalmente para selecionar o júri, o tribunal e/ou o juíz responsável por julgar um processo. Tais procedimentos exercem um papel importante no curso de um processo, e deveriam atender a alguns princípios, tais como transparência e completa auditabilidade. Não obstante, esses princípios são usualmente negligenciados. A distribuição de processos no Supremo Tribunal Federal brasileiro é um exemplo, uma vez que são empregados procedimentos de sorteio que são desconhecidos pela sociedade. Esse trabalho apresenta uma revisão de como métodos de sorteio têm sido historicamente empregados pelas sociedades, e discute como a Estatística Matemática pode ser aplicada em procedimentos de aleatorização no sistema judicial da mesma forma como tem sido aplicada, por exemplo, em ensaios clínicos. Propomos um modelo estatístico para avaliar a aleatoriedade em distribuição de processos, aplicando-o em um estudo de caso do Supremo Tribubal Federal. Adicionalmente, apresentamos algumas recomendações para o desenvolvimento de bons procedimentos de aleatorização. Este trabalho écco-autorado por Diego Marcondes e Claudia Peixoto.


Multi-state models for progression of first stage of spontaneous labour

Gleici Castro Perdona

The quality of care during the time of childbirth is crucial for mothers and their babies, as most pregnancy-related deaths and morbidities are clustered around this time. The partograph has been the central tool used in recent decades to monitor the women at this stage, and, because of its simplicity, it is frequently used in low-and-middle-income countries. However, its use is highly questioned due to the lack of evidence to justify a contribution to labor. In this paper, we propose the use of multi-state models to explore the progression of the first stage of spontaneous labor, considering augmentation of labor as an intermediate state between vaginal delivery and cesarean section. Also, we considered information about cervical dilatation, membranes status, previous parity, comorbidity or pre-pregnancy complications and if the woman was referred from another health facility. Due to the repeated assessments of cervical dilatation over time in labor monitoring, this variable was considered under the fixed and time-dependent approaches. This work is co-authored by Alexandre C. Maiorano,Hayala C. Cavenague de Souza and Francisco Louzada.


Estudo de caso da Amostragem intencional fortuita na definição de redes de monitoramento atmosférico

Marcelo de Souza Lauretto

Nas ciências experimentais contemporâneas, a amostragem aleatória é o "padrão ouro" para garantir resultados não viesados, imparciais, ou justos. A aleatorização atua como uma barreira para prevenir comunicações espúrias ou interferências ilegítimas entre os agentes nas aplicações críticas, tais como experimentos científicos, distribuição de processos judiciais, processos de auditoria ou outras aplicações práticas. No entanto, uma ponto central é como evitar alocações aleatórias resultarem em grupos heterogêneos no que diz respeito a covariáveis relevantes. De fato, a chance de pelo menos uma covariável apresentar uma "diferença significante" entre dois grupos de tratamento aumenta exponencialmente com o número de covariáveis. A amostragem intencional fortuita foi desenvolvida com o objetivo específico de integrar técnicas de amostragem que, por um lado, fazem uso das vantagens da aleatorização padrão e, por outro lado, evitam o aumento exponencial no tamanho (e no custo) das amostras. Essa abordagem combina os princípios da amostragem intencional - através de técnicas de programação multiobjetivos - com perturbações aleatórias para induzir as propriedades desejáveis de desacoplamento entre unidades amostrais. Neste trabalho, apresentamos um estudo de caso relativo ao monitoramento da qualidade do ar no Estado de São Paulo (Brasil), que exemplifica as vantagens da Amostragem Intencional Fortuita no planejamento de experimentos. Este trabalho é co-autorado por Julio M. Stern, Rafael B. Stern, Fabio Nakano, Oswaldo L.V.Costa e Celma O. Ribeiro.


Bivariate Marshall-Olkin´s Type Regression Models

- Nikolai Kolev (IME-USP)

In this talk we propose two new bivariate regression models. The first one assumes that the error terms are governed by the Marshall-Olkin´s copula. The second model treats the bivariate correlated frailty scenario, where the two life spans are conditionally independent given both frailties which are generated by the Marshall-Olkin´s bivariate exponential model. Applications in Industry and Medicine will be discussed.