JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

Descrevemos um método de vários estágios para medir um efeito de coorte com dados de idade, permitindo assim que os dados sejam eliminados em muitas situações sem sacrificar a qualidade dos dados. O protocolo demonstra a estratégia e fornece um modelo de regressão ponderada para análise dos dados do carcinoma hepatocelular.

Resumo

Para eliminar a influência da idade e do período nos dados da tabela de contingência do ciclo etário, um método de múltiplos estágios foi adotado para avaliar o efeito da coorte. O tumor maligno primário mais geral do fígado é o carcinoma hepatocelular (CHC). O CHC está associado à cirrose hepática com etiologias alcoólicas e virais. Em epidemiologia, as tendências de longo prazo na mortalidade por CHC foram delineadas (ou previstas) usando um modelo de coorte de período de idade (APC). Os óbitos por CHC foram determinados para cada coorte com sua influência ponderada. O intervalo de confiança (IC) da média ponderada é bastante estreito (em comparação com as estimativas igualmente ponderadas). Devido ao IC bastante estreito e com menos incerteza, a estimativa média ponderada foi usada como meio de previsão. Com o método de múltiplos estágios, recomenda-se o uso da estimativa média ponderada com base em um modelo de regressão para avaliar o efeito de coorte nos dados da tabela de contingência idade-período.

Introdução

O tumor maligno primário mais comum do fígado é o carcinoma hepatocelular (CHC). Sua taxa de mortalidade ocupa o quinto lugar em homens e o oitavo em mulheres (6% dos homens e 3% das mulheres) 1 entre todos os tumores malignos em todo o mundo. Em Taiwan, é o câncer mais comum em homens e o segundo câncer mais comum em mulheres (21,8% dos homens e 14,2% das mulheres) 2. Estima-se que, desde 2000, o número anual de CHCs diagnosticados em todo o mundo seja de 564.000, entre os quais 398.000 são homens e 166.000 são mulheres 3. Em epidemiologia, a maneira mais comum de explicar a relação entre as variáveis idade, período e coorte (APC) é que a idade e o período se influenciam mutuamente para criar uma experiência geracional única para a tendência da doença investigada.

Embora essa conceituação ainda tenha uma conexão linear precisa de idade + coorte = período, a exposição (preditor) não é um fator inerente a uma coorte de nascimento. Em vez disso, propomos que, quando as mudanças causam diferentes distribuições de doenças, há um efeito de coorte. No entanto, como idade + coorte = período, essas três variáveis estão linearmente relacionadas; somente se outras restrições forem aplicadas é impossível gerar um modelo estimado de idade-período-coorte (APC) usando os efeitos lineares de idade, período e coorte. Neste estudo, esclarecemos esse problema e as possíveis restrições que impusemos em nossas publicações anteriores 4,5,6,7.

Com as menores conjecturas sobre os dados da tabela de contingência, o método de múltiplos estágios 8 fornece três estágios para avaliar o efeito da coorte. Além disso, como o polimento mediano não depende de uma distribuição ou estrutura específica, ele foi usado para vários tipos de dados, como proporções, proporções logarítmicas e contagens. O polimento mediano é a principal técnica usada no método multifásico.

Os dados de uma tabela de contingência de duas vias 9 foram usados para gerar o desenvolvimento da mediana polida. O procedimento de polimento da mediana é usado para eliminar os efeitos cumulativos da idade (ou seja, linha) e do período (ou seja, coluna), subtraindo iterativamente a mediana de cada linha e de cada coluna. Esse procedimento é frequentemente utilizado na análise de dados epidemiológicos 10. Uma vantagem dessa técnica é que não são necessárias suposições sobre a distribuição ou estrutura dos dados na tabela de contingência bidirecional. Portanto, essa técnica foi amplamente utilizada para qualquer tipo de dado contido na tabela, como dados de suicídio 11. O modelo APC também tem sido usado para descrever as tendências de longo prazo da incidência ou mortalidade da doença 5. Os modelos APC geralmente assumem que idade, período e coorte têm efeitos aditivos na transformação logarítmica da doença/mortalidade. Para avaliar os efeitos da coorte, o protocolo descrito gera um modelo APC para análise completa da mortalidade por carcinoma hepatocelular (CHC) com regressão ponderada, apoiando previsões confiáveis e avaliação moderada dos efeitos do tratamento.

Protocolo

1. Fontes de dados

Para demonstrar os cálculos, usamos dados anuais sobre a mortalidade por CHC de 1976 a 2015 para homens e mulheres em Taiwan. Para a execução dos protocolos deste estudo, foram utilizados os programas Statistical Package for Social Sciences (SPSS) versão 24.0 para Windows e Microsoft Excel.

  1. Peça ao médico do CHC que classifique os sintomas clínicos dos pacientes, exames laboratoriais e resultados de imagens médicas para fornecer um código de diagnóstico de acordo com o Código da Classificação Internacional de Doenças (CID), CID 150.
  2. Certifique-se de que o arquivo de dados (salvo como CSV) contenha o ano (ou seja, período), idade, coorte, número de óbitos, número da população no meio do ano e mortalidade como colunas.
    1. Clique em Arquivo | Importar dados | Dados CSV | Aberto. Verifique se há uma marca na caixa ao lado de Ler nomes de variáveis na primeira linha dos dados e clique em OK. Certifique-se de que o arquivo de dados seja importado para o SPSS.
  3. Construa dados da tabela de contingência cruzados por grupos de idade por meio do SPSS. Em geral, definimos variáveis de linha como idade e variáveis de coluna como período. Se os dados apresentassem dados de um único ano de período (ou ano de idade único), era necessário integrá-los em um grupo de período (ou faixa etária). Em seguida, tabulamos as atitudes em relação a uma faixa etária ao longo dos anos da pesquisa.
    1. Clique em Analisar | Estatística Descritiva | Tabulações cruzadas e selecione a variável idade na caixa ao lado da(s) linha(s) e a variável de período na caixa ao lado da(s) coluna(s). Clique em Células e verifique se há uma marca na caixa ao lado de Observado. Uma tabela de contingência do número de óbitos (ou número da população no meio do ano, ou mortalidade) pode ser realizada no SPSS pelas etapas acima.
    2. Exporte os dados da tabela de contingência que foram inseridos no formato CSV para análise por meio de outro software. Clique em Arquivo | Exportar dados | Garantir o formato de dados desejado como CSV | Localização. Este campo não editável exibe o local seguro para o arquivo exportado.
    3. Nome do arquivo: clique em Selecionar para alterar o nome do arquivo.
    4. Exportar como tipo: Selecione um tipo de arquivo CSV no menu suspenso. Clique em variáveis para exibir as variáveis disponíveis e selecionar as tabelas de variáveis. Por padrão, todas as variáveis do conjunto de dados de origem são retidas para o arquivo exportado. Os pesquisadores podem usar as tabelas para especificar quais variáveis de origem incluir no arquivo exportado. Clique em Exportar.

2. Configuração do modelo

NOTA: O método de múltiplos estágios foi proposto por Keys e Li 8 com investigação gráfica. Uma análise de polimento mediana foi realizada para eliminar os efeitos cumulativos de idade e período; Finalmente, esses resíduos da fase polonesa mediana na categoria de coorte no modelo de regressão linear foram regredidos e os efeitos de coorte usando dados da tabela de contingência foram avaliados.

  1. Representação gráfica como primeira fase
    1. Crie um gráfico de linhas de faixas etárias e grupos de períodos. Para inspecionar coortes de nascimento em faixas etárias ou coortes de nascimento, desenhe coortes de nascimento pares em idades ou ciclos nos gráficos de linhas.
    2. Importe um arquivo CSV com dados de mortalidade da tabela de contingência. Clique em Arquivo | Aberto | Navegue para selecionar um arquivo CSV de uma pasta. Lembre-se de escolher Todos os arquivos na lista suspensa ao lado da caixa Nome do arquivo.
    3. Clique em Abrir para abrir o arquivo CSV. Realce as linhas e colunas dos dados de contingência de mortalidade e clique em Inserir | Paradas | Gráfico de linhas.
  2. Análise de polimento mediano como segunda fase
    1. Subtraia iterativamente a mediana de cada linha e cada coluna para eliminar o efeito cumulativo de idade e período. Após a fase de polimento da mediana, manter os resíduos para o procedimento de regressão para avaliar os efeitos de coorte.
    2. Calcule a mediana geral e a tabela de resíduos. Importe um arquivo CSV com dados de mortalidade da tabela de contingência (consulte 2.1.1.2).
    3. A NL foi utilizada para cada célula dos dados de mortalidade da tabela de contingência. Clique em Fórmulas | Função Matemática e Trigonometria e selecione LN.
    4. Número: Insira o rótulo de localização para cada célula. Certifique-se de que cada célula dos dados de mortalidade da tabela de contingência tenha obtido NL. Clique em Fórmulas | Mais funções | Estatísticas e selecione MEDIAN.
    5. Número1: Insira o rótulo de localização da primeira célula.
    6. Número2: Insira o rótulo de localização da última célula. Certifique-se de que o valor mediano resultante esteja armazenado na margem superior esquerda da tabela de contingência. Certifique-se de que uma tabela residual seja criada obtendo a diferença entre o valor original (ou seja, os dados de mortalidade do LN) e a mediana geral.
    7. Calcule as medianas da linha (ou seja, as medianas de cada faixa etária) e certifique-se de que ele calculou os valores da mediana da linha para a faixa etária da resposta. Clique em Fórmulas | Mais funções | Estatísticas | Selecione MEDIAN.
      1. Número 1: Insira o rótulo de localização da primeira célula da amostra bruta.
      2. Número 2: Insira o rótulo de localização da última célula da matéria-prima. Certifique-se de que os valores medianos da linha resultantes sejam armazenados na margem esquerda da tabela de contingência.
    8. Crie uma nova tabela residual depois de subtrair das medianas da linha. Certifique-se de que um novo conjunto de valores residuais seja criado a partir das medianas da linha em que cada célula assume o valor da subtração da mediana da linha de cada variável de resposta nessa linha. Clique em = e verifique se o rótulo de localização geral da célula de cada linha subtraiu o rótulo da mediana da margem esquerda.
    9. Calcule as medianas da coluna (ou seja, as medianas de cada grupo de períodos) e certifique-se de que ele calcule os valores da mediana da coluna para o grupo de períodos de resposta. Clique em Fórmulas | Mais funções | Estatísticas | Selecione MEDIAN.
      1. Número 1: Insira o rótulo de localização da primeira célula da coluna. Número 2: Insira o rótulo de localização da última célula da coluna. Certifique-se de que os valores medianos da coluna resultantes sejam armazenados na margem superior da tabela de contingência.
    10. Crie uma nova tabela residual após subtrair das medianas da coluna. Certifique-se de que um novo conjunto de valores residuais seja criado a partir das medianas da coluna, em que cada célula assume o valor da subtração da mediana da coluna de cada variável de resposta nessa coluna. Clique em = e verifique se o rótulo de localização geral da célula de cada coluna subtraiu o rótulo da mediana da margem superior.
    11. Repita as etapas 2.1.2.7 a 2.1.2.10 até que as medianas da linha e da coluna se aproximem de zero. Clique em Fórmulas | Mais funções | Estatísticas | Selecione MEDIAN. Certifique-se de que as medianas de linha e coluna sejam aproximadamente zero. Salve a tabela residual final no formato CSV.
  3. Procedimento de regressão com peso como terceira fase
    NOTA: Calculamos a variável dependente como resíduos para cada coorte com o número de óbitos como peso. Em seguida, executamos regressões lineares para calcular os efeitos da coorte.
    1. Certifique-se de que o Kutools for Excel foi instalado e use sua ferramenta Transpose Table Dimensions para converter rapidamente tabelas cruzadas em listas planas. Importe um arquivo CSV com dados residuais da tabela de contingência (consulte 2.1.2.11).
    2. Selecione a tabela a ser convertida em uma lista. Clique no Kutools | Modificar | Transpor dimensão da tabela. Na caixa de diálogo Transpor Dimensões da Tabela, verifique se há uma marca na caixa ao lado da lista Tabela cruzada a e selecione o intervalo Resultados para armazenar os resíduos no formato de lista.
    3. Inserir coluna no ficheiro de dados inicial (ver ponto 1.2) com os dados de formato de lista de resíduos (ver ponto 2.1.3.1). Certifique-se de que ele inseriu uma coluna de suporte nos dados de formato de lista residual (consulte 2.1.3.1). Clique em = variáveis de idade e período e clique em Enter. Use uma coluna de suporte para pesquisar os rótulos de grupo de idade e período dos dados de formato de lista de resíduos para inserir uma coluna de resíduos de resposta no arquivo de dados inicial (consulte 1.2).
    4. Clique em Fórmulas | Pesquisa & Referência | Selecione PROCV. Defina PROCV (rótulo de localização da célula de idade e rótulo de localização da célula do período, rótulo de localização da primeira célula da coluna de suporte: o rótulo de localização da última célula da coluna residual, 4, 0). Certifique-se de que o intervalo de seleção inclua colunas de suporte, idade, período e resíduos (ou seja, a coluna como a lista de resíduos).
    5. Certifique-se de que os resíduos estejam inseridos no arquivo de dados inicial (consulte 1.2) procure os dados de formato de lista residual (consulte 2.1.3.1) para a próxima etapa. Ajuste o modelo de regressão por mínimos quadrados não ponderados e analise os resíduos.
    6. Clique em Analisar | Regressão | Linear. Transfira a variável independente, categoria de coorte (ou seja, 17 coortes de nascimento), para a caixa Independente(s), e a variável dependente, Resíduos, para a caixa Dependente:. Clique em OK. Certifique-se de gerar os resultados dos efeitos de coorte não ponderados.
    7. Certifique-se de que os resíduos estejam inseridos no arquivo de dados inicial do Excel (consulte 1.2) procure os dados de formato de lista residual (consulte 2.1.3.1) para a próxima etapa. Ajuste o modelo de regressão por mínimos quadrados ponderados e analise os resíduos. Clique em Analisar | Regressão | Linear.
    8. Transfira a variável independente e a categoria de coorte (ou seja, 17 coortes de nascimento) para a caixa independente(s) e a variável dependente e os resíduos para a caixa dependente:. Transfira o número da morte para a caixa de peso WLS. Clique em OK. Certifique-se de que ele gere os resultados da média ponderada do efeito de coorte.

Resultados

Os dados de mortalidade foram demonstrados para 10 grupos etários de cinco anos (40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84 e 85+) e 8 anos de cinco anos (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 e 2011-2015). O número de grupos de coorte foi selecionado subtraindo-se um do número total de grupos de período etário: 10 (grupos etários de cinco anos) + 8 (períodos de cinco anos) -1 = 17 coortes de nascimento, com os grupos de coo...

Discussão

Devido à tendência temporal da mortalidade por CHC, os modelos convencionais subestimam algumas características importantes ocultas nos dados (como efeitos de coorte), e as análises convencionais que usam extrapolação linear simples da taxa de correção de idade logarítmica observada mostram precisão significativamente reduzida em suas previsões. É claro que essa tendência continuou por 35 anos e aumentará nos próximos anos se observarmos diretamente a tendência de longo p...

Divulgações

Os autores não têm nada a divulgar.

Agradecimentos

Este trabalho foi apoiado pelo Hospital Taipei Tzu Chi TCRD-TPE-109-RT-8 (2/3) e TCRD-TPE-109-39 (2/2).

Materiais

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

Referências

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Carcinoma HepatocelularCHCPrevis o de MortalidadeModelo de Regress o PonderadaEfeito de CoorteM todo de M ltiplos Est giosModelo de Coorte de Per odo de IdadeCirrose Hep ticaEpidemiologiaIntervalo de Confian aEstimativa de M dia PonderadaDados do Ciclo de Idade

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados