Principal Altres Anàlisi de dades de temps fins a esdeveniments

Anàlisi de dades de temps fins a esdeveniments

Visió general

Programari

Descripció

Llocs web

Lectures

Cursos

Visió general

Aquesta pàgina descriu breument una sèrie de preguntes que s’han de tenir en compte a l’hora d’analitzar les dades de temps fins a l’esdeveniment i proporciona una llista de recursos anotats per obtenir més informació.

Descripció

Què té de singular les dades de temps fins a esdeveniments (TTE)?

Les dades sobre el temps fins a l’esdeveniment (TTE) són úniques perquè el resultat de l’interès no és només si s’ha produït o no un esdeveniment, sinó també quan s’ha produït aquest esdeveniment. Els mètodes tradicionals de regressió logística i lineal no són adequats per poder incloure tant els aspectes d’esdeveniment com els de temps com a resultat en el model. Els mètodes de regressió tradicionals tampoc no estan equipats per gestionar la censura, un tipus especial de dades que falten que es produeix en anàlisis de temps a esdeveniment quan els subjectes no experimenten l’esdeveniment d’interès durant el temps de seguiment. En presència de censures, es subestima el temps real per a l’esdeveniment. S'han desenvolupat tècniques especials per a dades TTE, tal com es comentarà a continuació, per utilitzar la informació parcial sobre cada subjecte amb dades censurades i proporcionar estimacions de supervivència imparcials. Aquestes tècniques incorporen dades de diversos punts de temps entre subjectes i es poden utilitzar per calcular directament les taxes, les relacions temporals i les relacions de perillositat.

Quines són les consideracions metodològiques importants de les dades del temps fins a l'esdeveniment?

Hi ha quatre consideracions metodològiques principals en l’anàlisi de les dades de temps fins a esdeveniments o supervivència. És important tenir una definició clara de l’esdeveniment objectiu, l’origen del temps, l’escala de temps i descriure com sortiran els participants de l’estudi. Un cop ben definits, l’anàlisi es fa més directa. Normalment hi ha un únic esdeveniment objectiu, però hi ha extensions d'anàlisis de supervivència que permeten múltiples esdeveniments o esdeveniments repetits.

Quin és l'origen del temps?

L’origen del temps és el punt en què comença el temps de seguiment. Les dades TTE poden emprar una gran varietat d’orígens temporals que estan determinats en gran mesura pel disseny de l’estudi, cadascun amb avantatges i inconvenients associats. Els exemples inclouen el temps inicial o l’edat inicial. Els orígens del temps també es poden determinar mitjançant una característica definidora, com ara l’inici de l’exposició o el diagnòstic. Sovint és una opció natural si el resultat està relacionat amb aquesta característica. Altres exemples inclouen el naixement i l'any natural. Per als estudis de cohorts, l’escala temporal és la més freqüent en temps d’estudi.

Hi ha una altra opció per a una escala temporal diferent del temps d'estudi?

L’edat és una altra escala de temps que s’utilitza habitualment, on l’edat basal és l’origen del temps i els individus surten al seu esdeveniment o censuren l’edat. Els models amb edat com a escala de temps es poden ajustar per als efectes del calendari. Alguns autors recomanen que s'utilitzi l'edat en lloc del temps d'estudi com a escala de temps, ja que pot proporcionar estimacions menys esbiaixades.

Què és censurar?

Un dels reptes específics de l’anàlisi de supervivència és que només algunes persones hauran experimentat l’esdeveniment al final de l’estudi i, per tant, els temps de supervivència seran desconeguts per a un subconjunt del grup d’estudi. Aquest fenomen s’anomena censura i pot sorgir de les maneres següents: el participant de l’estudi encara no ha experimentat el resultat rellevant, com la recaiguda o la mort, al tancament de l’estudi; es perd el participant en l'estudi durant el període d'estudi; o bé, el participant de l'estudi experimenta un esdeveniment diferent que impossibilita un seguiment posterior. Aquests temps d'interval censurats subestimen el veritable però desconegut temps fins a l'esdeveniment. Per a la majoria d’enfocaments analítics, se suposa que la censura és aleatòria o no informativa.

Hi ha tres tipus principals de censura: dreta, esquerra i interval. Si els esdeveniments es produeixen més enllà del final de l’estudi, les dades es censuren a la dreta. Les dades censurades a l’esquerra es produeixen quan s’observa l’esdeveniment, però es desconeix el temps exacte de l’esdeveniment. Les dades censurades per intervals es produeixen quan s’observa l’esdeveniment, però els participants entren i surten de l’observació, de manera que es desconeix l’hora exacta de l’esdeveniment. La majoria dels mètodes analítics de supervivència estan dissenyats per a observacions censurades a la dreta, però hi ha mètodes per a dades censurades per intervals i esquerres.

Quina és la qüestió d’interès?

L’elecció de l’eina d’anàlisi s’hauria de guiar per la qüestió d’interès de la investigació. Amb les dades TTE, la qüestió de la investigació pot adoptar diverses formes, cosa que influeix en la funció de supervivència que és la més rellevant per a la pregunta de la investigació. Tres tipus diferents de preguntes de recerca que poden ser d’interès per a les dades TTE inclouen:

  1. Quina proporció de persones quedaran lliures de l'esdeveniment al cap d'un temps determinat?

  2. Quina proporció de persones tindrà l'esdeveniment al cap d'un temps determinat?

  3. Quin és el risc de l'esdeveniment en un moment determinat, entre aquells que han sobreviscut fins a aquest punt?

Cadascuna d'aquestes preguntes es correspon amb un tipus de funció diferent que s'utilitza en l'anàlisi de supervivència:

  1. Funció de supervivència, S (t): la probabilitat que un individu sobrevisqui més enllà del temps t [Pr (T> t)]

  2. Funció de densitat de probabilitat, F (t) o la funció d’incidència acumulativa, R (t): la probabilitat que un individu tingui un temps de supervivència inferior o igual a t [Pr (T≤t)]

  3. Funció de perill, h (t): el potencial instantani de viure un esdeveniment en el moment t, condicionat a haver sobreviscut a aquest moment

  4. Funció de perill acumulat, H (t): la integral de la funció de perill del temps 0 al temps t, que és igual a l'àrea sota la corba h (t) entre el temps 0 i el temps t

Si es coneix una d'aquestes funcions, les altres funcions es poden calcular mitjançant les fórmules següents:

S (t) = 1 - F (t) La funció de supervivència i la funció de densitat de probabilitat són 1

h (t) = f (t) / S (t) El perill instantani és igual a la probabilitat incondicional de

versió més recent de Firefox

experimentant l'esdeveniment en el moment t, escalat per la fracció viva en el temps t

H (t) = -log [S (t)] La funció de perill acumulat és igual al registre negatiu de la supervivència

funció

S (t) = e –H (t) La funció de supervivència és igual al perill acumulat negatiu exponenciada

funció

Aquestes conversions s’utilitzen sovint en mètodes d’anàlisi de supervivència, com es comentarà més endavant. En general, un augment de h (t), el perill instantani, conduirà a un augment de H (t), el risc acumulat, que es tradueix en una disminució de S (t), la funció de supervivència.

Quins supòsits s’han de fer per utilitzar tècniques estàndard per a dades de temps fins a esdeveniments?

El principal supòsit a l’hora d’analitzar les dades TTE és el de la censura no informativa: els individus censurats tenen la mateixa probabilitat d’experimentar un esdeveniment posterior que els individus que queden a l’estudi. La censura informativa és anàloga a les dades que falten no ignorables, cosa que esbiaixarà l’anàlisi. No hi ha una manera definitiva de comprovar si la censura no és informativa, tot i que explorar patrons de censura pot indicar si una suposició de censura no informativa és raonable. Si se sospita que es fa censura informativa, es poden utilitzar anàlisis de sensibilitat, com ara escenaris en el millor dels casos i en els pitjors casos, per intentar quantificar l’efecte que la censura informativa té en l’anàlisi.

Un altre supòsit a l’hora d’analitzar les dades TTE és que hi ha prou temps de seguiment i nombre d’esdeveniments per obtenir una potència estadística adequada. Cal tenir-ho en compte a la fase de disseny de l’estudi, ja que la majoria d’anàlisis de supervivència es basen en estudis de cohorts.

Cal assenyalar altres suposicions simplificadores, ja que sovint es fan en visions generals de l'anàlisi de supervivència. Tot i que aquests supòsits simplifiquen els models de supervivència, no són necessaris per realitzar anàlisis amb dades TTE. Es poden utilitzar tècniques avançades si es violen aquests supòsits:

  • Cap efecte de cohort sobre la supervivència: per a una cohort amb un llarg període de reclutament, suposem que els individus que s’uneixen aviat tenen les mateixes probabilitats de supervivència que els que s’uneixen tard

  • Censura correcta només a les dades

  • Els esdeveniments són independents els uns dels altres

Quins tipus d’enfocaments es poden utilitzar per a l’anàlisi de supervivència?

Hi ha tres enfocaments principals per analitzar les dades TTE: enfocaments no paramètrics, semi-paramètrics i paramètrics. L'elecció de quin enfocament d'ús hauria de ser motivat per la qüestió d'interès de la investigació. Sovint, més d'un enfocament es pot utilitzar adequadament en la mateixa anàlisi.

Quins són els enfocaments no paramètrics de l'anàlisi de supervivència i quan són adequats?

Els enfocaments no paramètrics no es basen en supòsits sobre la forma o la forma dels paràmetres a la població subjacent. En l'anàlisi de supervivència, s'utilitzen enfocaments no paramètrics per descriure les dades mitjançant l'estimació de la funció de supervivència, S (t), juntament amb la mediana i els quartils del temps de supervivència. Aquestes estadístiques descriptives no es poden calcular directament a partir de les dades degudes a la censura, que subestima el temps real de supervivència en subjectes censurats, cosa que condueix a estimacions esbiaixades de la mitjana, la mitjana i altres descriptius. Els enfocaments no paramètrics s’utilitzen sovint com a primer pas d’una anàlisi per generar estadístiques descriptives imparcials, i s’utilitzen sovint juntament amb enfocaments semi-paramètrics o paramètrics.

Estimador de Kaplan-Meier

L’enfocament no paramètric més comú a la literatura és l’estimador de Kaplan-Meier (o límit de producte). L'estimador de Kaplan-Meier funciona dividint l'estimació de S (t) en una sèrie de passos / intervals basats en els temps d'esdeveniments observats. Les observacions contribueixen a l'estimació de S (t) fins que es produeix l'esdeveniment o fins que siguin censurades. Per a cada interval, es calcula la probabilitat de sobreviure fins al final de l’interval, atès que els subjectes estan en risc al principi de l’interval (això normalment es nota com pj = (nj - dj) / nj). La S (t) estimada per a cada valor de t és igual al producte de sobreviure a cada interval fins al temps t inclòs. Els principals supòsits d’aquest mètode, a més de la censura no informativa, són que la censura es produeix després dels fracassos i que no hi ha cap efecte de cohort sobre la supervivència, de manera que els subjectes tenen la mateixa probabilitat de supervivència independentment de quan van ser objecte d’estudi.

L'estimació de S (t) del mètode Kaplan-Meier es pot representar com una funció pas a pas amb el temps a l'eix X. Aquesta trama és una bona manera de visualitzar l'experiència de supervivència de la cohort i també es pot utilitzar per estimar la mediana (quan S (t) ≤0,5) o els quartils del temps de supervivència. Aquestes estadístiques descriptives també es poden calcular directament mitjançant l'estimador de Kaplan-Meier. Els intervals de confiança (IC) del 95% per a S (t) es basen en transformacions de S (t) per assegurar que l’IC del 95% es troba entre 0 i 1. El mètode més comú a la literatura és l’estimador de Greenwood.

Estimador de la taula de vida

L’estimador de la taula de vida de la funció de supervivència és un dels primers exemples de mètodes estadístics aplicats, que s’ha utilitzat durant més de 100 anys per descriure la mortalitat en grans poblacions. L'estimador de la taula de vida és similar al mètode de Kaplan-Meier, excepte que els intervals es basen en el temps del calendari en lloc dels esdeveniments observats. Atès que els mètodes de la taula de vida es basen en aquests intervals de calendari, i no en funció d’esdeveniments individuals / temps de censura, aquests mètodes utilitzen la mida mitjana establerta de risc per interval per estimar S (t) i han de suposar que la censura s’ha produït de manera uniforme durant l’interval de temps del calendari. Per aquest motiu, l'estimador de la taula de vida no és tan precís com l'estimador de Kaplan-Meier, però els resultats seran similars en mostres molt grans.

Estimador de Nelson-Aalen

Una altra alternativa a Kaplan-Meier és l'estimador de Nelson-Aalen, que es basa en l'ús d'un enfocament de procés de recompte per estimar la funció de risc acumulat, H (t). L'estimació de H (t) es pot utilitzar per estimar S (t). Les estimacions de S (t) derivades mitjançant aquest mètode sempre seran superiors a l’estimació de K-M, però la diferència serà petita entre els dos mètodes en mostres grans.

Es poden utilitzar enfocaments no paramètrics per a anàlisis univariables o multivariables?

Es poden utilitzar enfocaments no paramètrics com l’estimador de Kaplan-Meier per realitzar anàlisis univariables de factors d’interès categòrics. Els factors han de ser categòrics (ja siguin de naturalesa o una variable contínua dividits en categories) perquè la funció de supervivència, S (t), s’estima per a cada nivell de la variable categòrica i després es compara entre aquests grups. Les estimacions de S (t) per a cada grup es poden traçar i comparar visualment.

Les proves basades en el rang també es poden utilitzar per provar estadísticament la diferència entre les corbes de supervivència. Aquestes proves comparen el nombre d’esdeveniments observats i esperats en cada moment temporal entre grups, sota la hipòtesi nul·la que les funcions de supervivència són iguals entre grups. Hi ha diverses versions d’aquestes proves basades en rangs, que difereixen en el pes donat a cada punt temporal en el càlcul de l’estadística de la prova. Dues de les proves basades en rang més habituals que s’observen a la literatura són la prova de rang de registre, que dóna a cada punt de temps el mateix pes, i la prova de Wilcoxon, que pesa cada punt de temps pel nombre de subjectes en risc. En funció d’aquest pes, la prova de Wilcoxon és més sensible a les diferències entre corbes al començament del seguiment, quan hi ha més subjectes en risc. Altres proves, com la prova de Peto-Prentice, utilitzen pesos entre els del registre logístic i els de Wilcoxon. Les proves basades en la classificació estan subjectes a la suposició addicional que la censura és independent del grup, i totes estan limitades per poca potència per detectar diferències entre grups quan es creuen les corbes de supervivència. Tot i que aquestes proves proporcionen un valor p de la diferència entre corbes, no es poden utilitzar per estimar les mides de l'efecte (el valor p de la prova del rang de registre, però, és equivalent al valor p d'un factor d'interès categòric en un Cox univariable model).

Els models no paramètrics són limitats perquè no proporcionen estimacions d’efecte i no es poden utilitzar generalment per avaluar l’efecte de múltiples factors d’interès (models multivariables). Per aquest motiu, els enfocaments no paramètrics s’utilitzen sovint juntament amb models semi o totalment paramètrics en epidemiologia, on els models multivariables solen utilitzar-se per controlar els confusors.

Es poden ajustar les corbes de Kaplan-Meier?

És un mite comú que les corbes de Kaplan-Meier no es poden ajustar, i sovint es cita com a motiu per utilitzar un model paramètric que pot generar corbes de supervivència ajustades per covariables. Tanmateix, s’ha desenvolupat un mètode per crear corbes de supervivència ajustades mitjançant la ponderació de la probabilitat inversa (IPW). En el cas d’una sola covariable, les IPW es poden estimar de manera no paramètrica i equivalen a l’estandardització directa de les corbes de supervivència per a la població estudiada. En el cas de covariables múltiples, s’han d’utilitzar models semi- o completament paramètrics per estimar els pesos, que s’utilitzen per crear corbes de supervivència ajustades amb covariables múltiples. Els avantatges d’aquest mètode són que no està subjecte a la suposició de riscos proporcionals, es pot utilitzar per a covariables variables en el temps i també es pot utilitzar per a covariables contínues.

Per què necessitem enfocaments paramètrics per analitzar les dades de temps fins a esdeveniments?

S’utilitza un enfocament no paramètric per a l’anàlisi de dades TTE per descriure simplement les dades de supervivència respecte al factor investigat. Els models que fan servir aquest enfocament també es coneixen com a models univariables. Més comunament, els investigadors estan interessats en la relació entre diverses covariables i el temps fins a l’esdeveniment. L’ús de models semi i completament paramètrics permet analitzar el temps fins a l’esdeveniment respecte a molts factors simultàniament i proporciona estimacions de la força de l’efecte per a cada factor constitutiu.

Què és un enfocament semi-paramètric i per què s’utilitza tan sovint?

El model proporcional de Cox és l’enfocament multivariable més utilitzat per analitzar les dades de supervivència en la investigació mèdica. Es tracta essencialment d’un model de regressió de temps a esdeveniment, que descriu la relació entre la incidència de l’esdeveniment, tal com s’expressa per la funció de perill, i un conjunt de covariables. El model Cox s’escriu de la següent manera:

funció de perill, h (t) = h0 (t) exp {β1X1 + β2X2 + ... + βpXp}

Es considera un enfocament semi-paramètric perquè el model conté un component no paramètric i un component paramètric. El component no paramètric és el perill basal, h0 (t). Aquest és el valor del perill quan totes les covariables són iguals a 0, cosa que posa de manifest la importància de centrar les covariables en el model per a la interpretabilitat. No confongueu el perill basal amb el perill en el moment 0. La funció de risc basal s’estima de manera no paramètrica i, per tant, a diferència de la majoria d’altres models estadístics, no es suposa que els temps de supervivència segueixin una distribució estadística particular i la forma de la línia base el perill és arbitrari. No cal estimar la funció de risc basal per fer inferències sobre el risc relatiu o la relació de riscos. Aquesta característica fa que el model Cox sigui més robust que els enfocaments paramètrics perquè no és vulnerable a una especificació errònia del perill basal.

El component paramètric està format pel vector covariable. El vector covariable multiplica el risc inicial per la mateixa quantitat independentment del temps, de manera que l’efecte de qualsevol covariable és el mateix en qualsevol moment durant el seguiment, i aquesta és la base de la suposició de riscos proporcionals.

Quina és la suposició de riscos proporcionals?

La suposició de riscos proporcionals és vital per a l’ús i la interpretació d’un model Cox.

Sota aquest supòsit, hi ha una relació constant entre el resultat o la variable dependent i el vector covariable. Les implicacions d’aquest supòsit són que les funcions de perillositat per a dues persones són proporcionals en qualsevol moment i la proporció de perillositat no varia amb el temps. Dit d’una altra manera, si un individu té un risc de mort en algun moment inicial que és el doble d’alt que el d’un altre individu, aleshores, en qualsevol moment posterior, el risc de mort es manté el doble. Aquest supòsit implica que les corbes de perill per als grups han de ser proporcionals i no s’han de creuar. Com que aquesta suposició és tan important, definitivament s’hauria de provar.

Com es prova la suposició de riscos proporcionals?

Hi ha una varietat de tècniques, tant gràfiques com basades en proves, per avaluar la validesa de la suposició de riscos proporcionals. Una tècnica consisteix a traçar simplement les corbes de supervivència de Kaplan-Meier si compareu dos grups sense covariables. Si les corbes es creuen, es pot incomplir la suposició de riscos proporcionals. Cal tenir en compte una advertència important per a aquest enfocament en estudis petits. Pot haver-hi una gran quantitat d’errors associats a l’estimació de les corbes de supervivència per a estudis amb una mida de mostra petita, per tant les corbes poden creuar-se fins i tot quan es compleixi la suposició de riscos proporcionals. El diagrama log-log complementari és una prova més robusta que representa el logaritme del logaritme negatiu de la funció de supervivent estimada contra el logaritme del temps de supervivència. Si els perills són proporcionals entre grups, aquest diagrama donarà corbes paral·leles. Un altre mètode comú per provar el supòsit de riscos proporcionals és incloure un termini d’interacció temporal per determinar si la FC canvia amb el pas del temps, ja que el temps sol ser el responsable de la no proporcionalitat dels riscos. L’evidència que el terme d’interacció temporal * del grup no és nul és una evidència contra els perills proporcionals.

Què passa si la hipòtesi de riscos proporcionals no es manté?

Si trobeu que el supòsit de PH no es compleix, no necessàriament heu d'abandonar l'ús del model Cox. Hi ha opcions per millorar la no proporcionalitat del model. Per exemple, podeu incloure altres covariables al model, ja siguin covariables noves, termes no lineals per a covariables existents o interaccions entre covariables. O bé, podeu estratificar l’anàlisi en una o més variables. Es calcula un model en el qual es permet que el risc basal sigui diferent dins de cada estrat, però els efectes de les covariables siguin iguals entre els estrats. Altres opcions inclouen dividir el temps en categories i utilitzar variables indicadores per permetre que les ràtios de perill variïn en funció del temps i canviar la variable de temps d’anàlisi (per exemple, del temps transcorregut a l’edat o viceversa).

Com examines l'ajust del model semi-paramètric?

A més de comprovar si hi ha violacions de la suposició de proporcionalitat, hi ha altres aspectes de l’ajust del model que s’han d’examinar. Es poden aplicar estadístiques similars a les utilitzades en regressió lineal i logística per realitzar aquestes tasques per als models Cox amb algunes diferències, però les idees essencials són les mateixes en els tres entorns. És important comprovar la linealitat del vector covariable, que es pot fer examinant els residus, tal com fem en la regressió lineal. No obstant això, els residus de les dades TTE no són tan senzills com en regressió lineal, en part perquè el valor del resultat és desconegut per a algunes de les dades, i els residus sovint es distingeixen. S'han desenvolupat diversos tipus de residus per avaluar l'adequació del model Cox a les dades TTE. Alguns exemples són Martingale i Schoenfeld, entre d'altres. També podeu mirar els residus per identificar observacions altament influents i poc ajustades. També hi ha proves d’adaptació específiques dels models Cox, com la prova de Gronnesby i Borgan, i l’índex pronòstic de Hosmer i Lemeshow. També podeu utilitzar l’AIC per comparar diferents models, tot i que l’ús de R2 és problemàtic.

Per què utilitzar un enfocament paramètric?

Un dels principals avantatges dels models semi-paramètrics és que no cal especificar el risc de referència per tal d’estimar les relacions de perill que descriuen diferències en el perill relatiu entre grups. Tanmateix, pot ser que l'interès estimi el risc inicial. En aquest cas, és necessari un enfocament paramètric. En els enfocaments paramètrics, s’especifiquen tant la funció de perill com l’efecte de les covariables. La funció de perill s'estima basant-se en una distribució suposada en la població subjacent.

Els avantatges d’utilitzar un enfocament paramètric per a l’anàlisi de supervivència són:

  • Els enfocaments paramètrics són més informatius que els enfocaments no i semi-paramètrics. A més de calcular les estimacions de l’efecte relatiu, també es poden utilitzar per predir el temps de supervivència, les taxes de risc i els temps de supervivència mitjans i mitjans. També es poden utilitzar per fer prediccions de risc absolutes al llarg del temps i traçar corbes de supervivència ajustades per covariables.

  • Quan la forma paramètrica s’especifica correctament, els models paramètrics tenen més potència que els models semi-paramètrics. També són més eficients, donant lloc a errors estàndard més petits i a estimacions més precises.

  • Els enfocaments paramètrics es basen en la màxima probabilitat màxima per estimar paràmetres.

  • Els residus de models paramètrics adopten la forma familiar de la diferència en l’observat respecte a l’esperat.

El principal desavantatge d'utilitzar un enfocament paramètric és que es basa en el supòsit que la distribució subjacent de la població s'ha especificat correctament. Els models paramètrics no són robustos per a una falta d’especificació, per això els models semi-paramètrics són més comuns a la literatura i són menys arriscats d’utilitzar quan hi ha incertesa sobre la distribució subjacent de la població.

Com escolliu la forma paramètrica?

L’elecció de la forma paramètrica adequada és la part més difícil de l’anàlisi paramètric de supervivència. L'especificació de la forma paramètrica hauria de ser impulsada per la hipòtesi de l'estudi, juntament amb coneixements previs i plausibilitat biològica de la forma del perill basal. Per exemple, si se sap que el risc de mort augmenta dràsticament just després de la cirurgia i després disminueix i aplana, no seria adequat especificar la distribució exponencial, que assumeix un perill constant al llarg del temps. Les dades es poden utilitzar per avaluar si el formulari especificat s’adapta a les dades, però aquests mètodes basats en dades haurien de complementar, no substituir, les seleccions basades en hipòtesis.

Quina diferència hi ha entre un model de riscos proporcionals i un model de temps d’avaria accelerat?

Tot i que el model de riscos proporcionals de Cox és semi-paramètric, els models de riscos proporcionals també poden ser paramètrics. Els models de riscos proporcionals paramètrics es poden escriure com:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

on el perill basal, h0 (t), depèn només del temps, t, però no de X, i λ és una funció específica de la unitat de les covariables, que no depèn de t, que escala la funció de risc basal cap amunt o cap avall. λ no pot ser negatiu. En aquest model, la taxa de perillositat és una funció multiplicativa del perill basal i les relacions de perillositat es poden interpretar de la mateixa manera que en el model de riscos proporcionals semi-paramètrics.

Els models d’Accelerated Failure Time (AFT) són una classe de models de supervivència paramètrics que es poden linealitzar prenent el registre natural del model de temps de supervivència. L'exemple més simple d'un model AFT és el model exponencial, que s'escriu com:

ln (T) = β0 + β1X1 + .... + βpXp + ε *

La principal diferència entre els models AFT i els models PH és que els models AFT assumeixen que els efectes de les covariables són multiplicatius a escala de temps, mentre que els models Cox utilitzen l’escala de perillositat tal com es mostra més amunt. Les estimacions de paràmetres dels models AFT s’interpreten com a efectes en l’escala temporal, que poden accelerar o desaccelerar el temps de supervivència. Exp (β)> 1 d'un model AFT significa que el factor accelera el temps de supervivència o condueix a una supervivència més llarga. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Algunes distribucions d'errors es poden escriure i interpretar tant com a models PH i AFT (és a dir, exponencials, Weibull), d'altres només són PH (és a dir, Gompertz) o només models AFT (és a dir, log-logístics) i d'altres no són ni models PH ni AFT (és a dir, ajustar una spline).

Quines formes poden adoptar els models paramètrics?

La funció de perill pot adoptar qualsevol forma sempre que h (t)> 0 per a tots els valors de t. Tot i que la consideració principal de la forma paramètrica hauria de ser el coneixement previ de la forma del perill basal, cada distribució té els seus propis avantatges i desavantatges. Alguns dels formularis més comuns s’explicaran breument, amb més informació disponible a la llista de recursos.

Distribució exponencial

La distribució exponencial suposa que h (t) depèn només dels coeficients del model i de les covariables i és constant en el temps. El principal avantatge d’aquest model és que es tracta d’un model de riscos proporcionals i d’un model de temps d’avaria accelerat, de manera que les estimacions d’efectes es poden interpretar com a relacions de perill o relacions de temps. El principal inconvenient d’aquest model és que sovint és inversemblant assumir un perill constant al llarg del temps.

Distribució Weibull

La distribució de Weibull és similar a la distribució exponencial. Tot i que la distribució exponencial assumeix un perill constant, la distribució de Weibull assumeix un perill monotònic que pot augmentar o disminuir, però no tots dos. Té dos paràmetres. El paràmetre de forma (σ) controla si augmenta el perill (σ1) (a la distribució exponencial, aquest paràmetre es defineix a 1). El paràmetre d’escala, (1 / σ) exp (-β0 / σ), determina l’escala d’aquest augment / disminució. Atès que la distribució de Weibull simplifica la distribució exponencial quan σ = 1, la hipòtesi nul·la que σ = 1 es pot provar mitjançant una prova de Wald. El principal avantatge d’aquest model és que es tracta d’un model PH i AFT, de manera que es poden estimar tant les relacions de perillositat com les relacions temporals. De nou, el principal inconvenient és que la suposició de la monotonicitat del perill basal pot ser inversemblant en alguns casos.

New York Times Co vs Estats Units

Distribució Gompertz

La distribució de Gompertz és un model PH que és igual a la distribució log-Weibull, de manera que el registre de la funció de perill és lineal en t. Aquesta distribució té una taxa de fracàs creixent exponencialment, i sovint és apropiada per a dades actuarials, ja que el risc de mortalitat també augmenta exponencialment amb el pas del temps.

Distribució Log-Logística

La distribució logística-logística és un model AFT amb un terme d'error que segueix la distribució logística estàndard. Pot adaptar-se a perills no monotònics i, en general, s’adapta millor quan el perill subjacent s’eleva fins al màxim i després cau, cosa que pot ser plausible per a certes malalties com la tuberculosi. La distribució log-logística no és un model PH, però sí un model de probabilitats proporcional. Això significa que està subjecte a la suposició de probabilitats proporcionals, però l'avantatge és que els coeficients de pendent es poden interpretar com a relacions temporals i també com a relacions probabilitats. Una proporció de probabilitats de 2 d’un model logístic-logístic paramètric, per exemple, s’interpretaria com que les probabilitats de supervivència més enllà del temps t entre els subjectes amb x = 1 són el doble de les probabilitats entre els subjectes amb x = 0.

Distribució de gamma generalitzada (GG)

La distribució gamma generalitzada (GG) és en realitat una família de distribucions que conté gairebé totes les distribucions més utilitzades, incloses les distribucions exponencial, Weibull, log normal i gamma. Això permet fer comparacions entre les diferents distribucions. La família GG també inclou els quatre tipus de funcions de perill més habituals, cosa que fa que la distribució de GG sigui especialment útil, ja que la forma de la funció de perill pot ajudar a optimitzar la selecció del model.

Enfocament Splines

Atès que l’única limitació general de l’especificació de la funció de risc de línia de base és thath (t)> 0 per a tots els valors de t, es poden utilitzar splines per obtenir la màxima flexibilitat a l’hora de modelar la forma del perill de base. Les splines cúbiques restringides són un mètode que recentment s'ha recomanat a la literatura per a l'anàlisi de supervivència paramètrica, ja que aquest mètode permet flexibilitat en la forma, però restringeix la funció a ser lineal en els extrems on les dades són escasses. Les splines es poden utilitzar per millorar l’estimació i també són avantatjoses per a l’extrapolació, ja que maximitzen l’ajust a les dades observades. Si s’especifica correctament, les estimacions d’efectes dels models que s’ajusten a splines no s’han de polaritzar. Igual que en altres anàlisis de regressió, els desafiaments a l’hora d’ajustar splines poden incloure l’elecció del nombre i la ubicació dels nusos i problemes amb l’ajust excessiu.

Com examines l'ajust del model paramètric?

El component més important per avaluar l'ajust del model paramètric és comprovar si les dades admeten la forma paramètrica especificada. Això es pot avaluar visualment mitjançant la representació gràfica del risc acumulat basat en models contra la funció de risc acumulat estimat de Kaplan-Meier. Si la forma especificada és correcta, el gràfic hauria de passar per l’origen amb una inclinació de 1. La prova de bondat d’ajust de Grønnesby-Borgan també es pot utilitzar per determinar si el nombre d’esdeveniments observat és significativament diferent del nombre d’esdeveniments esperat. en grups diferenciats per puntuacions de risc. Aquesta prova és altament sensible al nombre de grups escollits i tendeix a rebutjar la hipòtesi nul·la d’adequació adequada massa liberalment si s’escullen molts grups, especialment en grups de dades petits. La prova no té poder per detectar infraccions del model, però, si s’escullen massa pocs grups. Per aquest motiu, sembla poc recomanable confiar només en una prova de bondat d’ajust per determinar si la forma paramètrica especificada és raonable.

AIC també es pot utilitzar per comparar models executats amb diferents formes paramètriques, amb l'AIC més baix indicatiu del millor ajust. AIC no es pot utilitzar per comparar models paramètrics i semi-paramètrics, però, ja que els models paramètrics es basen en temps d'esdeveniments observats i els models semi-paramètrics es basen en l'ordre dels temps d'esdeveniments. Una vegada més, aquestes eines s’han d’utilitzar per examinar si el formulari especificat s’adapta a les dades, però la versemblança del perill subjacent especificat continua sent l’aspecte més important a l’hora d’escollir una forma paramètrica.

Un cop determinada la forma paramètrica especificada per adaptar-se bé a les dades, es poden utilitzar mètodes similars als descrits prèviament per als models de perillositat semi-proporcionals per triar entre diferents models, com ara parcel·les residuals i proves de bon estat d’ajust.

Què passa si els predictors canvien amb el pas del temps?

A les declaracions model escrites anteriorment, hem assumit que les exposicions són constants durant el seguiment. Les exposicions amb valors que canvien al llarg del temps o covariables variables en el temps es poden incloure en els models de supervivència canviant la unitat de l’anàlisi de l’individu al període de temps en què l’exposició és constant. Això divideix el temps-persona dels individus en intervals que cada persona contribueix al conjunt de riscos d’exposats i no exposats per a aquesta covariable. La principal suposició d’incloure d’aquesta manera una covariada que varia el temps és que l’efecte de la covariada que varia en el temps no depèn del temps.

Per a un model de perill proporcional a Cox, la inclusió d’una covariada variable en el temps prendria la forma de: h (t) = h0 (t) e ^ β1x1 (t). Les covariables que varien en el temps també es poden incloure en models paramètrics, tot i que és una mica més complicat i difícil d’interpretar. Els models paramètrics també poden modelar covariables que varien en el temps mitjançant splines per a una major flexibilitat.

En general, s’han d’utilitzar covariables que varien en el temps quan es planteja la hipòtesi que el perill depèn més dels valors posteriors de la covariable que del valor de la covariada a la línia de base. Els desafiaments que sorgeixen amb covariables que varien en el temps falten dades sobre la covariada en diferents moments, i un potencial biaix en l’estimació del perill si la covariable que varia en el temps és realment un mediador.

Què és l’anàlisi de riscos competitius?

Els mètodes tradicionals d’anàlisi de supervivència suposen que només es produeix un tipus d’esdeveniment d’interès. No obstant això, existeixen mètodes més avançats que permeten investigar diversos tipus d'esdeveniments en el mateix estudi, com ara la mort per múltiples causes. L’anàlisi de riscos competitius s’utilitza per a aquests estudis en què la durada de la supervivència finalitza pel primer de diversos esdeveniments. Es necessiten mètodes especials perquè analitzar el temps de cada esdeveniment per separat es pot esbiaixar. Concretament en aquest context, el mètode KM tendeix a sobreestimar la proporció de subjectes que experimenten esdeveniments. L’anàlisi de riscos competitius utilitza el mètode d’incidència acumulativa, en què la probabilitat global d’esdeveniments en qualsevol moment és la suma de les probabilitats específiques de l’esdeveniment. Els models s’implementen generalment introduint cada participant de l’estudi diverses vegades: un per tipus d’esdeveniment. Per a cada participant de l'estudi, el temps de qualsevol esdeveniment es censura en el moment en què el pacient va experimentar el primer esdeveniment. Per obtenir més informació, consulteu la pàgina advancedepidemiology.org a riscos competitius .

Què són els models de fragilitat i per què són útils per a dades correlacionades?

Les dades de supervivència correlacionades poden sorgir a causa d’esdeveniments recurrents experimentats per un individu o quan les observacions s’agrupen en grups. Ja sigui per falta de coneixement o per viabilitat, és possible que no es mesurin algunes covariables relacionades amb l'esdeveniment d'interès. Els models de fragilitat expliquen l’heterogeneïtat causada per covariables sense mesurar afegint efectes aleatoris, que actuen multiplicativament sobre la funció de perill. Els models de fragilitat són essencialment extensions del model Cox amb l'addició d'efectes aleatoris. Tot i que hi ha diversos esquemes de classificació i nomenclatura utilitzats per descriure aquests models, quatre tipus comuns de models de fragilitat inclouen la fragilitat compartida, imbricada, conjunta i additiva.

Hi ha altres enfocaments per analitzar les dades d'esdeveniments recurrents?

Les dades d'esdeveniments recurrents es correlacionen, ja que es poden produir diversos esdeveniments dins del mateix tema. Tot i que els models de fragilitat són un mètode per explicar aquesta correlació en anàlisis d'esdeveniments recurrents, un enfocament més senzill que també pot explicar aquesta correlació és l'ús d'errors estàndard robustos (SE). Amb l'addició de SE robustos, l'anàlisi d'esdeveniments recurrents es pot fer com una simple extensió de models semi-paramètrics o paramètrics.

Tot i que és senzill d’implementar, hi ha diverses maneres de modelar dades d’esdeveniments recurrents mitjançant SE robustos. Aquests enfocaments difereixen en la forma en què defineixen el risc establert per a cada recurrència. D’aquesta manera, responen preguntes d’estudi lleugerament diferents, de manera que l’elecció de quin enfocament de modelització s’ha d’utilitzar segons la hipòtesi de l’estudi i la validesa dels supòsits de modelització.

El procés de recompte, o Andersen-Gill, enfocament a la modelització d'esdeveniments recurrents suposa que cada recurrència és un esdeveniment independent i no té en compte l'ordre ni el tipus d'esdeveniment. En aquest model, el temps de seguiment de cada assignatura s’inicia al començament de l’estudi i es divideix en segments definits per esdeveniments (recurrències). Els subjectes contribueixen al risc establert per a un esdeveniment sempre que estiguin en observació en aquell moment (no censurats). Aquests models són fàcils d’adaptar com a model Cox amb l’addició d’un robust estimador de SE, i les relacions de perillositat s’interpreten com l’efecte de la covariada en la taxa de recurrència durant el període de seguiment. Aquest model seria inadequat, però, si la suposició de la independència no és raonable.

Els enfocaments condicionals assumeixen que un subjecte no corre risc per a un esdeveniment posterior fins que no es produeixi un esdeveniment anterior i, per tant, tenen en compte l'ordre dels esdeveniments. S'ajusten mitjançant un model estratificat, amb el nombre d'esdeveniments (o el nombre de recurrència, en aquest cas), com a variable d'estrat i que inclou SE robustes. Hi ha dos enfocaments condicionals diferents que utilitzen diferents escales de temps i, per tant, tenen conjunts de risc diferents. L’enfocament de la probabilitat condicional utilitza el temps transcorregut des del començament de l’estudi per definir els intervals de temps i és adequat quan l’interès es troba en el curs complet del procés d’esdeveniments recurrents. L’enfocament del temps de diferència bàsicament restableix el rellotge de cada recurrència mitjançant l’ús del temps transcorregut des de l’esdeveniment anterior per definir intervals de temps, i és més adequat quan les estimacions de l’efecte específic de l’esdeveniment (o recurrència) són d’interès.

Finalment, els enfocaments marginals (també coneguts com a enfocament WLW - Wei, Lin i Weissfeld) consideren que cada esdeveniment és un procés separat, de manera que els subjectes corren el risc de tots els esdeveniments des del començament del seguiment, independentment de si van experimentar esdeveniment previ. Aquest model és adequat quan es creu que els esdeveniments resulten de diferents processos subjacents, de manera que un subjecte podria experimentar un tercer esdeveniment, per exemple, sense experimentar el primer. Tot i que aquesta suposició sembla inversemblant amb alguns tipus de dades, com ara les recidives del càncer, es podria utilitzar per modelar les recurrències de lesions durant un període de temps, quan els subjectes poden experimentar diferents tipus de lesions durant el període de temps que no tenen cap ordre natural. Els models marginals també es poden ajustar mitjançant models estratificats amb SE robustes.

Lectures

Aquest projecte tenia com a objectiu descriure les decisions metodològiques i analítiques que es poden prendre quan es treballa amb dades de temps fins a esdeveniments, però no és, en cap cas, exhaustiva. A continuació es proporcionen recursos per aprofundir en aquests temes.

Llibres de text i capítols

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Mètodes de regressió en bioestadística, 2a Nova York, NY: Springer.

  • Text introductori als models lineals, logístics, de supervivència i de mesures repetides, ideal per a aquells que volen un punt de partida bàsic.

  • El capítol d'anàlisi de supervivència proporciona una bona visió general però no una profunditat. En són exemples basats en STATA.

Hosmer DW, Lemeshow S, May S. (2008) Anàlisi de supervivència aplicada: modelització de regressió de dades de temps fins a esdeveniments, 2a ed. Hoboken, NJ: John Wiley & Sons, Inc.

  • Visió general en profunditat de models Cox no paramètrics, semi-paramètrics i paramètrics, millor per a aquells que es coneixen en altres àrees de l’estadística. Les tècniques avançades no es tracten en profunditat, però es proporcionen referències a altres llibres de text especialitzats.

Kleinbaum DG, Klein M (2012). Anàlisi de supervivència: un text d’autoaprenentatge, 3a ed. Nova York, Nova York: Springer Science + Business Media, LLC

  • Excel·lent text introductori

Klein JP, Moeschberger ML (2005). Anàlisi de supervivència: tècniques per a dades censurades i truncades, 2a ed. Nova York, Nova York: Springer Science + Business Media, LLC

  • dissenyat per a estudiants de postgrau, aquest llibre proporciona molts exemples pràctics

Therneau TM, Grambsch PM (2000). Modelització de dades de supervivència: ampliació del model Cox. Nova York, Nova York: Springer Science + Business Media, LLC

  • Bona introducció a l'enfocament del procés de recompte i a l'anàlisi de dades de supervivència correlacionades. L’autor també va escriure el paquet de supervivència a R

Allison PD (2010). Anàlisi de supervivència mitjançant SAS: Una guia de pràctica, 2a ed. Cary, NC: Institut SAS

  • Un text aplicat molt bé per als usuaris de SAS

Bagdonavicius V, Nikulin M (2002). Models de vida accelerats: modelització i anàlisi estadística. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Un bon recurs per obtenir més informació sobre models de temps d’avaria accelerats paramètrics i semi-paramètrics i sobre la seva comparació amb els models de riscos proporcionals

Articles metodològics

Articles introductoris / Visió general

Hougaard P (1999). Fonaments de les dades de supervivència. Biometria 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Anàlisi de supervivència part I: conceptes bàsics i primeres anàlisis. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Anàlisi de supervivència, part II: anàlisi de dades multivariants: una introducció a conceptes i mètodes. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Anàlisi de supervivència, part II: anàlisi de dades multivariants: triar un model i avaluar-ne l'adequació i l'adequació. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Anàlisi de supervivència, part IV: conceptes i mètodes addicionals en l'anàlisi de supervivència. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • La sèrie de quatre articles anteriors és una excel·lent visió introductòria de mètodes d’anàlisi de supervivència, molt ben escrita i fàcil d’entendre; és molt recomanable.

L’edat com a escala temporal

Korn EL, Graubard BI, Midthune D (1997). Anàlisi de temps a esdeveniment del seguiment longitudinal d’una enquesta: elecció de l’escala de temps. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Document que propugna l'ús de l'edat com a escala de temps en lloc de temps d'estudi.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Anàlisi del temps a l'esdeveniment del seguiment longitudinal d'una enquesta: elecció de l'escala de temps. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Comenteu el document de Korn que descriu les precaucions a prendre quan s’utilitza l’edat com a escala de temps.

Thiébaut AC, Bénichou J (2004). Elecció de l’escala temporal en l’anàlisi del model de dades de cohorts epidemiològiques de Cox: un estudi de simulació. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Estudi de simulació que mostra la magnitud del biaix per a diferents graus d'associació entre l'edat i la covariable d'interès quan s'utilitza el temps d'estudi com a escala de temps.

Canchola AJ, Stewart SL, Bernstein L, et al. Regressió de Cox mitjançant diferents escales de temps. Disponible a: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Un bon document que compara 5 models de regressió de Cox amb variacions en el temps d'estudi o en l'edat com a escala de temps amb codi SAS.

Censura

Huang CY, Ning J, Qin J (2015). Inferència de probabilitat semiparamètrica per a dades truncades a l'esquerra i censurades a la dreta. Bioestadística [epub] PMID: 25796430 .

  • Aquest document té una bona introducció a l'anàlisi de dades censurades i proporciona un nou procediment d'estimació per a la distribució del temps de supervivència amb dades truncades a l'esquerra i censurades a la dreta. És molt dens i té un enfocament estadístic avançat.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Biaix per truncament esquerre i censura esquerra en estudis longitudinals de processos de desenvolupament i malaltia. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Un recurs excel·lent que explica el biaix inherent a les dades censurades a l’esquerra des d’una perspectiva epidemiològica.

Sun J, Sun L, Zhu C (2007). Prova del model de probabilitats proporcionals per a dades censurades per intervals. Analítica de dades de per vida 13: 37-50. PMID 17160547 .

  • Un altre article estadísticament dens sobre un aspecte matisat de l’anàlisi de dades TTE, però proporciona una bona explicació de les dades censurades per intervals.

Robins JM (1995a) Un mètode analític per a assaigs aleatoris amb censura informativa: Part I. Lifetime Data Anal 1: 241-254. PMID 9385104 .

Robins JM (1995b) Un mètode analític per a assaigs aleatoris amb censura informativa: Part II. Analítica de dades de per vida 1: 417-434. PMID 9385113 .

  • Dos articles que discuteixen mètodes per tractar la censura informativa.

Mètodes de supervivència no paramètrics

Borgan Ø (2005) Estimador de Kaplan-Meier. Enciclopèdia de Bioestadística DOI: 10.1002 / 0470011815.b2a11042

  • Excel·lent visió general de l'estimador de Kaplan-Meier i la seva relació amb l'estimador de Nelson-Aalen

Rodríguez G (2005). Estimació no paramètrica en models de supervivència. Disponible des de: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Introducció als mètodes no paramètrics i al model de risc proporcional de Cox que explica les relacions entre mètodes amb les fórmules matemàtiques

Cole SR, Hernan MA (2004). Corbes de supervivència ajustades amb pesos de probabilitat inversa. Programes de mètodes informàtics Biomed 75 (1): 35-9. PMID: 15158046

  • Descriu l'ús d'IPW per crear corbes ajustades de Kaplan-Meier. Inclou un exemple i una macro SAS.

Zhang M (2015). Mètodes robustos per millorar l'eficiència i reduir el biaix en l'estimació de les corbes de supervivència en assaigs clínics aleatoris. Analisi de dades de tota la vida 21 (1): 119-37. PMID: 24522498

  • Mètode proposat per a corbes de supervivència ajustades per covariables en ECA

Mètodes de supervivència semi-paramètrics

Cox DR (1972) Models de regressió i taules de vida (amb discussió). J R Statist Soc B 34: 187-220.

  • La referència clàssica.

Christensen E (1987) Anàlisi de supervivència multivariant mitjançant el model de regressió de Cox. Hepatology 7: 1346-1358. PMID 3679094 .

  • Descriu l’ús del model Cox mitjançant un exemple motivador. Excel·lent revisió dels aspectes clau de l’anàlisi del model Cox, inclosa la forma d’ajustar un model Cox i la comprovació dels supòsits del model.

    New York Times Co vs Estats Units

Grambsch PM, Therneau TM (1994) Proves de riscos proporcionals i diagnòstic basat en residus ponderats. Biometrika 81: 515-526.

  • Un document en profunditat sobre la prova de la suposició de riscos proporcionals. Bona barreja de teoria i explicació estadística avançada.

Ng’andu NH (1997) Una comparació empírica de proves estadístiques per avaluar l’assumpció de riscos proporcionals del model de Cox. Stat Med 16: 611-626. PMID 9131751 .

  • Un altre document en profunditat sobre la prova de la suposició de riscos proporcionals, que inclou una discussió sobre la comprovació de residus i els efectes de la censura.

Mètodes de supervivència paramètrics

Rodrguez, G (2010). Models paramètrics de supervivència. Disponible des de: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • breu introducció a les distribucions més habituals utilitzades en l'anàlisi paramètric de supervivència

Nardi A, Schemper M (2003). Comparació de models paramètrics i de Cox en estudis clínics. Estat Med 22 (23): 2597-610. PMID: 14652863

  • Proporciona bons exemples de comparació de models semi-paramètrics amb models que fan servir distribucions paramètriques habituals i se centra a avaluar l'ajust del model

Royston P, Parmar MK (2002). Models de riscos proporcionals paramètrics i proporcionals flexibles per a dades de supervivència censurades, amb aplicació al modelatge pronòstic i estimació dels efectes del tractament. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Bona explicació dels conceptes bàsics de models proporcionals de riscos i probabilitats i comparacions amb splines cúbiques

Cox C, Chu H, Schneider MF, Muñoz A (2007). Anàlisi de supervivència paramètrica i taxonomia de funcions de perill per a la distribució gamma generalitzada. Statist Med 26: 4352–4374. PMID 17342754 .

  • Ofereix una excel·lent visió general dels mètodes de supervivència paramètrics, inclosa una taxonomia de les funcions de perill i una discussió en profunditat de la família de distribució gamma generalitzada.

Crowther MJ, Lambert PC (2014). Un marc general per a l’anàlisi de supervivència paramètric. Estat Med 33 (30): 5280-97. PMID: 25220693

  • Descriu suposicions restrictives de distribucions paramètriques d'ús comú i explica la metodologia de spline cúbica restringida

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Models de supervivència paramètrics per a dades censurades per intervals amb covariables dependents del temps. Biometria 7 (4): 599-614. PMID: 16597670

  • Ampliació i exemple de com utilitzar models paramètrics amb dades censurades per intervals

Covariats variables en el temps

Fisher LD, Lin DY (1999). Covariables dependents del temps en el model de regressió de riscos proporcionals de Cox. Annu Rev Health Public 20: 145-57. PMID: 10352854

  • Explicació exhaustiva i fàcil d’entendre de les covariables que varien en el temps en models Cox, amb un apèndix matemàtic

Petersen T (1986). Adequació de models de supervivència paramètrics amb covariables dependents del temps. Appl Statist 35 (3): 281-88.

  • Article dens, però amb un exemple aplicat útil

Anàlisi de riscos competitius

Vegeu Riscos competitius

Tai B, Machin D, White I, Gebski V (2001) Anàlisi de riscos competitius en pacients amb osteosarcoma: una comparació de quatre enfocaments diferents. Stat Med 20: 661-684. PMID 11241570 .

  • Bon document en profunditat que descriu quatre mètodes diferents d’anàlisi de dades de riscos competitius i utilitza dades d’un assaig aleatori de pacients amb osteosarcoma per comparar aquests quatre enfocaments.

Checkley W, Brower RG, Muñoz A (2010). Inferència per a esdeveniments competitius mútuament excloents mitjançant una barreja de distribucions gamma generalitzades. Epidemiologia 21 (4): 557-565. PMID 20502337 .

  • Document sobre riscos competitius mitjançant la distribució gamma generalitzada.

Anàlisi de dades agrupades i models de fragilitat

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Models de riscos proporcionals amb efectes aleatoris per examinar els efectes centrals en assaigs clínics de càncer multicèntric. Mètodes estadístics Med Res 11: 221-236. PMID 12094756 .

  • Un article amb una explicació teòrica i matemàtica excel·lent de la presa en compte del clúster a l’hora d’analitzar les dades de supervivència d’assajos clínics multicèntrics.

O'Quigley J, Stare J (2002) Models de riscos proporcionals amb fragilitats i efectes aleatoris. Stat Med 21: 3219-3233. PMID 12375300 .

  • Una comparació directa entre models de fragilitat i models d’efectes aleatoris.

Balakrishnan N, Peng Y (2006). Model de fragilitat gamma generalitzat. Statist Med 25: 2797-2816. PMID

  • Un article sobre models de fragilitat que utilitza la distribució gamma generalitzada com a distribució de fragilitat.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: un paquet R per a l'anàlisi de dades de supervivència correlacionades amb models de fragilitat que utilitzen l'estimació de la probabilitat penalitzada o l'estimació paramètrica. Journal of Statistical Software 47 (4): 1-28.

  • Vinyeta del paquet R amb bona informació de fons sobre models de fragilitat.

Schaubel DE, Cai J (2005). Anàlisi de dades d’esdeveniments recurrents agrupats amb aplicació a les taxes d’hospitalització en pacients amb insuficiència renal. Bioestadística 6 (3): 404-19. PMID 15831581 .

  • Document excel·lent en què els autors presenten dos mètodes per analitzar dades recurrents d’esdeveniments agrupats i després comparen els resultats dels models proposats amb els basats en un model de fragilitat.

Gharibvand L, Liu L (2009). Anàlisi de dades de supervivència amb esdeveniments agrupats. SAS Global Forum 2009 Document 237-2009.

  • Font concreta i fàcil d’entendre per a l’anàlisi de dades de temps a esdeveniment amb esdeveniments agrupats amb procediments SAS.

Anàlisi d'esdeveniments recurrents

Twisk JW, Smidt N, de Vente W (2005). Anàlisi aplicada d'esdeveniments recurrents: una visió pràctica. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Introducció molt fàcil d'entendre a la modelització d'esdeveniments recurrents i al concepte de conjunts de riscos

Villegas R, Juliá O, Ocaña J (2013). Estudi empíric dels temps de supervivència correlacionats per a esdeveniments recurrents amb marges de riscos proporcionals i l’efecte de la correlació i la censura. BMC Med Res Methodol 13:95. PMID: 23883000

  • Utilitza simulacions per provar la robustesa de diferents models per obtenir dades d’esdeveniments recurrents

Kelly PJ, Lim LL (2000). Anàlisi de supervivència de dades d’esdeveniments recurrents: una aplicació a malalties infeccioses infantils. Stat Med 19 (1): 13-33. PMID: 10623190

  • Exemples aplicats dels quatre enfocaments principals per modelar les dades d'esdeveniments recurrents

Wei LJ, Lin DY, Weissfeld L (1989). Anàlisi de regressió de dades de temps de fallada incompletes multivariants modelant distribucions marginals. Revista de l'Associació Estadística Americana 84 (108): 1065-1073

L’article original que descriu models marginals per a l’anàlisi d’esdeveniments recurrents

Cursos

Institut d’Estiu d’Epidemiologia i Salut de la Població de la Universitat de Columbia (EPIC)

Statistical Horizons, proveïdor privat de seminaris estadístics especialitzats impartits per experts en la matèria

  • Seminari de 5 dies sobre història d’esdeveniments i anàlisi de supervivència que s’ofereix del 15 al 19 de juliol de 2015 a Filadèlfia, impartit per Paul Allison. No són necessaris coneixements previs d’anàlisi de supervivència. Per obtenir més informació, vegeu http://statisticalhorizons.com/seminars/public-seminars/eventhistory13

Programa d'estiu del Consorci Interuniversitari d'Investigacions Polítiques i Socials (ICPSR) en Mètodes Quantitatius d'Investigació Social, que forma part de l'Institut d'Investigació Social de la Universitat de Michigan

  • Seminari de 3 dies sobre anàlisi de supervivència, modelització de la història d’esdeveniments i anàlisi de la durada que s’ofereix del 22 al 24 de juny de 2015 a Berkeley, Califòrnia, impartit per Tenko Raykov de la Michigan State University. Visió general completa dels mètodes de supervivència en totes les disciplines (no només en salut pública): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

L'Institut d'Investigacions Estadístiques ofereix dos cursos en línia per a l'anàlisi de la supervivència, que s'ofereixen diverses vegades a l'any. Aquests cursos es basen en el llibre de text d’Anàlisi aplicada de Klein i Kleinbaum (vegeu més avall) i es poden fer a la carta o com a part d’un programa de certificats a Statistics:

  • Introducció a l'anàlisi de supervivència, amb un enfocament en models semi-paramètrics de Cox, impartits per David Kleinbaum o Matt Strickland: http://www.statistics.com/survival/

  • Anàlisi avançada de supervivència, inclosos models paramètrics, anàlisi de recurrència i models de fragilitat, impartits per Matt Strickland: http://www.statistics.com/survival2/

L’Institut de Recerca i Educació Digital de la UCLA ofereix allò que anomenen seminaris a través del seu lloc web per a l’anàlisi de la supervivència en diferents programes estadístics. Aquests seminaris demostren com realitzar anàlisis de supervivència aplicada, centrant-se més en el codi que en la teoria.

Articles D'Interès

L'Elecció De L'Editor

Emmanuel v. State of Kerala
Emmanuel v. State of Kerala
Columbia Global Freedom of Expression intenta avançar en la comprensió de les normes i institucions nacionals i internacionals que millor protegeixen el lliure flux d’informació i expressió en una comunitat global interconnectada amb grans reptes comuns a abordar. Per assolir la seva missió, la Llibertat d’expressió mundial realitza i encarrega projectes de recerca i polítiques, organitza esdeveniments i conferències i participa en debats globals sobre la protecció de la llibertat d’expressió i informació al segle XXI i hi contribueix.
Metaanàlisis de dades agregades o metaanàlisis de dades de participants individuals (anàlisis agrupades retrospectivament i prospectivament)
Metaanàlisis de dades agregades o metaanàlisis de dades de participants individuals (anàlisis agrupades retrospectivament i prospectivament)
Visió general Programari Descripció Llocs web Lectures Visió general dels cursos L’objectiu d’aquesta pàgina és descriure i comparar i contrastar tres enfocaments quantitatius: metaanàlisis de dades agregades, metaanàlisis de dades de participants individuals (estudis agrupats retrospectius) i estudis agrupats planificats prospectivament i proporcionar recursos per donar suport a l’adopció d'aquests
El gran repte del bé
El gran repte del bé
Enhorabona als guanyadors del primer gran desafiament. Amb el generós suport de la Fundació Beba, el Gran Desafiament del Bé ...
Dilipak v. Turquia
Dilipak v. Turquia
Columbia Global Freedom of Expression intenta avançar en la comprensió de les normes i institucions nacionals i internacionals que millor protegeixen el lliure flux d’informació i expressió en una comunitat global interconnectada amb grans reptes comuns a abordar. Per assolir la seva missió, la Llibertat d’expressió mundial realitza i encarrega projectes de recerca i polítiques, organitza esdeveniments i conferències i participa en debats globals sobre la protecció de la llibertat d’expressió i informació al segle XXI i hi contribueix.
James Currie
James Currie
James Currie és professor associat de música en musicologia històrica a la Universitat de Buffalo. Currie és un escriptor i intèrpret el treball del qual s’ha ocupat d’articular els punts d’interacció i dislocació entre música, història, filosofia i política. Els seus escrits acadèmics han aparegut àmpliament, inclòs al Journal of the American Musicological
Sarah A. Seo
Sarah A. Seo
Sarah A. Seo és historiadora del dret i del procediment penal als Estats Units del segle XX. El seu llibre recent, Policing the Open Road: How Cars Transformed American Freedom, examina la història de l’automòbil per explicar l’evolució de la Quarta Esmena i explorar el problema de la discreció policial en una societat compromesa amb l’estat de dret. El llibre va ser nomenat un dels deu millors llibres d’història del 2019 per la revista Smithsonian i va rebre diversos premis, inclosos el premi Order of the Coif Book, el premi Littleton-Griswold de l’American Historical Association i el premi Ralph Waldo Emerson de la Phi Beta Kappa Society. . A més de publicar en revistes acadèmiques, Seo ha escrit per a The Atlantic, Boston Review, Lapham’s Quarterly, Le Monde Diplomatique, The New York Review of Books i Washington Post. Després de guanyar-se el títol de JD a la Columbia Law School el 2007, Seo va dirigir el jutge Denny Chin, aleshores del Tribunal de Districte dels Estats Units per al districte sud de Nova York, i la jutgessa Reena Raggi, del Tribunal d’Apel·lacions dels Estats Units del 2n Circuit. Seo va impartir classes a la Iowa Law School abans d’incorporar-se a la facultat de Columbia Law School el 2020.
Otto-Preminger-Institut v. Àustria
Otto-Preminger-Institut v. Àustria
Columbia Global Freedom of Expression intenta avançar en la comprensió de les normes i institucions nacionals i internacionals que millor protegeixen el lliure flux d’informació i expressió en una comunitat global interconnectada amb grans reptes comuns a abordar. Per assolir la seva missió, Global Freedom of Expression realitza i encarrega projectes de recerca i polítiques, organitza esdeveniments i conferències, participa i contribueix a debats globals sobre la protecció de la llibertat d’expressió i informació al segle XXI.