Abstracte achtergrond
Baseline en trendgegevens voor orale en keelholte incidentie van kanker is beperkt. Een nieuw algoritme werd afgeleid met behulp van de Surveillance, Epidemiologie, en End Results (SEER) -Medicare gekoppelde database naar een algoritme om incident gevallen van mond- en keelholte kanker via Medicare claims te identificeren creëren.
Methods
Met behulp van een split-sample aanpak, Medicare claims 'procedure en de diagnose codes werden gebruikt om een nieuw algoritme te genereren op mondelinge en keelholte gevallen van kanker te identificeren en valideren van de operationele kenmerken.
Resultaten
Het algoritme had hoge gevoeligheid (95%) en specificiteit (97% ), die weinig per leeftijdsgroep, geslacht en ras en etniciteit gevarieerd.
Conclusie
Voorbeelden van het nut van dit algoritme en de operationele kenmerken zijn het gebruik van het aan de uitgangssituatie en trend schattingen van de mondelinge en keelholte incidentie van kanker leiden. Dergelijke maatregelen kunnen worden gebruikt om de incidentie schattingen waar ze ontbreken of om te dienen als vergelijker ramingen voor tumor registers bieden.
Sleutelwoorden
Medicare Mondkanker Secundaire data-analyse SEER Electronic aanvullend materiaal
De online versie van dit artikel ( doi:. 10 1186 /1472-6831-13-1) bevat aanvullend materiaal, dat beschikbaar is voor geautoriseerde gebruikers is achtergrond
rapport van de Surgeon General's op de mondgezondheid in Amerika verklaard dat orale en craniofaciale surveillance databases. voor ziekten, gezondheidszorg, en gebruik van gezondheidszorg beperkt zijn of ontbreken [1]. Dit rapport werd aangedrongen op verdere ontwikkeling en validatie van uitkomstmaten [1]. Het National Institute of Dental en Craniofacial Research (NIDCR) merkte op soortgelijke problemen [2], en beschreef de behoefte aan basisgegevens om trends in de tijd te erkennen, in het bijzonder voor achtergestelde bevolkingsgroepen en minder voorkomende aandoeningen onder de algemene bevolking [2].
Orale en keelholte (oP) kanker gediagnosticeerd in ongeveer 30.000 mensen in de Verenigde Staten elk jaar, en de jaarlijkse sterfte voor oP kanker is ongeveer 7500 [1-3]. Een groot deel van OP gevallen gediagnosticeerd zijn tussen individuen leeftijden van 65 jaar en ouder [4]. Ondanks het grote aantal nieuwe gevallen per jaar, OP-kanker relatief-is een zeldzame ziekte; zo grote populatie gebaseerde instellingen zijn vaak nodig om belangrijke onderzoeksvragen te beantwoorden. Zo hebben we gegenereerd en gevalideerd een algoritme om invallende OP ingegeven gevallen bejaarden conclusies identificeren.
Onderzoekers hebben gebruikt Medicare claims voor kanker en andere gezondheidseffecten studies. Ziekenhuis, poliklinische, en arts claims kunnen worden omgevormd in lengterichting databases. Daarbij kan diagnose en procedurecodes, kosten van diensten, alsmede de overeenkomstige data van deze diagnoses en procedures.
Cooper et al. [5] bestudeerden de gevoeligheid van Medicare gegevens incident prostaat-, long-, colorectale, borst-, pancreas-, en endometriumkanker gevallen op te sporen. Een algoritme door Freeman et al. [6] invallend borstkankergevallen basis van bejaarden conclusies hadden hoge gevoeligheid (90%) te identificeren, en ook gemeten de specificiteit en positieve predictieve waarde van hun algoritme. McClish en Penberthy [7] gebruikt Medicare claims om het aantal gemiste gevallen in de Virginia kankerregistratie kwantificeren. Medicare vorderingen creëerde een unieke kans voor hun werk als het benodigde gegevens uit drie verschillende bronnen-Virginia kanker register, de Medicare Part A beweert, en de Medicare Part B claims. Mandelblatt et al. [8] en Mandelblatt et al. [9] gebruikt het algoritme van Freeman et al. [6] om gevallen van borstkanker te identificeren behandelingen en percepties van de behandeling van kanker te onderzoeken. Van bijzonder belang voor Mandelblatt et al. [8] waren raciale verschillen gezondheid. Naast het algoritme ontwikkeld door Freeman et al. [6], Nattinger et al. [10] creëerde een vier-stap algoritme om gevallen van borstkanker onder de Medicare bevolking te identificeren en een verbetering van de positief voorspellende waarde (≥89%) voor het identificeren van de gevallen, met behoud van een hoge mate van gevoeligheid en specificiteit.
In deze studie de SEER-Medicare gekoppelde database werd gebruikt om een algoritme dat incident oP kankergevallen vastgesteld bij ouderen met alleen Medicare aanspraken ontlenen. Dit algoritme kan toekomstige studies in staat stellen om onderzoek te vragen over OP kanker aan te pakken door middel van secundaire gegevens analyses over Medicare claims. Individuen die door het algoritme gelijktijdig worden gekoppeld aan hun medische dossiers (bejaarden conclusies) voor de gezondheid trajecten beoordelen. Schattingen van OP incidentie van kanker kan ook worden afgeleid met behulp van dit algoritme voor Medicare begunstigden, een grote populatie-basis inclusief vele landelijke en andere moeilijk bereikbare bevolking in de Verenigde Staten.
Methoden
Gegevensbronnen
De SEER-Medicare gekoppelde database werd gebruikt voor deze studie. Het Center for Medicare en Medicaid Services verbonden Surveillance, Epidemiologie, en End Results (SEER) tumor register gegevens met Medicare claims en volkstelling gegevens te creëren de SEER-Medicare gekoppelde database. Deze gegevens bevatten informatie over personen met kanker, geïdentificeerd als zijnde gevallen in de SEER tumor registry, die had ook Medicare verzekeringen, zoals aangegeven door Medicare inschrijving verslagen. Bijna alle (97%) van de bevolking leeftijden van 65 jaar en ouder in de Verenigde Staten hebben Medicare ziektekostenverzekering dekking [11], die intramurale hospitalisatie, bekwame verpleeghuis, thuis gezondheid, en hospice zorg (deel A) dekking biedt. De meeste begunstigden hebben ook dekking voor arts en ambulante zorg (deel B) [11]. Demografische informatie was ook beschikbaar via Medicare inschrijving bestanden, waaronder het lidmaatschap van Health Maintenance Organizations of zorgorganisaties [11]. Voor dit onderzoek alleen opname (deel A) en arts en ambulante (deel B) bejaarden conclusies gebruikt. Eerdere onderzoeken van de SEER-Medicare-database is gebleken dat ongeveer 93,6% van de gevallen in SEER tumor register werden ook opgenomen in de SEER-Medicare-database voor patiënten leeftijden van 65 jaar en ouder [12]. Ondernemingen De SEER-Medicare gekoppelde database bestond uit twee soorten noemer bestanden, de patiënt recht en diagnose Samenvatting File (PEDSF) en die zijn samengevat noemer File (SumDenom). De PEDSF bevatte patiëntgegevens door zowel SEER en de Social Security Administration verzameld. Deze omvatten maatregelen zoals geboortedatum, ras, etniciteit, provincie van de woonplaats, Medicare in aanmerking te komen, HMO lidmaatschap en de datum van overlijden. Alleen individuen gediagnosticeerd in een ziener register met kanker werden opgenomen in de PEDSF file; dus tumor maatregelen (zoals kanker site, de datum van de diagnose, stadium van de tumor, enz.) uit SEER werden ook opgenomen in deze bestanden. Onze PEDSF bestand opgenomen patiënten in de SEER-Medicare gekoppelde database waarvan de diagnose van kanker vond plaats van 1973 tot 2002. We verkregen 100%-bestanden voor patiënten met OP kanker gediagnosticeerd in deze jaren. Onderwerpen met andere dan OP kanker kanker werden niet opgenomen in deze analyses. De SumDenom bevatte vergelijkbare demografische informatie aan de PEDSF, met zijn informatie uitsluitend verzameld van de Social Security Administration. De informatie in het SumDenom bestand was een 5% steekproef van individuen die in SEER gebieden die niet was gekoppeld aan een ziener tumor register. Informatie in onze SumDenom file had betrekking op de jaren 1986 tot 2004.
Medicare claims delen van de SEER-Medicare gekoppelde database (intramurale, arts en poliklinische dossiers) werden aan elkaar gerelateerd via een gemeenschappelijke, vakspecifieke identifier variabele. De Medicare Provider analyse (MedPAR) bestanden ziekenhuis opname claims. Deze omvatten ICD-9-CM diagnose codes, ICD-9-CM procedure codes, alsmede de overeenkomstige data van de diagnoses en procedures. De 100% Physician /leverancier (arts) bestanden een subset van de National conclusies Historiebestanden en waren als de NCH bestanden genoemd. Deze gegevens opgenomen ICD-9-CM diagnose codes en een CPT procedure code, samen met de bijbehorende data van deze diagnoses en procedures. De Ambulante Standard Analytic (ambulante) bestanden waren ook een subset van de Nationale Claims Geschiedenis-bestanden, en werden de OutSAF bestanden waarnaar wordt verwezen. Deze gegevens opgenomen ICD-9-CM diagnose codes, ICD-9-CM procedure codes, en een CPT procedure code met bijbehorende data.
Study cohort
Een totaal van 3.050 incident OP gevallen van kanker met een datum van de diagnose in het kalenderjaar 2002 werden geïdentificeerd. De lagere leeftijdsgrens voor opname was 66 jaar mogelijk te maken voor onderwerpen veroudering in Medicare op de leeftijd van 65 tot onze voorafgaande dekking criteria te voldoen, waardoor er 2751 gevallen. Om ervoor te zorgen volledige informatie voor medische geschiedenis elk onderwerp, op slechts onderwerpt met een dekking door Medicare (delen A en B), maar niet door een HMO in het jaar voordat de diagnose door middel van het jaar na de diagnose (of via de dood voor onderwerpen die stierven binnen een jaar na de diagnose) opgenomen. Naar aanleiding van deze uitsluiting, 1807 OP kankergevallen gebleven. Voor de controles niet-kanker, werden 472.293 patiënten geïdentificeerd uit de SumDenom bestand als levend in 2002. A "pseudo-diagnose date" werd willekeurig toegewezen als een datum in het kalenderjaar 2002. (Alternative willekeurige toewijzing strategieën zou waarschijnlijk niet van invloed op de resultaten als er geen tijdelijke trends met betrekking tot de conclusies in verband met OP incidentie van kanker werden verwacht.) Een totaal van 368.666 controles waren minstens 66 jaar oud zijn op deze pseudo-diagnose data. Gebruik makend van dezelfde opname /uitsluitingscriteria voor deze onderwerpen voor Medicare en geen HMO dekking op de pseudo-diagnose datum en de bijbehorende tijdvenster vertrokken 242.654 non-OP kanker controle onderwerpen.
Study maatregelen
OP kanker werden geïdentificeerd met behulp van de SITE CODEER variabele uit de PEDSF bestanden. Integer waarden van 1-10 betekende de volgende kanker sites (respectievelijk): lip; tong; speekselklier; vloer van de mond; kauwgom en andere mond; nasopharynx; tonsillen; oropharynx; hypofarynx; en andere mond- en keelholte. Voor patiënten met meer dan één primaire diagnose op de leeftijd van 66 en ouder van OP kanker, het voorkomen gediagnosticeerd in de 2002 kalenderjaar gebruikt. De representatieve steekproef van individuen die diende als controlegroep bestond uit opmerkingen van de SumDenom bestand. Nr variabelen waren nodig om ze te identificeren als controles, als hun positie in deze 5% voorbeeldbestand ze geïdentificeerd als een Medicare begunstigde die in een SEER gebied dat niet waren gediagnosticeerd met kanker.
Evaluatie van de prestaties van het algoritme in verschillende demografische kenmerken werd uitgevoerd in het validatieproces. De volgende maatregelen in zowel PEDSF en SumDenom bestanden werden gebruikt voor deze analyse: leeftijd, geslacht en ras en etniciteit. Diagnose en behandeling van bejaarden conclusies codes gebruikt voor het algoritme om te voorspellen of een individu een incident OP kankergeval of geen (controle). De data die overeenkomt met deze diagnoses en procedures werden in de bejaarden conclusies, en werden gebruikt voor het optreden van dergelijke codes binnen een jaar (voor of na) de mogelijke datum van inval beperken.
Gebouw het algoritme
Om ons algoritme, 1.807 incident oP gevallen van kanker met een datum van de diagnose in het kalenderjaar 2002, dat voldeed aan onze inclusie criteria werden geïdentificeerd genereren. Een totaal van 242.654 onderwerpen uit de SumDenom bestanden die in 2002 in leven waren en een "pseudo-diagnose date" in het kalenderjaar 2002 willekeurig toegewezen. Medicare (MedPAR, NCH en OutSAF) claims voor die onderwerpen die een datum binnen een jaar had (een jaar eerder tot een jaar na) hun diagnose datum /pseudo-diagnose datum werden geselecteerd. ICD-9 procedure codes en CPT procedure codes van deze claims werden gebruikt. Een 60% enkelvoudige aselecte steekproef (zonder vervanging) van deze onderwerpen werd geselecteerd om het algoritme af te leiden (n = 1085 OP gevallen van kanker; n = 145.548 controles), het verlaten van de resterende 40% (n = 722 OP gevallen van kanker; n = 97.106 controles ) beschikbaar voor validatie. Contingency tafels werden gegenereerd om demografische en klinische kenmerken van het algoritme gebouw (60%) en validatie (40%) monsters te vergelijken. Deze eigenschappen werden vergeleken tussen de monsters met behulp van chi-kwadraat test Pearson.
Medicare aanspraken werden gebruikt om gewichten voor het algoritme te genereren. Elke vordering bron (MedPAR, NCH en OutSAF) werd afzonderlijk in het proces dat volgt behandeld. De eerste stap in het algoritme werd het aantal claimtypen verminderen. Dus, door het OP gevallen alleen procedures die een ICD-9 diagnose code voor OP kanker (waarden 140.XX-149.XX) ten minste 50% van de tijd dat de procedure plaatsvond werden behouden had. Vervolgens wordt de relatieve frequentie van voorkomen van (tenminste één) van elk van deze unieke ICD-9 behandeling en CPT codes in de conclusies van de OP gevallen zijn afgeleid en dan weer onder de besturing. De log
2 van de verhouding van deze relatieve frequenties (of presence per ICD-9 procedurecode Elke CPT code binnen elke conclusie bron) onder de OP gevallen en onder de controle werd gebruikt om een gewicht per te genereren. (Codes die zich alleen onder de OP gevallen, de relatieve frequentie waarde voor de controlegroep was één gedeeld door het aantal controles plus een splitsende voorkomen door nul.) Gewichten met een waarde minder dan of gelijk aan vier in de ICD -9 procedure codes en CPT-codes werden op nul gezet. (Dit werd gerechtvaardigd op grond van lage onderscheid tussen de relatieve frequenties van de OP gevallen vergeleken met de controledieren.) Een score voor elk OP geval en voor elke controle werd gegenereerd door het optellen van de gewichten voor elke code die tijdens hun tweejarige aanwezig was venster rond hun diagnose /pseudo-diagnose data. Gewichten voor de aanwezigheid van een ICD-9 diagnose codewaarde 140.XX-149.XX (OP kankerdiagnose code) werden gegenereerd door middel van de log 2 de verhouding van de relatieve frequentie van voorkomen van een dergelijke code ( in elke data source) onder de oP gevallen ten opzichte van de controles niet-kanker, dan is het toevoegen van dit gewicht aan de score van elke proefpersoon. Formeel is de vergelijking voor het bepalen van elk proefpersonen stand was Score =
Σ
x
Med ·
Code s
Med < mtr> +
Σ
x
NCH ·
Code s
NCH +
Σ
x
Out ·
Code s
Out, waar: Codes
Med
vertegenwoordigde de verschillende gewichten van de procedure ICD-9 en de diagnose codes en CPT procedure codes hierboven omschreven uit de MedPAR gegevensbron en x
Med
vertegenwoordigde de bijbehorende indicator variabelen (1 indien aanwezig; 0 indien niet aanwezig) voor de vraag of het onderwerp had de code in hun vorderingen tijdens de gedefinieerde tijdvenster; Codes
NCH Kopen en x
NCH
vertegenwoordigd deze waarden voor de NCH gegevensbron; en Codes
Out Kopen en x
Out
vertegenwoordigd ze voor de OutSAF gegevensbron.
Gezien de scores afgeleid voor elke gegevensbron (MedPAR, NCH en OutSAF ), die het algoritme onderwerpen, zaken als ze een positieve waarde in een van de drie scores hadden. Personen met een waarde nul in alle drie de scores worden geacht geen OP kanker door het algoritme. Histogrammen van de scores voor elke gegevensbron en de gecombineerde bron werden gepresenteerd voor OP gevallen van kanker en controles. (Vanwege de grootte van de gegevensbron voor de controles, een aselecte steekproef [zonder vervanging] van die ontbreken OP kanker werd gebruikt om onderwerpen voor deze histogrammen selecteren.) Andere cut-punten werden onderzocht en een ROC-curve ( ROC) curve [13] gepresenteerd. De aanvullende afsnijpunten inbegrepen de minimale Euclidische afstand tussen het punt (0%, 100%) op de ROC-curve (die 100% gevoeligheid en 100% specificiteit) en een die specificiteit gemaximaliseerd. Schattingen op gevoeligheid en specificiteit, samen met de bijbehorende 95% betrouwbaarheidsintervallen [13] werden gegenereerd voor elk van deze licht-punten.
Validatie algoritme
De gewichten voor elke code die het algoritme af te leiden, scores gegenereerd voor alle Medicare claims (MedPAR, NCH en OutSAF) voor elke tijdens hun individuele tijdvensters (gecentreerd op hun diagnose datum /pseudo diagnose datum) in de resterende 40% monster, genaamd de validatie monster. Onderwerpen die een positieve waarde in een van deze drie scores hadden werden geïdentificeerd door het algoritme als hebbende OP kanker, en die met een waarde van nul in alle drie de scores worden geacht geen OP kanker. Ter vergelijking werd het algoritme ook beoordeeld op de hierboven beschreven aanvullende afsnijpunten. De a priori
onderzoek hypothese was dat de afgeleide algoritme zou sensitiviteit en specificiteit waarden van ten minste 85% en 95%, respectievelijk. Puntschattingen en 95% betrouwbaarheidsintervallen voor deze sensitiviteit en specificiteit [13] werden gegenereerd.
Variatie in gevoeligheid en specificiteit demografische factoren werd ook geëvalueerd. Met de validatie monster logistische regressiemodellen [14] voorspellen toestand kanker zoals bepaald door het algoritme gegenereerd, eerst onder degenen met OP kanker (voor gevoeligheid) en vervolgens onder de bedieningssystemen (specificiteit). Backwards eliminatie werd gebruikt om het model met behulp van leeftijd, geslacht en ras en etniciteit te selecteren. Alle mogelijke interacties mochten, en het selectiecriterium was ingesteld op p & lt; 0,1 (Wald test) in het model te blijven. De a priori
onderzoek hypothese was dat de gevoeligheid en specificiteit waarden niet zou verschillen per demografische subgroepen. Voorspelde kans en bijbehorende 95% betrouwbaarheidsintervallen werden geschat [14]. Model fit werd geëvalueerd met behulp van de Hosmer-Lemeshow goodness-of-fit-test [14].
Positieve en negatieve voorspellende waarden werden ook geschat voor het algoritme op de validatie monster. Deze waarden weergegeven: de kans dat een patiënt die door het algoritme als OP kankergeval was in feite een OP kankergeval (positieve voorspellende waarde); en de kans dat een patiënt aangegeven door het algoritme als controle subject echt niet over OP kanker (negatieve voorspellende waarde). Omdat de controles vertegenwoordigen slechts 5% steekproef uit die populatie werden de proefpersonen van dit monster gewogen met een factor van 20 een geschikte schatting voor deze waarden te verkrijgen. Vijfennegentig procent betrouwbaarheidsinterval [13] werden geschat voor deze opgeblazen monster voor deze schattingen.
Dit project werd goedgekeurd door de Universiteit van Kansas Medical Center Mensgebonden Committee (HSC # 10914). SAS versies 9.1, 9.2 en 9.3 (SAS Institute, Cary, NC) werden gebruikt voor gegevensbeheer en analyses.
Resultaten
Onder de OP gevallen van kanker, de verdelingen van leeftijd, geslacht en ras en etniciteit waren soortgelijke tussen het algoritme gebouw en monsters validatie. Hetzelfde gold voor de controlemonsters ook. Deze resultaten werden gepresenteerd in tabel 1.Table 1 Frequentie distributies (%) van de kenmerken van het algoritme gebouw en validatie samples
Kenmerk
Algoritme gebouw monster
Validation monster
Pearson'sx 2-test p-waarde
OP kankergevallen *
1085 (100,0)
722 (100.0)
Age Group
66-69
201 (18,5)
116 (16.1)
0,1370
70-74
271 (25,0)
184 (25,5)
75-79
266 (24,5)
195 (27.0)
80-84
205 (18,9)
114 (15,8)
85 jaar en ouder
142 (13.1)
113 (15,7)
Sex
Vrouwelijk
417 (38,4)
287 (39,8)
0,5738
Man Gids 668 (61,6)
435 (60,3)
Race en etniciteit
Black
59 (5.4)
43 (6,0)
0,8859
Hispanic
17 (1.6)
9 (1.3)
Overige
49 (4.5)
30 (4.2)
White
960 (88,5)
640 ( 88.6)
controles niet-kanker
145.548 (100.0)
97.106 (100.0)
Age Group
66-69
28.549 (19,6)
19.036 (19,6)
0,2610
70-74
36.729 (25,2) Gids 24.269 (25,0)
75-79
33.361 (22,9)
22.597 (23,3)
80-84
24.635 (16,9)
16.479 (17,0)
85 jaar en ouder
22.274 (15,3)
14.725 (15,2)
Sex
Female
89.736 (61,7)
60.050 (61,8)
0,3564
Man Gids 55.812 (38,4)
37.056 ( 38.2)
Race en etniciteit
Black
10.385 (7.1)
7148 (7,4)
0,0037
Hispanic
3685 (2.5)
2279 (2.4)
Andere
8681 (6.0)
5897 (6.1)
White
122.797 (84,4)
81.782 (84,2)
* oP:. mondelinge en keelholte
algoritme gebouwd
de gewichten van elk van de codes voor het genereren van de totale scores werden gepresenteerd (zie Extra file 1: Bijlage Tables AD). Met behulp van de cut-punt van een positieve (& gt; 0) score, de gevoeligheid en specificiteit waren 93,9% en 96,2% respectievelijk. Histogrammen van de verdelingen van scores bij de OP kankergevallen en controles werden weergegeven in figuur 1. De ROC curve voor verschillende cut-punten van het algoritme score voor het aanduiden van een OP kankergeval gepresenteerd in figuur 2 Hierbij worden alleen de waarden met hoge specificiteit (& gt; 96%). Hier aangeduid dat de waarde met de kleinste Euclidische afstand van het punt (0%, 100%) op de curve had hoge specificiteit. Deze minimale afstand plaatsgevonden waar de Medicare vorderingen een waarde & gt score had, 5.48, en produceerde een gevoeligheid van 93,8% en 97,1% specificiteit. Met behulp van een meer ad hoc aanpak van de prioritering van de maximalisatie van de specificiteit (als gevolg van de relatief zeldzame incidentie van kanker OP), vonden we dat een cut-punt van & gt; 37,43 had een gevoeligheid van 75,0% en een specificiteit van 99,3%. Deze resultaten, samen met de bijbehorende 95% betrouwbaarheidsintervallen werden weergegeven in Tabel 2. Figuur 1 Histogrammen van de scores gebaseerd op Medicare claims herkomst en totaal *. * Mondelinge en keelholte (OP) kanker case (magenta) en controle (blauw) scores; verticale verwijzing staven voor: de eerste cut-point score (& gt; 0 met vermelding van het algoritme te identificeren als een OP kanker geval) dat een gevoeligheid van 93,9% en een specificiteit van 96,2%, de minimale Euclidische afstand cut-point had (& gt; 5,48) dat had een gevoeligheid van 93,8% en een specificiteit van 97,1%, en voor de cut-punt dat specificiteit gemaximaliseerd (& gt; 37,43). dat 75,0% sensitiviteit en 99,3% specificiteit had
figuur 2 Receiver functionele eigenschappen (ROC) curve voor scores op basis van Medicare claims voor het identificeren incident mondelinge en keelholte gevallen van kanker *. * Referentie lijnen aangegeven: voor de eerste cut-point score (& gt; 0 met vermelding van het algoritme te identificeren als een OP kanker geval) had een gevoeligheid van 93,9% en een specificiteit van 96,2%; de gevoeligheid en specificiteit voor de minimale Euclidische afstand cut-point (& gt; 5,48) waren 93,8% en 97,1%, respectievelijk; en voor de cut-punt dat specificiteit gemaximaliseerd (& gt; 37,43), de gevoeligheid was 75,0% en de specificiteit was 99,3%
Tabel 2 gevoeligheid en specificiteit waarden voor verschillende score cut-punten voor de modelbouw en samples validatie
. Medicare vorderingen score cut-point
gevoeligheid (95% CI) *
specificiteit (95% CI) *
& gt; 0.00
93,9 (92,5-95,3) /95,3 (93,8-96,8)
96,2 (96,1-96,3) /96,0 (95,9-96,2)
& gt; 5,48
93,8 (92,4-95,3) /95,3 (93,8-96,8)
97,1 (97,0-97,2) /97,0 (96,9-97,1)
& gt; 37.43
75,0 (72,5-77,6) /79,8 (76,9-82,7)
99,3 (99,3-99,3) /99,3 (99,2-99,3)
*%; BI: betrouwbaarheidsinterval; algoritme building monsterwaarden /validatie monsterwaarden.
Validatie van het algoritme
verschillende afsnijpunt scores een vergelijkbare gevoeligheid en specificiteit waarden met die van het algoritme gebouw monster. De eerste cut-point score (& gt; 0 met vermelding van het algoritme te identificeren als een OP kanker geval) had een gevoeligheid van 95,3% en een specificiteit van 96,0%. De sensitiviteit en specificiteit voor de minimale Euclidische afstand cut-point (& gt; 5,48) waren 95,3% en 97,0% respectievelijk. Voor de cut-punt dat specificiteit gemaximaliseerd (& gt; 37,43), de gevoeligheid was 79,8% en de specificiteit was 99,3%. Deze resultaten, samen met de bijbehorende 95% betrouwbaarheidsintervallen werden in tabel 2
model op gevoeligheid aangegeven dat de gevoeligheid lager voor mannen dan voor vrouwen (p = 0,0531). De geschatte gevoeligheid was 97,2% voor vrouwen en 94,2% voor mannen. (Gegeven het aantal parameters in dit model, de Hosmer-Lemeshow goedheid-of-fit test kan niet worden uitgevoerd.) Het model voor specificiteit ingewikkelder. Het uiteindelijke model opgenomen leeftijdsgroep (p & lt; 0,0001), geslacht (p & lt; 0,0001), ras en etniciteit (p = 0,0158) en de leeftijdsgroep-by-ras en etniciteit interactie (p = 0,0072). Geen significante gebrek aan-of-fit werd waargenomen voor dit model (p = 0,5155). Alle, maar een leeftijdsgroep-by-sex-by-ras en etniciteit subgroep had een geschatte specificiteit waarden van meer dan 95%. De groep met specificiteit onder deze drempel was Spaanse mannetjesleeftijden 85 en ouder, en had een waarde van 94,0%. De geschatte gevoeligheid en specificiteit en overeenkomstige waarden 95% betrouwbaarheidsintervallen van deze modellen werden gepresenteerd in Tabel 3. In het bijzonder, maar statistisch significante verschillen werden gedetecteerd, sensitiviteit en specificiteit waarden waren vergelijkbaar in groups.Table 3 Gecorrigeerd sensitiviteit en specificiteit waarden voor de minimale Euclidische afstand cut-punt voor de validatie samples
gevoeligheid (95% betrouwbaarheidsinterval)
Vrouwtjes (ongeacht leeftijd en ras en etniciteit)
97,2 (94,5-98,6)
Mannetjes (ongeacht leeftijd en ras en etniciteit)
94,0 (91,4-95,9)
specificiteit (95% betrouwbaarheidsinterval)
Ages 66-69
Female
Black
97,3 (96,4-97,9)
Hispanic
98,0 (96,1-99,0)
Andere
98,2 (97,3-98,7)
White
97,6 (97,4 -97,8)
Man
Black
96,4 (95,3-97,2)
Hispanic
97,4 ( 94,9-98,7)
Andere
97,5 (96,4-98,3)
White
96,8 (96,5-97,2)
Ages 70-74
Female
Black
97,6 (96,8-98,2)
Hispanic
98,3 (97,2-99,0)
Andere
98,2 (97,5-98,8)
White
97,1 (96,9 Alle auteurs hebben gelezen en goedgekeurd het definitieve manuscript.