Kildedata
Vi har to datavarehuse for sundhedsudgifter, der deler den samme referencefil og programmeringskodeinfrastruktur: et for det National Institutes of Health-finansierede Rochester Epidemiology Project (REP) og et for Mayo Clinic i Rochester. Begge var tidligere kendt som Olmsted County Healthcare Expenditure and Utilization Database. REP-lageret er tilknyttet det større REP , som er en forskningsinfrastruktur, der indeholder de sammenkædede sundhedsjournaler og administrative data om lægebehandling for stort set alle personer med bopæl i vores amt. I 1995 underskrev lederne af Mayo Clinic campus i Rochester, Minnesota, og Olmsted Medical Center (OMC) en aftale om elektronisk datadeling med henblik på at dele og arkivere administrative data på patientniveau om brugen af sundhedsydelser og de dermed forbundne direkte medicinske omkostninger ved behandling.
REP warehouse anvender faktureringsdata fra Mayo Clinic i Rochester og OMC og deres tilknyttede hospitaler for indbyggere i Olmsted County; til sammenligning anvender Mayo Clinic warehouse i øjeblikket kun faktureringsdata fra Mayo Clinic i Rochester for alle patienter, uanset hvor de bor. Det primære fokus i denne artikel er REP-omkostningsdatawarehouse.
Data udtrækkes fra institutionernes finansielle beslutningsstøttesystemer (DSS), som kombinerer data fra mange kilder for at understøtte praksisanalyser. Dataene omfatter faktureringstjenester, gebyrer, diagnoser, patienternes demografiske karakteristika, oplysninger om betalere, oplysninger om individuelle udbydere og, for én institution, de interne omkostninger. Fordelen ved at anvende DSS’er er, at alle data allerede er forbundet inden for de to institutioner på patientniveau, hvilket reducerer risikoen for fejl, når man kombinerer forskellige patient-, udbyder-, gebyr-, diagnose- og faktureringsfiler for professionelle og hospitalsydelser. REP-infrastrukturen udfører sammenkoblingen af patienter på højere niveau på tværs af institutioner. Mayo Clinic DSS-data lagres i et virksomhedsdatawarehouse; OMC DSS-data lagres i epidemiologiprogrammets database (Sybase; SAP SE). For at beskytte forretningsfølsomme oplysninger indgår ingen interne omkostninger eller forsikringsoplysninger fra de to institutioner i datalageret, og adgangen til OMC-kildedataene er begrænset til personale, der er tilknyttet REP. Det er forbudt for undersøgerne at sammenligne de to institutioner.
Ændringer i den ene institutions DSS og den anden institutions vedtagelse af et DSS gav os mulighed for at revidere den omkostningsberegningsproces og -struktur, der havde været gældende for OCHEUD i mange år. Vi opdaterede programmeringskoden for at forfine omkostningsberegningsprocessen og fjerne standardiseret lagring af omkostningsdata. Vi skelnede også mellem REP- og MCR-populationerne ved at oprette to lagernavne. Det nye lager kræver ingen ny lagerplads, er lettere at vedligeholde og udvide til andre udbydere og producerer standardiserede omkostninger for en ønsket kohorte meget hurtigere. Forholdet mellem REP-omkostningsdatawarehouse, kildefiler og REP med de datafelter, der anvendes af warehouset, er vist i fig. 1.
Vi har fundet ud af, at vi som et minimum har brug for følgende DSS-datafelter for hver tjeneste: patientidentifikator, dato for ydelsen, intern hovedkode for opkrævning, HCPCS-kode (Healthcare Common Procedure Coding System) eller CPT-4-kode (Current Procedural Terminology Fourth Edition), alle CPT-4-kodemodifikatorer, sted for ydelsen (hospital vs. klinik), mængde, gebyr, UB-indtægtskode (Uniform Billing) og en indikator for den endelige fakturering, der henviser til den endelige indgivelse af kravet.
Kostningsalgoritme
Vores omkostningsalgoritme er en hybrid af to metoder: en for professionelle ydelser faktureret til alle betalere på Centers for Medicare and Medicaid Services (CMS) 1500-formularen og en for hospitalsydelser faktureret til alle betalere på UB04- eller CMS 1450-formularen. Nærmere oplysninger om, hvordan vi håndterede særlige omstændigheder samt eksempler på SAS-koder findes i Yderligere filer 1 og 2, Yderligere filer 3 og 4: Tabel S1 og S2.
Professionelle tjenester identificeret med enten HCPCS- eller CPT-4-koder tildeles standardiserede omkostninger ved at anvende nationale godtgørelsesbeløb fra de relevante Medicare-læge-, kliniske laboratorie-, Medicare-part B-medikamenters gennemsnitlige salgspris og gebyrskemaer for varigt medicinsk udstyr, protese, ortopædisk udstyr og forsyninger. Ydelser uden et tildelt Medicare-gebyr, hvoraf de fleste er prissat af en operatør, tildeles et gebyr i form af en gap-kode fra The Complete RBRVS Annual Data File (Optum360, Inc) . Disse Medicare- og Optum360-gebyrer er baseret på relative værdinheder (RVU’er), som estimerer den relative ressourceudnyttelse; selv om disse gebyrer repræsenterer tredjepartsbetalers omkostninger, estimerer de også de relative udbyderomkostninger. Kilderne til disse referencefiler er anført i tabel 1. De tildelte omkostninger multipliceres med mængden og justeres derefter med de relevante modifikatorprocentsatser (tabel 2). Et gebyr på nul resulterer i en omkostning på nul. Hvis en ydelse har et negativt gebyr og en mængde, der afspejler en faktureringskorrektion, tildeles den en negativ omkostning.
Lægehonorarordningen (PFS) omfatter tre typer RVU’er – for arbejde, praksisudgifter og udgifter til fejlbehandling. RVU’erne summeres og multipliceres derefter med en omregningsfaktor. PFS- og gap-skemaerne indeholder forskellige RVU’er for praksisudgifter for mange ydelser, afhængigt af om ydelsen blev udført i en facilitet (f.eks. hospital) eller uden for en facilitet (eller klinik), fordi den tilladte praksisudgift for lægen er lavere, når faciliteten kan fakturere separat. Derfor skal der tages hensyn til ydelsesstedet ved fastsættelsen af det passende honorar. PFS- og gap-skemaer omfatter også separate gebyrer for nogle ydelser blandt tre forskellige modifikatorer: 26 (eller professionel komponent), TC (teknisk komponent) og 53 (eller ophørt procedure), så ydelser med en af disse modifikatorer i et af de fire mulige CPT-4-modifikatorfelter skal matches med gebyrskemaerne på både CPT-4 og modifikator.
Anæstesikostberegning er mere kompleks. Godtgørelsen for professionel anæstesi er baseret på den tid, der bruges til en procedure, så der er ingen faste honorarer for CPT-4-koderne. Tre typer enheder – basis, tid og fysisk status – lægges sammen og multipliceres derefter med en omregningsfaktor. Basisenhederne bestemmes af den CPT-4-kode, der angiver typen af operation og anæstesi. Tidenheder er lig med antallet af minutter divideret med 15 og derefter afrundet til 0,1. Enhederne for fysisk status bestemmes af American Society of Anesthesiologists fysiske statusmodifikatorer (dvs. P1-P6) (tabel 2), som repræsenterer patientens form før operationen. Endelig kan den resulterende omkostning nedsættes med 50 %, når visse modifikatorer (anført i tabel 2) angiver, at mere end én person har udført ydelsen, f.eks. en læge, der har ført tilsyn med en assistent eller anæstesisygeplejerske. Omregningsfaktorerne er anført i CMS-filen efter lokalitet; vi bruger den nationale gennemsnitsværdi for hvert år. Alternativt, når der findes faktureringsomregningsfaktorer for ydelserne i DSS, kan gebyrerne divideres med faktureringsomregningsfaktorerne og ganges med Medicare-omregningsfaktorerne for at opnå det samme resultat.
Alle ikke-anæstesiologiske professionelle ydelser, der ikke er omfattet af en gebyrskala, tildeles en imputeret omkostning ved at gange gebyret med et gennemsnitligt forhold mellem omkostninger og gebyr for professionelle ydelser (CCR). Figur 2 illustrerer beslutningsprocessen for alle professionelle ydelser.
Da Medicare-godtgørelsen for hospitalsydelser er baseret på en prospektiv betaling, kan den ikke bruges til at skabe standardiserede omkostninger for individuelle indlagte og ambulante ydelser, f.eks. leverancer eller brug af en operationsstue. Derfor bruger vi CCR’er fra Medicare-omkostningsrapporten til at konvertere gebyrer for individuelle ydelser til standardiserede omkostninger. Research Data Assistance Center giver en fremragende vejledning i, hvordan man får fat i CCR’erne, så vi går ikke i detaljer her . Udfordringen ligger i, hvad vi skal gøre med disse forhold.
Hvert sygehus’ omkostningsrapport indeholder sygehusets samlede omkostninger og gebyrer og et sæt omkostninger og gebyrer, der er tilpasset forskellige omkostningscentre, som kan bruges til at beregne CCR’er på sygehusniveau og omkostningscenterniveau. Selv om Healthcare Cost and Utilization Project giver hospitalsniveauet forholdstal for omregning af gebyrer til omkostninger, bruger vi CCR’er på omkostningscentreniveau for at give mere nøjagtige omkostninger på serviceniveau . Der er to måder at henføre disse CCR’er til de enkelte tjenester på: 1) match på det interne omkostnings- eller indtægtscenter, der blev brugt til at tildele gebyrer og omkostninger til omkostningsrapportens omkostningscenter, og 2) brug af UB-indtægtskoder, som anvendes af de fleste forskere og University HealthSystem Consortium . For tjenester som f.eks. kost og logi er resultatet det samme. Vi valgte at bruge indtægtskoder, da interne oplysninger om omkostninger eller indtægtscentre ikke var tilgængelige for den ene institution, og det var vanskeligt at vedligeholde mappingerne for den anden institution.
Vi skabte et krydsforløb mellem UB-indtægtskoder og omkostningsrapportomkostningscentre for hver institution. Når vi ikke havde et godt match, brugte vi hospitalets gennemsnitlige CCR. Tabel 3 indeholder et udsnit af en krydsoverensstemmelse. Medicare opretter lejlighedsvis nye omkostningssteder, som vi skal tage hensyn til i forbindelse med vores årlige opdateringer (f.eks. blev computertomografi og magnetisk resonansbilleddannelse opdelt fra diagnostisk radiologi i 2011). Vi fandt, at nogle CCR’er varierede mellem de to hospitaler på Mayo Clinic og varierede over tid, hovedsagelig på grund af ændringer i udarbejdelsen af omkostningsrapporter. Vi behandlede denne variation ved at kombinere omkostningerne og gebyrerne for disse to Mayo-hospitaler og derefter bruge 3 på hinanden følgende års omkostninger og gebyrer til at skabe 3-årige glidende gennemsnitskvotienter. Vi anvender også glidende gennemsnitskvotienter for OMC-hospitalet. Da omkostningsrapporterne først foreligger ca. 1 år senere, fortsætter vi med at bruge det foregående års forholdstal for det indeværende års ydelser, indtil en ny rapport foreligger.
De resulterende tildelte omkostninger for alle ydelser justeres for inflation ved hjælp af bruttonationalproduktets (BNP) Implicit Price Deflator til det sidste år i en undersøgerens undersøgelsesperiode som det sidste trin i omkostningsberegningsalgoritmen.
Varehusets struktur
Varehuset består af SAS-software version 9.4 (SAS Institute Inc.) kode og et sæt referencefiler. Alle gebyrskemaer til omkostningsberegning for fagfolk er stablet i én fil, der indeholder kolonner for CPT-4- og HCPCS-koder (opført i en enkelt kolonne), modifikator, år, gebyr uden for facilitet, gebyr for facilitet og kildegebyrskema. De er først ordnet efter år, derefter efter kode og derefter efter modifikator for hver kode. Da det kun er PFS og gap schedule, der har separate gebyrer for visse ydelser i og uden for en facilitet, er det samme gebyr ofte anført i begge kolonner. Denne ene fil anvendes for begge institutioner og indeholder i øjeblikket over 246 000 linjer for 2003 til 2015.
Tre yderligere referencefiler er nødvendige til omkostningsberegning af professionelle ydelser: modifikatorer med tilhørende omkostningsjusteringsprocenter, anæstesi-omregningsfaktorer pr. år og imputeringssatser pr. år og institution. Imputationssatser anvendes til at estimere en omkostning, når en professionel ydelse ikke kan henføres til et gebyr, der ikke er nul. Der oprettes en årlig sats ved at køre omkostningsberegningsalgoritmen på alle data for et serviceår. Vi beregner derefter forholdet mellem de samlede tildelte gebyrer og de samlede gebyrer for alle ydelser (eksklusive ydelser med nulgebyr) for at skabe en gennemsnitlig standardiseret omkostnings/gebyr-imputationssats, der kan ganges med de imputerede ydelsers gebyrer.
De to institutioners referencefiler for hospitalskalkulation indeholder hver især CCR’er, år og UB-indtægtskoder ordnet først efter år og derefter efter indtægtskode. Oprettelsen af CCR-filerne er en manuel proces, fordi det kræver en vurdering af, hvilke omkostninger og gebyrer på omkostningscentrene der skal kombineres for at skabe forholdstal (f.eks. operationsstue, opvågningsstue), og hvilke forholdstal der skal henføres til de forskellige UB-indtægtskoder. Inflationsfilen er først organiseret efter det år, hvor ydelsen fandt sted, og derefter efter det målår, som omkostningerne skal oppustes til, med et inflationsindeks bestående af BNP i målåret divideret med BNP i ydelsesåret for hver kombination af år.
Når vi når et nyt kalenderår, downloader vi det nye års CMS-filer, køber det nye Optum Gap Code-skema, downloader inflationsfaktorer fra Bureau of Labor Statistics, får adgang til institutionernes omkostningsrapporter for at skabe nye forhold mellem omkostninger og afgifter og anvender vores SAS-kode til at opdatere referencefilerne. Vi anvender omkostningsberegningsalgoritmen til at tildele uopblæste og opblæste omkostninger og en indikator for omkostningsberegningsmetoden (dvs. PFS, laboratorium, DME (varigt medicinsk udstyr), medicin, gap, anæstesi, CCR, zero charge eller impute) til hver tjeneste i den nye periode og udfører kvalitetskontrol. Vores kvalitetskontrolkode identificerer problemer som f.eks. UB-indtægtskoder i dataene, som skal tilføjes til CCR-referencefilen. Kvalitetskontrollen udsender en liste over alle CPT-4-koder, der er imputeret, så vi kan afgøre, om der er behov for en justering af referencefilen. Vores kvalitetskontrol ser også på tendenser i gebyrer og omkostninger over tid og kontrollerer proportionerne af de forskellige omkostningsmetoder i dataene. Endelig valideres stikprøver af data manuelt for at sikre nøjagtigheden.
Udvidelse af omkostningsdatalageret til en ny udbyder kræver primært oprettelse af et nyt sæt af udbyderspecifikke forhold mellem omkostninger og gebyrer og en krydsovergang af CCR’erne til omkostningsrapporternes omkostningscentre. Kvalitetskontrolkoden og den manuelle prøvevalidering vil fremhæve eventuelle afregningsanomalier, som der skal tages højde for ved at justere omkostningsalgoritmen.
Når en investigator indsender en anmodning om data ved at angive patientidentifikationsnumre og intervallerne af servicedatoer, kontrollerer vores algoritme først, om begge centrers institutionelle review board har godkendt undersøgelsen og har den relevante Minnesota Research Authorization-status for hver patient. Derefter udtrækkes alle tilgængelige servicelinjedata for de angivne datointervaller og patienter fra virksomhedens datawarehouse og REP-databasen, hvorefter omkostningsalgoritmen anvendes til at skabe inflationsjusterede standardiserede omkostninger. Undersøgerne modtager altid tjenester og standardiserede omkostninger baseret på de mest opdaterede kildedata, da vi ikke gemmer nogen versioner af datasæt med omkostninger.
Det endelige datasæt, der leveres til undersøgerne, omfatter en liste over tjenester med inflationsjusterede standardiserede omkostninger og omkostningsmetoder for hver tjeneste, der kan identificeres ved HCPCS (eller CPT-4)-kode eller UB-indtægtskode eller begge dele; charge master-kode; patientidentifikator; dato for tjenesteydelse; og sted for tjenesteydelse. Vi medtager en beskrivelse af ydelsen og diagnoser på ydelseslinjestyringsniveau (i forhold til krav- eller mødestyringsniveau). Data for hver hospitalsindlæggelse og faktureringsepisode er tilgængelige i en separat fil, så undersøgeren har let adgang til oplysninger som f.eks. patientens demografiske karakteristika, indlæggelseskilde og udskrivningsdisposition. For at bevare dataenes forretningsmæssige følsomhed er det kun de standardiserede omkostninger, der leveres.