Tandheelkundige gezondheid > FAQ > Tandheelkunde > Waarom onderzoeksresultaten worden Meestal Wrong

Waarom onderzoeksresultaten worden Meestal Wrong

 

INLEIDINGDe lezen van artikelen in scien & gooi; schappelijke tijdschriften en het bijwonen van lezingen door gepubliceerd onderzoekers worden beschouwd als kenmerken van de goed geïnformeerde professional. Inderdaad, zou de onwetendheid van het advies afgeleid uit dergelijke publicaties of vanuit het verbale vermaningen van hun auteurs gronden voor het onderzoeken van vakbekwaamheid. Vraagtekens bij de waarde van deze bronnen van leren lijkt contra intuïtief te zijn. Echter, zoals dit artikel zal beschrijven zijn er gegronde redenen om dat te doen

recente publicaties & ldquo;. Statistieken kunnen bijna alles, & rdquo te bewijzen; werd een kop in de National Post
op 21 november 2011. Het verwees naar een nieuwe studie die in Psychological Science1 waarin aangetoond dat door middel van het manipuleren van gegevens is het gemakkelijk om statistisch significant bewijs om elke hypothese te publiceren. In oktober 2011 heeft de Publicatieblad van de Canadese Dental Association
publiceerde een artikel waarin het volgende bevatte, & ldquo; Het lijkt dus logisch om alle mogelijke inspanningen om de kansen van onjuiste of onbetrouwbare gegevens te verminderen wordt gepubliceerd in het wetenschappelijke literatuur & rdquo;. 2

Deze publicaties zijn te suggereren dat er een kern van onbetrouwbaarheid omliggende vrijwel alle wetenschappelijke bevindingen. Het zou nuttig zijn om te weten of zo'n dramatische openbaring heeft extra ondersteuning

PERTINENTE PUBLICATIONSIn november 2010 heeft de Atlantic
publiceerde een uitgebreid rapport, & ldquo;. Lies, Damned Lies, en de medische wetenschap & rdquo; op het werk van Dr. John Ioannidis, Clinical and Molecular Epidemioloog, Tufts University School of Medicine.3 In duidelijke taal het artikel legt uit waarom Dr Ioannidis & mdash; met een sterke reputatie in de medische gemeenschap heeft tot de conclusie gekomen dat 90% van de de gepubliceerde medische informatie die artsen vertrouwen op vals is, en dat het advies aan ons gegeven door deskundigen op het gebied van gezondheid, voeding en drugs is misleidend, onjuist of vaak ronduit verkeerd.

het artikel steunt deze beweringen met een samenvatting van twee belangrijke papers gepubliceerd door Dr Ioannidis. De eerste verscheen in PLoS Medicine in 2005,4 Daarin gebruikte hij wiskundig redeneren om correct te voorspellen dat 80% van de niet-gerandomiseerde studies (de meest voorkomende), 25% van de gerandomiseerde kleine & ndash; middelgrote proeven, en 10% van de gerandomiseerde grote trials zou hebben hun resultaten overtuigend weerlegd door latere studies.3 het tweede artikel verscheen ook in 2005 in de Journal of the American Medical Association.5 Ditmaal Ioannidis concentreerde zich op 49 van de belangrijkste bevindingen die in de geneeskunde had plaatsgevonden in de afgelopen 13 jaar, zoals bepaald door twee factoren. One, had de desbetreffende artikelen zijn gepubliceerd in de tijdschriften het vaakst door de onderzoeksgemeenschap en twee, de 49 kranten geciteerd zelf waren de meest geciteerde artikelen in deze tijdschriften. De onderwerpen die in de kranten opgenomen; het wijdverbreide gebruik van HST tijdens de menopauze, vitamine E verminderen hartziekte, coronaire stents het risico op hartaanvallen en dagelijkse doses aspirine verlaagt het risico op hartziekten en beroertes. Vijfenveertig (45) van de 49 artikelen werkwijzen verschaft om de effectiviteit van de respectievelijke conclusies verifiëren. Bij 34 dergelijke claims werden opnieuw getest, werden 14 of 41% van hen zeer overtuigend aangetoond dat het verkeerd of grove exaggerated.5
zijn

Als tussen een derde en de helft van de meest prestigieuze, zeer geaccepteerd medisch onderzoek is onbetrouwbaar, is het redelijk om de betrouwbaarheid van de bevindingen in kranten die niet vaak worden aangehaald of lijken in kleinere publicaties vraag.

de relevantie hiervan voor de tandheelkunde wordt mogelijk gemaakt door te verwijzen naar de recente artikel van Faggion.2 Daarin erkent hij Journal Citation Reports (JCR). Deze zijn systematische, objectieve, meetbare manier om te beoordelen het onderzoek invloed en impact van wetenschappelijke tijdschriften. De hoogste medische tijdschriften met hun Impact Factors (IF) zijn; New England Journal of Medicine & ndash; IF = 47, Lancet & ndash; IF = 30,7 en de Journal of the American Medical Association & ndash; IF = 28,8. Ioannidis geselecteerd zijn 49 papers uit deze drie toptijdschriften en anderen die hadden Impact Factors van meer dan zeven volgens de JCR. Zoals opgemerkt door Faggion2 de hoogste tandheelkundige tijdschriften; Journal of Clinical Parodontologie & ndash; IF = 3.5, Journal of Dental Research & ndash; IF = 3,4 en Oral Oncology & ndash; IF = 3,1. Even terzijde, de Publicatieblad van de Canadese Dental Association
heeft een Impact Factor van 0,95 in tegenstelling tot de Canadian Medical Association Journal met een Impact Factor van 7,2.

Het onderzoek effecten en invloeden van de drie meest prestigieuze medische tijdschriften zijn ongeveer 10 keer groter dan die van de drie meest genoemde tandheelkundige publicaties. Ioannidis aangezien is gebleken dat 30-50% van gerenommeerde medisch onderzoek defect, is een veilige aanname dat ten minste 50% van dental onderzoeksresultaten zijn zeer twijfelachtig. In feite is de situatie waarschijnlijk veel erger. Zoals gezegd Ioannidis, ondersteund door een grote strook van de medische gemeenschap van mening dat zoveel als 90% van de gepubliceerde professionele informatie dat artsen afhankelijk is gebrekkig. (3) Het is zeer waarschijnlijk dat ten minste een vergelijkbare, zo niet meer, fout geldt voor de onderzoeksresultaten die tandarts te gebruiken om hun praktijken te begeleiden.

statistisch significant RESULTSFaggion suggereert dat ondanks de peer review proces van fraude en wangedrag zijn ongelukkige realiteit van medische research.2 Het zou na & iuml; ve om te geloven dat tandheelkundig onderzoek immuun is voor soortgelijke misbruiken. Hoewel fraude en wangedrag valse bevindingen zal produceren, zijn er andere, minder schadelijke aspecten van het onderzoek methodologie die worden verondersteld verantwoordelijk is voor de onjuiste en onbetrouwbare resultaten zijn

Simmons et AL1 en Ioannidis4 bespreken de term & ldquo;. Statistisch significant & rdquo; en de relevantie ervan voor onjuiste bevindingen. Om te begrijpen waarom, een kort begrip nodig is van de nul-hypothese, p-waarden, false positives en publicatie vooringenomenheid.

De nulhypothese is de stelling dat geen effect of geen relatie tussen fenomenen of gegevens wordt onderzocht impliceert. Het wordt gewoonlijk uitgedrukt als negatief. Een voorbeeld zou zijn, & ldquo; Hyperactiviteit staat los van het eten van suiker & rdquo.; Als door de statistische hypothese wordt getest en waarschijnlijk vals te zijn, dan de nulhypothese geweigerd of vernietigd zodat er een verband tussen hyperactiviteit en suiker inname kan zijn. Wordt de statistische significantie van de test die wordt gebruikt om ofwel de nulhypothese of niet te verwerpen. Dienovereenkomstig is een nul-hypothese is een statistische constructie die nooit kan worden bewezen, omdat er in werkelijkheid misschien wel of misschien niet een relatie tussen hyperactiviteit en suiker inname zijn

P-waarden en statistische Sig & gooi;. Kenis. P-waarden zijn statistische termen die verwijzen naar de waarschijnlijkheid dat een testresultaat kan worden veroorzaakt door willekeurige normale variaties in andere woorden- kans. Een p-waarde van 0 (het laagst mogelijke) betekent dat er een mogelijkheid dat 0% testresultaten door toeval en dat de resultaten significant. Een p-waarde van een (zo hoog mogelijk) betekent dat de testresultaten 100% overeen met die als gevolg van willekeurige variaties en dat de resultaten niet significant.

Volgens afspraak een waarde van 0,05 wordt gewoonlijk gekozen als de kritieke p-waarde of significant niveau waarop het mogelijk is om de nulhypothese. Dit komt omdat 0,05 vertaalt zich in een kans van 95% dat de resultaten niet te wijten zijn aan het toeval over en slechts 5% kans dat ze zijn te wijten aan het toeval over. Wanneer de nulhypothese verworpen het resultaat genoemde statistisch significant impliceert dat het resultaat waarschijnlijk waar. Andere p-waarden kunnen worden gebruikt. Het is echter belangrijk te realiseren dat hoe hoger de p-waarde hoe groter de kans dat de resultaten op toeval. Bijvoorbeeld een p-waarde van 0,1 geeft een kans 90% dat de resultaten waar en een 10% kans dat ze vals, terwijl een p-waarde van 0,01 geeft aan dat er een kans 99% dat de resultaten juist zijn en slechts een kans van 1% dat ze verkeerd zijn.

False positives wat zijn de onjuiste verwerping van de nulhypothese. Wanneer het testen van een behandeling bekende klinisch ineffectief vaststelt dat met een p-waarde van 0,05 de therapie waarschijnlijk doeltreffend de nulhypothese & ldquo, dat het klinisch onwerkzaam & rdquo; zal met de oprichting van een vals positief worden afgewezen. Als gevolg van de valse positieve, zal de behandeling worden aanvaard omdat is aangetoond dat een 95% waarschijnlijkheid dat waardevol is. De alomtegenwoordige aanwezigheid van valse positieven wordt beschouwd als een van de meest ernstige fouten in de medische (tandheelkundige) research.1,3,4

Publication Bias
is de bekende neiging om het onderzoek te melden met statistisch significant positieve resultaten (p-waarde & lt; 0,05) vaker (maximaal tien keer) dan de resultaten die negatief zijn (dwz ondersteunen de nulhypothese) of zijn inconclusive.6 Omdat de huidige onderzoekspraktijk gunsten met behulp van statistische significantie te ldquo van &; bewijzen & rdquo; theorieën en omdat publicatie vooringenomenheid bestaat, Berlijn en anderen geloven dat om positieve resultaten te produceren is er een wijdverspreide manipulatie van data leidt tot een overwicht van vals-positieve resultaten in de literature.7-9

Waarom vals-positieve resultaten zijn DANGEROUSA extremer voorbeeld zal de omvang van het probleem te benadrukken. Stel dat een team is belast met het onderzoek naar het vermogen van 100 mondwater te controleren of gingivitis te voorkomen, zonder te weten dat ze allemaal zijn klinisch ineffectief. Het is zeer waarschijnlijk dat één op de 20 tests een p-waarde van 0,05 of kleiner zal produceren door puur toeval. Dit betekent dat ongeveer vijf tests (100/20) zal & ldquo; statistisch significant & rdquo; Resultaten suggereren dat ze effectief zijn. Dit is een vals positief tarief van 5%. Hoewel alle van de mondwater zijn nutteloos voor de toepassing wordt getest, zal de hypothetische onderzoekers de 95 negatieve test te negeren en zich te concentreren op het hebben van de vijf gepubliceerde positieve resultaten als gevolg van hun besef dat tijdschrift redacteuren overweldigend positief (zij false) resultaten te bevorderen. Op zijn beurt, de vijf producten met de & ldquo; statistisch significant & rdquo; resultaten zullen commerciële aantekeningen vergezeld door dure promoties tot het beroep en publiek ontvangen

Deze overdreven scenario laat zien hoe het mogelijk is dat volledig vals, maar & ldquo;. statistisch significant & rdquo; bevindingen aan de literatuur te gaan met een niveau van geloofwaardigheid die is uiterst moeilijk in diskrediet te brengen of dispute.1

Begg is het eens met anderen dat de steun, publicatie en acceptatie van valse positieven is & ldquo; diep verankerd in de huidige onderzoekspraktijk & rdquo; met een potentieel om de omvang van verkeerde bevindingen produceren als geïdentificeerd door Ioannidis.4-7 De realiteit van dit inzicht wordt onthuld door het waarderen dat er onder de meest geciteerde onderzoeksresultaten in de meest prestigieuze tijdschriften onderzocht door Ioannidis, 32% met & ldquo; significant & rdquo; resultaten bleken onjuist of overdreven resultaten, en dat een ongelooflijke 74% van degenen die met behulp van conventioneel aanvaard p-waarden van 0,05 vervolgens bleken onjuist te zijn, hoewel hun testresultaten als & ldquo werden aanvaard;. statistisch significant & rdquo; 5 Gezien het feit dat de meeste van deze studies waren gerandomiseerde gecontroleerde studies-de & ldquo; gouden standaard & rdquo; voor onderbouwde evidence er is een mogelijkheid dat een kritische analyse van statistisch significante tandheelkundige onderzoeksresultaten een vergelijkbaar patroon van fouten zou openbaren.

Een zekere laksheid ten aanzien van de publicatie van vals-positieve resultaten blijkt een kritische reden waarom zijn onderzoeksresultaten zijn gebrekkig. Proberen te begrijpen waarom dit is gebeurd is een belangrijk aandachtspunt van het werk van Simmons, Ioannidis en Faggion.1-5

Waarom onderzoek is FLAWEDIn hun papieren Simmons et al identificeren van de aanwezigheid van & ldquo geweest; onderzoeker vrijheidsgraden & rdquo ; als een belangrijke reden waarom het onderzoek wordt flawed.1 Dit concept richt zich op twee aspecten van een onderzoeker & rsquo; s gedrag. De eerste heeft betrekking op het verzamelen en observaties van gegevens. Bijvoorbeeld, onderzoekers zelden beslissen op voorhand welke specifieke gegevens te verzamelen of te weigeren, wegens te nemen of uit te sluiten en die verstorende variabelen te controleren of te negeren. In de tweede plaats, wanneer zij worden geconfronteerd met specifieke besluiten over deze vraagstukken in de loop van een onderzoek, de onderzoekers hebben een ingebouwde wens om een ​​statistisch significante result.1 stellen Dus, wanneer zij worden geconfronteerd met analytische beslissingen met betrekking tot gegevens, observaties en zal variabelen onderzoekers, met overtuigende zelfrechtvaardiging, kiezen die resultaten met een statistische significantie van p & lt zal creëren; 0,05. Deze manipulatie van het bewijsmateriaal en de interpretatie wordt niet gedreven door kwaadaardigheid, maar door een aangeboren overtuiging dat wat beslissingen te produceren de meest gunstige (publiceerbare) de resultaten zijn geheel passend.

Dus, terwijl een aantal van de beslissingen die de onderzoekers te maken zou kunnen zijn onschuldig en volstrekt redelijk om hen, de & ldquo; vrijheidsgraden & rdquo; dat zij mogen hen in staat stelt te extraheren & ldquo; statistisch significant & rdquo; resultaten van bijna alle testen. Inderdaad, Simmons was in staat om aan te tonen dat de relatief kleine manipulaties zou false positives bij p & lt te produceren; 0,05 niveaus-60% van de tijd en p & lt; 0.01 niveaus & mdash; 21% van de tijd.1

De & ldquo; vrijheidsgraden & rdquo; zijn vergelijkbaar met de aanwezigheid van & ldquo; vooringenomenheid & rdquo; in het onderzoek zoals opgemerkt door Ioannidis in 2005. Volgens Ioannidis & ldquo; vooringenomenheid & rdquo; is de selectieve manipulatie en vervorming van een studie & rsquo; s design, data, analyse en presentatie aan de resultaten die overeenkomen produceren met wat de onderzoekers verwacht of gehoopt te vinden en wat editors zal publiceren. Als gevolg hiervan, terwijl de resultaten kunnen worden aantrekkelijk, omdat het lijkt alsof ze een favoriet hypothese ondersteunen ze zijn niet per se true.4 De kans dat de resultaten waar zijn afneemt als het niveau van de & ldquo; vooringenomenheid & rdquo; increases.4

Daarom lijkt het erop dat de & ldquo; vrijheidsgraden & rdquo; en & ldquo; vooringenomenheid & rdquo; dat onderzoekers worden geboden in het ontwerpen van hun studie en bij het interpreteren van de resultaten zijn belangrijke factoren in het produceren van gebrekkig onderzoek

Naast & ldquo;. vooringenomenheid & rdquo; Ioannidis geïdentificeerd zes andere factoren die de kans op een onderzoeksresultaat dat onwaar te verhogen.

steekproef. Hoe kleiner de steekproef hoe kleiner de kans is dat de onderzoeksresultaten zijn waar. Een kleine omvang doet geen belangrijke verschillen tussen de leden van het monster leidt tot verkeerde conclusies detecteren. Ioannidis heeft opgemerkt dat onderzoeksresultaten vaker het geval in wetenschapsgebieden die grote studies (enkele duizenden proefpersonen) in vergelijking met degenen met 100 of minder in de steekproef te ondernemen size.4 Het wordt aanbevolen dat een bevoegde statisticus wordt geraadpleegd over de juiste grootte steekproef pertinent de aard van de studie design.10 Helaas is de steekproefgrootte vaak gedicteerd door de beschikbare middelen en tijd aan de studie, de overlast in het verzamelen van een grote steekproef te doen, de ervaringen van de onderzoekers en het aantal monsters die in eerdere soortgelijke studies .10 het is algemeen aanvaard dat het niet om een ​​correcte steekproefgrootte berekening te maken nadelige invloed op de waarde van de study.4,10

Naast de grote epidemiologische studies waarbij & mdash; bijvoorbeeld & mdash; de weerslag van tandbederf in specifieke populaties is het onwaarschijnlijk dat een aanzienlijke hoeveelheid van tandheelkundige onderzoek heeft steekproefomvang die in de duizenden.

Effect Size. Dit is een maat voor de omvang van het resultaat. Bijvoorbeeld, studies met een verbinding die cariës vermindert met 60-80% meer kans om waar te zijn dan die waarbij slechts een daling van 5-10% zijn. Volgens Ioannidis enige wetenschappelijke veld (inclusief een tandheelkundige onderzoek), die produceert kleine effect maten zijn, & ldquo; geplaagd door bijna alomtegenwoordige valse positieve beweringen & rdquo;. 4

Vorige Studies. Goed ontworpen gerandomiseerde gecontroleerde studies (RCTs) en meta-analyses over het algemeen produceren meer nauwkeurige resultaten dan een enkele of eenvoudige onderzoek dat pogingen om een ​​null hypothesis.4 uitdagen Hoewel dit waar is, RCT's en meta-analyse kunnen zijn, zijn niet zonder hun gebreken . Bijvoorbeeld, een meta-analyse met behulp van gecombineerde gegevens van een aantal studies is zo goed als elk van de studies leveren de samengevoegde gegevens en onderworpen aan dezelfde vrijheidsgraden en afwijking zoals beschreven above.11 Hoewel beschouwd de & ldquo; gouden standaard & rdquo; RCT's zijn feilbaar. RCT duizenden monsters /onderwerpen zijn complex, duur en tijdrovend. De grote getallen in deze mega-trials ze niet isoleren van dezelfde menselijke emoties die de analyse van gegevens, observaties en variabelen, en daaropvolgende statistische berekeningen geassocieerd met eenvoudigere minder complexe onderzoeken regelen. Er zijn lopende debatten over de verdiensten van RCT via observationele studies.12,13 Daarom zou het onverstandig zijn om RCT's beschouwen als het laatste woord in het ontwerp van klinische proeven.

flexibiliteit in het ontwerp. Hoe groter de flexibiliteit in het ontwerp, definitie aanvaardbare resultaten en analytische methoden van de studie minder waarschijnlijk zijn de resultaten waar te zijn. 4 Het hebben van gemeenschappelijke normen van toepassing op studies voordelig als zou ondubbelzinnige uitkomsten zou zijn. Bijvoorbeeld, Als het resultaat in een studie dood, de resultaten aansprakelijk nauwkeuriger dan die waarbij tarieven pijnperceptie na een operatie zijn.

Geld en vooroordelen. Hoe groter de financiële belangen of belangenconflicten in verband met het onderzoek naar hoe groter de kans is dat de resultaten zullen worden false.4 Het is redelijk om te veronderstellen dat als de financiële voordelen worden afgeleid uit een resultaat, onderzoeker vrijheidsgraden zijn in staat om de manipulatie nodig is om een ​​gunstig resultaat te produceren. Ioannidis merkt op dat als een huisdier geloven of hypothese van een onderzoeker wordt omgezet in een studie gewoon om een ​​criterium te voldoen voor ambtstermijn, de onvermijdelijke eigenbelang vooroordelen zal vrijwel zeker een valse result.4 Belangenconflicten ontstaan ​​wanneer, via de peer review Daarbij wordt een studie geplet ten gunste van één die voldoet aan de overtuigingen van de reviewers, zelfs als dat het geloof is gebaseerd op foutieve onderzoek. Een dergelijke actie bestendigt de aanvaarding van onware findings.4

Ontdek de verspreiding van het onderwerp. Ioan & gooi; nidis heeft aangetoond dat als dezelfde vraag door een aantal onderzoeksteams wordt voortgezet, de geldigheid van de resultaten neemt af naarmate het aantal onderzoeken increases.4 De vermoedelijke reden hiervoor is dat sinds prestige zal worden gehecht aan het eerste team het produceren van een & ldquo; positieve & rdquo; resultaat, compromissen en vooroordelen zullen worden gebruikt om een ​​gunstige verhaasten zij het waarschijnlijk vals resultaat.

Hoewel de mate waarin deze factoren actief zijn in de tandheelkunde is niet bekend, hun bestaan ​​is reden genoeg om de geldigheid van de meeste vraag, als niet alle tandheelkundig onderzoek. Vermoedelijk was het deze bezorgdheid dat veroorzaakt Faggion zijn study.2
voeren

Hoe de onvolkomenheden in onderzoeksmethodologie van toepassing zijn op de tandheelkunde wordt geïllustreerd door het volgende.

In de januari 2012 editie van het < em> Publicatieblad van de Canadese Dental Association
is er een kort artikel met de titel, & ldquo; Voordelen van Flossen ter vermindering van gingivitis & rdquo;. 14 het verwijst naar een recente Cochrane systematische review van gerandomiseerde gecontroleerde studies suggereren dat, & ldquo; Flossen overblijfselen een effectieve aanvulling op tandenpoetsen & rdquo; omdat volgens de evaluatie, & ldquo; mensen die poetsen en flossen regelmatig hebben minder tandvlees bloeden vergeleken met tandenpoetsen alleen & rdquo;.? 15 Is de aard van de te rechtvaardigen deze conclusies

De systematische review was een meta- analyse van 12 eerder uitgevoerde RCT's. Hoewel het gecombineerde totaal van de deelnemers aan de 12 studies was 1083, de individuele onderzoeken hadden steekproefomvang van 24 tot 218 en geen van de proeven aangeboden hoe steekproefomvang werden berekend. Vijf van de proeven hadden een hoog risico op vertekening en de rest met een onduidelijke risico. Hoewel Flossen bleek een statistisch significant effect op het verminderen van gingivitis hebben, is het effect grootte was een 8% reduction.15 De steekproefomvang, de aanwezigheid van partijdigheid en de kleine effect size suggereren dat de bevindingen in elk van de 12 proeven zijn waarschijnlijk vals. Uitvoeren van een analyse van de samengevoegde resultaten niet passen voor de gebreken in het oorspronkelijke onderzoek. Zo, de bevindingen van de systematische beoordeling zijn meer dan waarschijnlijk vals. Inderdaad, moet de auteurs van de evaluatie worden toegejuicht voor het herkennen dat de & ldquo; Trials waren van slechte kwaliteit en conclusies moet worden beschouwd als onbetrouwbaar & rdquo;. 15 Interessant is dat in 2008, Berchier en collega's publiceerden een meta-analyse van 11 studies over de werkzaamheid van tandheelkundige flossing.16 Zij concludeerden dat flossing geen effect op het verminderen van gingivitis gehad. Dit lijkt de bewering van Ioannidis ondersteunen dat de gebreken in onderzoeksmethodologie zijn de redenen waarom schijnbaar goedbedoelde onderzoekers bestuderen van hetzelfde onderwerp vaak komen dramatisch anders results.4,5 Misschien is de korte duur van het artikel in de januari-editie van het Journal CDA voorkomen dat de opname van de studie van Berchier. Toch is de omissie bestendigt de nog onbewezen zijn van mening dat flossen is effectief en toont de rol die publicaties hebben in het verspreiden van (vermoedelijk onbedoeld) beweert dat, naar alle waarschijnlijkheid, zijn vals.

De bovenstaande ondersteunt de mening dat tandheelkundige onderzoek is onderworpen aan dezelfde fouten in het ontwerp en de interpretatie Simmons en Ioannidis Daarom hebben geïdentificeerd voor medische studies.1,4,5, zou er aanleiding is om te suggereren dat tandartsen hoogst verdacht van alle onderzoeksresultaten moeten zijn. Even terzijde, tandzijde werd in 1819,15 geïntroduceerd Het feit dat na 193 jaar de werkzaamheid onopgelost blijft is een weinig inspirerende reflectie over de stand van tandheelkundige onderzoek.

verbeteren van de situatie Methoden van het verhogen van de kans dat de onderzoeksresultaten waar zijn zijn verstrekt door Faggion, Simmons en Ioannidis.1-4 de suggesties richten zich op het verbeteren van het vermogen van de studies worden gerepliceerd. Het idee achter dit concept is, indien latere onderzoekers exact dezelfde methode als de oorspronkelijke onderzoekers tot dezelfde resultaten, is er een grotere kans bestaat dat de resultaten waar zijn. Faggion verwijst naar de methodologie van een onderzoek als de & ldquo; ruwe data & rdquo;. 2 De ruwe data zou onderzoekers om te eisen; bepalen hoe en waarom het verzamelen van gegevens zou worden beëindigd voordat het verzamelen van gegevens begint, een lijst van alle variabelen die invloed hebben op de studie, rapporteren alle experimentele manipulaties zelfs degenen die niet het gewenste resultaat te produceren en omvatten de statistische resultaten van de waarnemingen die vervolgens waren eliminated.1,2 , 4 Er wordt aangenomen dat deze eisen de selectieve manipulatie van het onderzoek om te komen tot een vooropgezet of gunstig resultaat zou afnemen. Peer reviewers kon bij deze taak te helpen door ervoor te zorgen dat deze vereisten zijn opgenomen als onderdeel van het onderzoeksprotocol in de finale manuscript.1,2 Het fundamentele concept achter de verplichtingen, onderzoeker veroorzaakte vrijheidsgraden of vooroordelen te verminderen. Indien deze eisen vóór de meta-analyse van flossen werd uitgevoerd was, zou de hoeveelheid bias in de 12 RCT zijn teruggebracht verhogen de kans dat de resultaten van de analyse juist waren.

Geen van de 64 tandheelkundige tijdschriften beoordeeld door Faggion vereist de publicatie van de ruwe data met het manuscript submission.2 maar om eerlijk te zijn, een van de 10 gegarneerd gerangschikt medische tijdschriften slechts drie wijzen erop dat de ruwe gegevens moeten worden published.2 tot publicaties eisen de opname van de ruwe data deze omissie is reden genoeg om zelfs de meest prestigieuze onderzoeksvraag.

CONCLUSIONThere lijken voldoende rechtvaardiging om te twijfelen of, op zijn minst, vraagtekens bij de juistheid van de meeste medische onderzoeksresultaten zijn. Het is zeer waarschijnlijk dat tandheelkundig onderzoek wordt geplaagd door dezelfde fouten die medisch onderzoek infecteren. Dienovereenkomstig zou het belangrijk zijn om een ​​kritische blik te werpen op alle tandheelkundige studies, met name die van tevoren of ondersteuning van de vooropgezette ideeën of vooroordelen van de auteurs ervan, omdat ze meer dan waarschijnlijk wrong.OH

Dr . Hardie was nauw betrokken bij de ontwikkeling van de RCDSO 1996 evidence-based richtlijnen.

Oral Health is ingenomen met deze originele artikel.

Referenties

1. Simmons, JP et al. Vals-positieve psychologie: Undisclosed Flexibiliteit in de gegevensverzameling en analyse Hiermee presenteren Anything als Significant. Psychological Science 2011; 22 (11):. 1359-1366

2. Faggion CM. Verbetering van de transparantie in Dental Research door Het maken van de ruwe gegevens beschikbaar. J Kunnen Dent Assoc 2011; 77:. B122

3. Freedman DH. Lies, Damned Lies, en de medische wetenschap. The Atlantic 2010; November:. 76-86

4. Ioannidis JPA. Waarom de meeste gepubliceerde onderzoeksresultaten zijn vals. PloS Med 2005; 2 (8):. E124

5. Ioannidis JPA. Tegengesproken en Aanvankelijk Sterkere effecten in Highly Aangehaald Clinical Research. JAMA 2005; 294 (2); 218-228.

6. Sackett DL. Bias in analytisch onderzoek. J Chronische Dis; 32 (1-2):. 51-63

7. Begg CB, Berlijn JA. Publicatie Bias en verspreiding van Clinical Research. J Natl Cancer Inst 1989; 81 (2):. 107-115

8. Hopewell S et al. Publicatie bias in klinische studies te wijten aan statistische significantie of richting van trial resultaten. Cochrane Database of Systematic Reviews 2009; Kwestie. Kunst. Nr .: MR000006; DOI: 10.1002 /14651858.MR00 0006.pub3

9.. Dickersin K et al. Publicatie vooringenomenheid en klinische proeven. Controlled Clinical Trials 1987; 8 (4):. 343-353

10. Malhotra RK, Indrayan A. Een eenvoudige nomogram voor de steekproefgrootte voor het schatten van de gevoeligheid en specificiteit van medische tests. Indian J Opthamol 2010; 58 (6):. 519-522

11. Linde K, Willich SN. Hoe objectief Systematic Reviews? Verschillen tussen Recensies over gratis Medicine. J Roy Soc Med 2003; 96 (1): 17-22.

12. Black N. Waarom moeten we observationele studies naar effect van de gezondheidszorg te evalueren. BMJ 1996; 312: 1215-1218

13.. Sanson-Fisher RW et al. Beperkingen van de gerandomiseerde gecontroleerde trial bij de evaluatie van de bevolking op basis gezondheidsinterventies. Een J Vorige Med 2007; 33 (2):. 155-161

14. Voordelen van Flossen ter vermindering van gingivitis. J Kunnen Dent Assoc 2012; 78 (1): 18.

15. Sambunjak D et al. Flossen voor het beheer van parodontitis en cariës bij volwassenen. Cochrane-database of Systematic Reviews 2011, nummer 12. Kunst Nr .: CD008829. DOI: 10.1002 /14651858.CD008829.pub2

16.. Berchier C et al. De werkzaamheid van tandzijde naast een tandenborstel op plaque en parameters van tandvleesontsteking: een systematische review. International J Dent Hyg 2008; 6: 265-279
.