Wiarygodność porozumienia z Doha w zakresie klasyfikacji urazów pachwiny

Wprowadzenie

W 2014 r. system klasyfikacji klinicznej został opracowany przez panel ekspertów na spotkaniu w ramach porozumienia z Doha. System klasyfikacji został opublikowany przez Weir i in. (2015) i trafił do klinicystów pracujących ze sportowcami i urazami pachwiny na całym świecie. Ponieważ system klasyfikacji urazów pachwiny jest często stosowany, należy upewnić się, że jego wiarygodność jest odpowiednia. To właśnie jest celem tego artykułu.

Metody

Panel porozumienia z Doha zdefiniował 4 jednostki kliniczne bólu pachwiny: związany z przywodzicielem, związany z biodrowo-lędźwiowym, związany z pachwinowym i związany z łonowym. Oprócz tego zdefiniowano również przyczyny bólu pachwiny związane z biodrem oraz inne przyczyny.

system klasyfikacji urazów pachwiny — Od: Heijboer et al., Scand J Med Sci Sports (2022)

Niniejsze badanie zostało przeprowadzone w celu zbadania wiarygodności międzyoperacyjnej systemu klasyfikacji. Chirurg i fizjoterapeuta niezależnie badali dorosłych sportowców płci męskiej z bólem pachwiny, który pojawiał się stopniowo i nasilał się podczas ćwiczeń lub pojawiał się nagle i utrzymywał się przez ponad 6 tygodni.

Za pomocą częściowo ustrukturyzowanego dialogu zapytano pacjenta o objawy i historię urazów. Były one oparte na klasyfikacji porozumienia z Doha, ale klinicyści mogli zadawać również inne pytania. Oprócz wywiadu, uczestnicy wypełnili arabską wersję Copenhagen Hip and Groin Outcome Score (HAGOS). Kwestionariusz ten jest przeznaczony do pomiaru objawów, bólu, funkcjonowania w codziennym życiu, funkcjonowania w sporcie i rekreacji, uczestnictwa w aktywności fizycznej oraz jakości życia związanej z biodrem i/lub pachwiną. Wyniki wahają się od 0-100, a 0 oznacza skrajne objawy biodra i/lub pachwiny.

Obok inwentaryzacji objawów przeprowadzono badanie kliniczne, na które składały się testy prowokacji bólu (badanie palpacyjne, testy oporowe, rozciąganie), testy zakresu ruchu stawu biodrowego i testy udarowe stawu biodrowego (zgięcie-przywodzenie-rotacja wewnętrzna (FADIR) i zgięcie-przywodzenie-rotacja zewnętrzna (FABER)). Korzystając z tych informacji oraz informacji uzyskanych w wywiadzie, ból pachwiny został sklasyfikowany zgodnie z umową z Doha. Możliwe było sklasyfikowanie wielu jednostek klinicznych, co pozostawało w gestii egzaminatora. Podmioty zostały uszeregowane w przypadku zidentyfikowania wielu przyczyn bólu pachwiny.

Wiarygodność między badaczami badano za pomocą statystyki Kappa Cohena. Interpretacja wartości Kappa była następująca:

prawie idealny (κ = 0,81-1,00),
istotna (κ = 0,61-0,80),
umiarkowany (κ = 0,41-0,60),
(κ = 0,21-0,40),
niewielki (κ = 0-0,20),
i słabe (κ < 0).

Wyniki

Do badania włączono czterdziestu ośmiu mężczyzn z bólem pachwiny. Osiemnaście z nich miało objawy obustronne, a zatem łącznie zbadano 66 stron. W przypadku 4 jednostek klinicznych bólu pachwiny, wiarygodność między badaczami okazała się sprawiedliwa w przypadku bólu związanego z przywodzicielem, umiarkowana w przypadku bólu związanego z mięśniem biodrowo-lędźwiowym i pachwinowym oraz niewielka w przypadku bólu pachwiny związanego z łonem (Kappa zgodnie z interpretacją skali dychotomicznej).

Gdy jednostki kliniczne, w przypadku zidentyfikowania wielu przyczyn bólu pachwiny, zostały uszeregowane w porządku malejącym pod względem postrzeganego znaczenia klinicznego, wartości Kappa wskazywały na znaczną wiarygodność w przypadku bólu związanego z przywodzicielem i biodrowo-lędźwiowym, umiarkowaną wiarygodność w przypadku bólu związanego z pachwiną i niewielką wiarygodność w przypadku bólu związanego z łonem. Widać to w interpretacji wartości Kappa na skali porządkowej.

U siedmiu z 48 uczestników zdiagnozowano tylko 1 jednostkę kliniczną. W tym przypadku zgodność między zaślepionymi egzaminatorami wyniosła 100%. Jednak większość uczestników została sklasyfikowana jako mająca więcej niż 1 jednostkę kliniczną powodującą ból w pachwinie, a zgodność między badaczami była tutaj znacznie niższa. Egzaminatorzy zgodzili się na tę samą kombinację klasyfikacji w 29% i 23% stron.

Pytania i przemyślenia

Wydaje się, że istnieje wiele różnic w diagnozowaniu urazów pachwiny między 2 badaczami. Czy mogły mieć na to wpływ różne profesje obu (chirurg kontra fizjoterapeuta)? Wydaje się, że stosowanie systemu klasyfikacji Doha dla urazów pachwiny nie prowadzi do jednolitości diagnozy między różnymi badaczami. Powody te można częściowo wyjaśnić faktem, że możliwe było zdiagnozowanie wielu jednostek klinicznych, które spowodowały urazy pachwiny oraz faktem, że badacze zostali poproszeni o uszeregowanie tych jednostek zgodnie z ich postrzeganiem ich znaczenia klinicznego od najważniejszego do najmniej ważnego. Rangi te zostały przeanalizowane jako zmienna porządkowa, co oznacza, że kolejność ma znaczenie. Kiedy klasyfikacja kliniczna została sklasyfikowana jako taka, egzaminatorzy zgodzili się w większym stopniu.

Tabela 1 pokazuje, że badanie przez drugiego egzaminatora nie zostało przeprowadzone tego samego dnia u jednej trzeciej uczestników. U 13% wykonano ją po 1-2 dniach, u 15% po 3-5 dniach, a u 6% po 6-7 dniach. Mogło to mieć plusy i minusy. Opóźnienie w drugim badaniu mogło wpłynąć na porozumienie między badaczami, ponieważ objawy mogły ulec zmianie. Z drugiej strony, unikanie powtórnego badania w tym samym dniu mogło prawdopodobnie ograniczyć prowokację i pogorszenie objawów podczas drugiego badania.

W artykule stwierdzono, co następuje: "Obaj ślepi egzaminatorzy zgodzili się co do tej samej klasyfikacji/kombinacji klasyfikacji u 14/48 (29%) uczestników i 15/66 (23%) stron". Tak więc w mniej niż jednej trzeciej przypadków badający byli zgodni co do przyczyny urazu pachwiny. Gdy zdefiniowano tylko 1 jednostkę kliniczną bólu pachwiny, zgodność wynosiła 100%, ale tylko 7 z 48 uczestników miało jednostronne objawy i tylko jedną jednostkę kliniczną. Wydaje się oczywiste, że w przypadku bardziej wyraźnych obrazów klinicznych zgodność jest znacznie wyższa niż w przypadku, gdy uważa się, że uraz pachwiny wynika z innych problemów. Zastanawiam się jednak, jak to możliwe, że bardzo szczegółowy system klasyfikacji tak bardzo się pokrywa. Wyjaśniono, że egzaminator mógł sklasyfikować uraz, nawet jeśli nie wszystkie kryteria były spełnione. Słyszałem, że rzeczywiście myślisz o przydatności klasyfikacji. Gdy przeanalizowano tylko urazy, które spełniały wszystkie kryteria systemu klasyfikacji, poprawiła się zgodność między ocenami.

Dlaczego więc nie trzymali się "zasad" systemu klasyfikacji? Klasyfikacja Doha pozostawia pole do interpretacji, co zostało opisane przez autorów: "Na przykład definicja bólu pachwiny związanego z biodrowo-lędźwiowym ("tkliwość biodrowo-lędźwiowa i bardziej prawdopodobna, jeśli występuje ból przy oporowym zgięciu biodra i / lub ból przy rozciąganiu zginacza biodra") pozwala na znaczną indywidualną interpretację badacza. Jeśli sportowiec ma łagodne objawy wtórne odtwarzane podczas badania palpacyjnego mięśnia biodrowo-lędźwiowego, ale nie podczas testów rozciągania lub oporu, jeden egzaminator może sklasyfikować to jako ból pachwiny związany z mięśniem biodrowo-lędźwiowym, podczas gdy drugi nie. Mogło to prowadzić do różnych interpretacji, a następnie do niższego poziomu porozumienia. Z drugiej strony zachęcam cię do zachowania krytycyzmu i unikania zaznaczania pól podczas badania klinicznego. Rozumowanie kliniczne pozostaje najważniejszą częścią twoich badań diagnostycznych.

Zastosowano arabskie tłumaczenie wyniku HAGOS, jednak wersja ta nadal wymaga walidacji. Nie stanowi to większego problemu, ponieważ wynik został wykorzystany jedynie do opisania podstawowej charakterystyki uczestników.

Porozmawiaj ze mną

Ważne w interpretacji tych wyników jest to, że obaj badacze byli częścią panelu ekspertów zaangażowanych w opracowanie systemu klasyfikacji Doha dla urazów pachwiny wykorzystanych w tym badaniu. Mieli oni swoje doświadczenie kliniczne w tej dziedzinie. Może to ograniczać możliwość uogólnienia tych wyników na mniej doświadczonych asesorów. Mogło to również spowodować stronniczość wyników, ponieważ wyniki mogą być nieco inaczej sformułowane. Widzimy to na przykład, gdy autorzy twierdzą, że wiarygodność waha się między niewielką a znaczną. Jest to jednak prawdą w przypadku danych porządkowych (gdy różne jednostki kliniczne zostały uszeregowane zgodnie z ich znaczeniem klinicznym). Jednakże, gdy spojrzymy na dane nominalne (gdy nie dokonano rankingu ważności różnych przyczyn bólu pachwiny u 1 pacjenta), widzimy, że wiarygodność między recenzentami waha się od niewielkiej do umiarkowanej. Tutaj możesz zobaczyć przykład tego, jak wyniki są czasami sformułowane nieco inaczej. Autorzy ci byli zaangażowani w rozwój tej klasyfikacji i oczywiście chcą osiągnąć dobry wynik. Lepiej byłoby, gdyby badanie to zostało przeprowadzone przez niezależnych recenzentów niezaangażowanych w panel ekspertów lub przez mniej doświadczonych badaczy. Ale oczywiście może się to zdarzyć w przyszłości.

Tabela 2 pokazuje, że częstość występowania przyczyn łonowych, biodrowych i innych była stosunkowo niska. Na wartość kappa ma jednak wpływ częstość występowania choroby. W związku z tym wyniki dotyczące bólu związanego z łonem, biodrem i innymi przyczynami bólu pachwiny mogą być niedokładne. Wskaźnik stronniczości, który został zmierzony, wskazuje stopień, w jakim oceniający nie zgadzają się co do proporcji pozytywnych lub negatywnych przypadków. Gdy stronniczość jest wysoka, oznacza to, że oceniający nie zgadzają się ze sobą w większym stopniu. Może to spowodować przeszacowanie wartości kappa.

Wiadomości do domu

W tym badaniu zbadano wiarygodność systemu klasyfikacji Doha dla urazów pachwiny. Wyniki wskazują, że zgodność między oboma badaczami była dobra, gdy zidentyfikowano tylko 1 przyczynę bólu pachwiny. W przypadku istnienia wielu jednostek klinicznych, wiarygodność była najlepsza, gdy została uszeregowana zgodnie z postrzeganym klinicznym znaczeniem urazu dla bólu pachwiny związanego z przywodzicielem, pachwiną i biodrowo-lędźwiowym, ale nie dla bólu łonowego, biodrowego i innych przyczyn bólu pachwiny. Można powiedzieć, że nawet eksperci nie zawsze byli zgodni, nawet jeśli ściśle stosowali kryteria kliniczne zaproponowane w porozumieniu z Doha. Sugeruję więc, abyś zapoznał się z kryteriami przed ich użyciem. Lepiej jest również jasno udokumentować swoje ustalenia, abyś mógł lepiej porównać swoje decyzje z innym kolegą i abyś mógł lepiej uzasadnić swoją diagnozę.