Оценяване на лечение Understand article
Превод Емилия Мурзова. Sarah Garner и Rachel Thomas разглеждат въпроса за това колко важни са добре планираните и точно извършените експерименти, когато се изпитва…
Да предположим, че е създадено ново лекарство, което намалява високото кръвно налягане. Лекарството е било тествано при лабораторни условия и върху няколко доброволци и изследователите смятат, че то би могло да се използва от населението. Сега ще проверим дали са прави.
В исторически план лекарите разбирали дали едно лекарство действа като го изпитват върху своите пациенти. След това сравнявали реакцията на пациентите към новото лекарство с тази към използваните за същата болест лекарства и съпоставяли варирането на реакциите между пациентите. Ако обаче пациентите се възстановели, не е било възможно да се установи дали това се дължало на лечението или на нещо друго.
Съществуват много фактори, които могат да накарат пациентите да се възстановят. Например те могат да се почувства по-добре, защото са лекувани от лекар (реакция, известна като плацебо ефект); възстановяването им може да не е свързано с лечението или да се дължи на промени в личния им живот. Без да се вземат под внимание тези или други фактори, би могло да се заключи, че лечението е проработило. Лекарите могат да отдадат факта на ежедневните си грижи, вярвайки, че те са ефективни.
Провеждане на рандомизиран контролен опит
През XIX век учените предложили метод, чрез който да се установи какво точно се случва и да се проследят промените в състоянието на пациента. В тези контролирани експерименти пациентите били разделени в две групи – изследваната група, не чиито членове се давало новото лекарство и контролната група, чиито членове получавали плацебо (инертно лекарство) или вече съществуващо лекарство. След това пациентите били подложени на наблюдение и резултатите (например дали всеки пациент оживява или умира), показани от двете групи били записвани.
Малко по-късно, през 1917 година, провеждането на експеримента „насляпо” допълнително го усъвършенствало. Ако нито пациента, нито изследователя знаят кое лекарство взема пациента, тогава резултатите не могат да бъдат нито умишлено, нито случайно манипулирани. Тази практика е известна като двойно сляпо паралелно изследване (при единично сляпото паралелно изследване или пациента, или изследователя знае кое лекарство се приема).
Въпреки това резултатите все пак могат да бъдат съзнателно манипулирани чрез включването на повече пациенти в по-напреднал стадий в изследваната група отколкото в контролната. Решението на това, за пръв път използвано от Британския съвет за медицински изследвания през 40те години на миналия век при изследване на ваксини срещу магарешка кашлица, е рандомизиране на избора на пациенти, които да получат новото лекарство и тези, които ще получат контролното.
Контролните опити със случаен подбор на двете групи са известни като рандомизирани контролни опити (RCT). Чрез рандомизирането се постига не само случайно разпределение в групите на пациентите в различни фази на болестта, но и случайно разпределение на неизвестните фактори (които също могат да повлияят върху здравето на пациента и оттам върху крайния резултат). Затова тъй като теоретично единствената разлика между двете групи се състои в приема на изследваното лекарство, би могло да се предположи, че разликите в крайния резултат се дължат на проведеното лечение и на нищо друго.
Рандомизираните контролни опити днес се използват повсеместно при клиничното изпитване на нови медикаменти.
Данните променят медицинската практика
BПреди 1994 година лекарите препоръчваха на пациентите с болки в кръста да си почиват в леглото. След преглеждане на събраните данни обаче, Съвета по клинични стандарти установява, че почивката в леглото е не само неползотворна, но и вредна. Това доведе до радикална промяна в лечението, като на пациентите се препоръчва да останат активниw1.
Проектиране и анализ на рандомизирано контролни опити
Повече хора, повече сила
Ако искате да изпитате лечението си за високо кръвно налягане посредством RCT, трябва внимателно да го проектирате. Важен въпрос е: колко пациенти трябва да бъдат включени в опита? Това зависи от ефекта, който новото лекарство предизвиква: колкото е по-голям ефекта, толкова по-малобройна е групата на пациентите, необходими за установяването му сред колебанията със случаен произход.
Разбира се, ефектът от лечението представлява онова, което искате да установите чрез RCT. Преди началото му със сигурност вече разполагате с данни как действа лечението от лабораторни тестове или изпитвания в малки групи. Наличието им ви позволява да определите ефекта.
При здравия пациент кръвното налягане е между 90 и 120 mmHg. А при пациенти с високо кръвно налягане показателите са над 140 mmHg, което ги поставя под риск от инфаркт или инсулт. Възможно е да бъде установено, че новото лечение би намалило горната граница на кръвното на пациента с 5 mmHg: след лечението бихте очаквали понижение на средното кръвно налягане на изследваната група с поне 5 mmHg в сравнение с това на контролната.
Съществуват статистически формули за определяне големината на извадката, необходима ви за откриване на установения ефектw2. За лечението ви за високо кръвно налягане тези формули показват, че имате нужда от около 64 пациента във всяка група за да установите разлика в следствие на лечението от 5 mmHgw3.
Каква е необходимата разлика?
Опитът вече е започнал, участниците са прегледани, установили сте разлика в кръвното налягане между пациентите от изследваната група и тези от контролната. Благодарение на рандомизирането знаете, че двете групи са сравними преди опита. Така че или лекарството ви е подействало, или е настъпило неочаквано събитие: лечението няма ефект, а установената при RCT разлика се дължи на случайността.
Представете си, че средното кръвно налягане на изследваната група е с 5.2 mmHg по-ниско от това на контролната. Как ще установите дали разликата се дължи на случайността или е реален ефект от лечението? Все пак кръвното налягане се променя по много причини и не всички от тях е възможно да се контролират чрез RCT.
Статистиците допускат известна степен на вариране; вместо да разчитат на средната за всяка група, те изчисляват диапазонът от стойности за всяка група, за които са сигурни, че съдържат истинската стойност. Този диапазон се нарича доверителен интервал. Ако доверителния интервал при изследването на кръвното налягане е 141.2-148.9 mmHg за контролната група и 133.7-139.3 mmHg за изследваната група, се вижда, че двата доверителни интервала не се припокриват. В този случай статистиците казват, че разликата между двете групи е статистически значима – а вие можете да приемете, че тя наистина се дължи на лечението.
Но до колко сигурен е доверителният интервал? Статистиците обикновено казват, че 95% сигурност е достатъчна, което значи, че те са готови да живеят с факта, че в 5% от случаите (или в 1 от всеки 20) те ще сгрешат заради случайност. За да бъдете по-сигурни, че ще получите правилните стойности, ще трябва да изследвате повече пациенти, но дори и тогава единственият начин да бъдете 100% сигурни е да изследвате цялата съвкупност!
Ако резултатът не се получи статистически значим, един от ключовите въпроси, на които трябва да си отговорите е дали броят на изследваните пациенти е достатъчен. Възможно е ефектът от лечението да е по-малък от очаквания – с помощта на извадка с по-голям обем бихте могли да установите разликата между групите.
Провеждане на реални RCT
Добре проектираният и правилно анализиран RCT е мощно оръжие за медицинските изследователи – осигуряващо на лекарите необходимата информация за да направят правилните решения при лечението на пациентите си. Независимо от това RCT има своите ограничения.
На първо място не е достатъчно само да знаем, че новото лечение дава статистически значима разлика. Дали тя е и клинично значима – например дали намаляването на кръвното налягане с 5 mmHg влияе върху здравето на пациента и неговото физическо състояние? Все пак в нашия пример лечението не намаля кръвното налягане до нормалните нива от 90-120 mmHg. За да преценят дали това е клинично приложимо, лекарите може да прибягнат до други изследвания.
Допълнително ограничение на RCT е факта, че пациентите, включени в изпитването може да не са представителни за съвкупността от световното население, подлежащо на лечение. Тъй като при опитите се цели контролиране на възможно най-голям брой фактори, те обикновено имат точни критерии за включване и изключване. Например не се включват бременни жени заради потенциален риск от увреждане на плода. Така никой не е предполагал, че талидомида причинява дефекти на плода докато препаратът не бил вкаран в употреба в края на 50те годиниw4.
След това идва въпросът как се представят резултатите от RCT. Никой не желае да оповестява лоши новини, особено хора, отделили време и усилия за разработването на ново лекарство. В исторически план това е причината изследователите да не публикуват опити, показали липса на статистическа значимост или такива, показали, че старото лекарство е по-добро от новото. Някои безскрупулни изследователи дори са публикували избрани или непълни резултати, според които новото лекарство изглежда по-добро отколкото е в действителност. Общността на изследователите е предприела стъпки за прекратяване на двете практики като задължава компаниите и изследователите да регистрират началото на изпитванията, което затруднява укриването на неблагоприятни резултати, въпреки че все още не съществува изискване за оповестяване на цялостните резултати. Списанията също стандартизират информацията, която изискват от изследователите за да публикуват трудовете им, а това допълнително затруднява укриването на лошите резултати.
Преди всичко RCT са скъпи и отнемащи време. В резултат на това много опити изобщо не се извършват или размерът на извадката им или продължителността им са ограничени. Това може да означава, че експериментът не е достатъчно силен за да определи дали лекарството е ефективно, когато всъщност то е такова. Ограничените опити е възможно да пропуснат странични ефекти (проявяващи се рядко), както и на базата на тях не е възможно да се съди за дългосрочните резултати.
Затова клиничните изследователи често вземат под внимание резултатите от няколко изпитвания за щателен анализ, познат като систематичен обзор – това ефективно увеличава обема на извадката. Организации като Cochrane Collaborationw5 и Националният институт по здраве и клинични постижения на Великобританияw6 основават своите препоръки към медицинската общност именно на систематичен обзор.
От 40те години на миналия век използването на RCT значително е променило медицинската практика. Лекарите вече не разчитат само на собствените си наблюдения, а се опират на солидната оценка да ползите от новото лекарство за да преценят риска.
Данните могат да променят гледни точки
Неотдавна беше извършен систематичен обзор на данните за миноциклина, широко предписван антибиотик за лечение на акне, с цел проучване на ефикасността и безопасността му.
Един от страничните ефекти на миноциклина е вероятността от проява на фатални автоимунни проблеми с черния дроб. Проблемите се проявяват рядко и могат да имат редица причинители. Повечето лекари не са се сблъсквали с тях, а дори и да са, рядко някой от тях ги свързва с лекарството.
Само след като е прегледана цялата информация за това, се прави връзката. Систематичен обзор показва, че няма доказателство миноциклинът да е по-добър при лечението на акне от което и да е друго известно лекарство. Вземайки предвид рисковете, авторите на обзора заключват, че лекарството не трябва да се предпочита пред останалите такива (Garner et al., 2003).
С благодарност на.
Ако настоящата статия ви е била интересна и искате да научите повече за използването на математиката, можете да прочетете оригиналната по-дълга версияw3, публикувана в списание Plusw7 – безплатно онлайн издание, което отваря за света вратата на математиката, разкривайки нейната красота и приложения.
References
- Garner SE (2003) Minocycline for acne vulgaris: efficacy and safety (Миноциклин срещу акне вулгарис: ефикасност и безопасност). Cochrane Database of Systematic Reviews 1: CD002086. doi: 10.1002/14651858.CD002086
Web References
- w1 – За повече информация за препоръките за почивка в леглото вижте секцията терапия от статията „Болки в кръста и ишиас” на страницата на UK пациенти website (www.patient.co.uk) или използвайте директния линк: http://tinyurl.com/y9gghww
- w2 – Можете да прочетете добро обяснение това как ефектите от лечението и големината на извадката могат да повлияят върху статистическите резултати в Малък наръчник по статистическа практика на Джери Далал: www.jerrydallal.com/LHSP/sizenotes.htm
- w3 – Оригиналната версия на тази статия и допълнителни подробности за статистиката можете да намерите в:
- Garner S, Thomas R (2010) Evaluating a medical treatment – how do you know it works? (Оценяване на лечение – как да разберем дали наистина помага?) Plus Magazine. http://plus.maths.org/latestnews/jan-apr10/rct
- w4 – За да научите повече за талидомидовата катастрофа и за най-новите изследвания на талидомида и формирането на крайниците вижте:
- Zimmer C (2010) Answers begin to emerge on how thalidomide caused defects (Започват да се появяват отговори за това как талидомидът причинява дефекти). New York Times 16 Mar: D3. www.nytimes.com
- w5 – The Cochrane Collaboration е международна организация от хора, помагащи на здравните работници, политиците, пациентите, техните адвокати и асистенти да вземат информирани решения, касаещи здравето. Посете: www.cochrane.org
- w6 – Националният институт по здраве и клинични постижения е независима организация, осигуряваща във Великобритания напътствия в национален аспект за добро здраве и предпазване и лекуване от заболявания. Посетете: www.nice.org.uk
- w7 – За да научите повече за Plus – безплатното онлайн списание за математика, посетете: http://plus.maths.org
Resources
- Кратко описание на четирите фази на клиничното изпитване, можете да прочетете в:
- Wynne K, Bloom S (2007) Оксинтомодулин – нова терапия срещу затлъстяването? Science in School 6: 25-29. www.scienceinschool.org/2007/issue6/oxyntomodulin/bulgarian
- Ledford H (2010) Companies pledge to make more trial data public. Nature News 15 Jun. doi: 10.1038/news.2010.299.
- За да чуете подкаста, придружаващ оригиналната версия на настоящата статия (Plus подкаст от 22 февруари 2010: Оценяване на лечение), посетете: http://plus.maths.org/podcast
- Благотворителната организация Sense About Science е изготвила полезен наръчник за интерпретиране на медицинските жалби в пресата („Нищо не губя ако опитам”). Той може да бъде свален от сайта на Sense About Science (www.senseaboutscience.org.uk) или от директния линк: http://tinyurl.com/63zv4l
- Freiberger M (2010) Medical research plagued by bad reporting (Медицинските изследвания, замърсени от лошо оповестяване). Plus Magazine (Списание Plus). http://plus.maths.org/latestnews/jan-apr10/reporting
- Списание Plus предлага статии, подкасти и предложения за учебни дейности на тема математиката в здравето и медицината: „Знаеш ли кое е добро за теб?” Посетете: http://plus.maths.org/wellcome
Review
Статията ни въвежда в модерната, основаваща се на доказателства медицина, представяйки пренебрегвания и рядко разбираем път от разработването на медикамента до успешното лечение. Разгледани са статистическите методи и техните недостатъци, предлагайки интердисциплинарни възможности за преподаване на ученици на 14 години.
Статията засяга горещи теми, които могат да бъдат дискутирани от по-големите ученици и учители по различни предмети. Например:
- „Знанието” не е статично: с оповестяването на нови странични ефекти или с появата на нови доказателства, общоприетото знание може да се промени.
- Често за клиничното изпитване на едно лекарство преди то да отиде на пазара е необходимо повече време, отколкото някои болни разполагат. На кой да бъде разрешено да участва в изпитването и кои пациенти ще приемат контролното лекарство и кои новото?
- Защо оповестяването на нови лечения може да бъде опорочено?
- Грешни ли са нивата на сигурност, предоставени от статистиката?
Изучавайки примера за кръвното налягане и неговото вариране, учениците могат да измерят своето и да сравнят как то варира между тях. Те могат да измерят собственото си кръвно налягане след като са тичали по стълбите няколко минути за да видят как се променя. На тази основа на вариране как учените определят ефекта от препаратите за намаляване на кръвното налягане?
Статията може да бъде използвана и за начало на по-мащабни дейности. Например на учениците може да бъдат раздадени статии от вестници за част от клинично изследване или за „чудодейно лекарство” за състояние, с което те са запознати като мигрена, глюкозна непоносимост или алергии. Разделени на групи и с помощта на учебниците си, интернет или други източници, те трябва да разберат:
- Лекуваното заболяване;
- Какви лечения се използват към момента за това заболяване;
- Дали новите лекарства са изпитвани върху животни;
- Дали са публикувани резултати от предишни клинични изследвания на лекарството;
- Как е проектирано настоящото клинично изследване и какви статистически анализи са извършени;
- Как според тях би могло да се подобри изследването.
Въз основа на проучването всяка група ученици може да напише своя статия за вестник, касаеща клиничните проучвания. Според тях правдоподобна ли е статията от вестника? Ако не, защо?
За повечето учители статията би могла да бъде ценен източник на информация за историята на медицинските изследвания и рандомизирано контролните опити.
Friedlinde Krotscheck, Австрия