Психиатрия Дневник психиатра (психиатрическая газета)
Психиатрия Дневник психиатра (психиатрическая газета)
№04 2012
Доказательные исследования в психиатрии: анализ практической значимости №04 2012
Номера страниц в выпуске:9-14
В настоящее время в психиатрии особое внимание уделяется доказательности проводимых исследований. Считается, что результаты только тех из них, которые в полной мере соответствуют принципам доказательной медицины, могут рассматриваться как достоверные и, соответственно, претендовать на внедрение в клиническую практику, а также учитываться в дальнейших научных изысканиях. Считается, что термин «медицина, основанная на доказательствах» (evidence based medicine) был предложен в 1990 г. группой ученых из университета Макмастера (McMaster University, Торонто, Канада), хотя стремление к выработке рекомендаций по диагностике и лечению больных на основе научно обоснованных исследований, безусловно, осуществлялось значительно раньше, по крайней мере последние 150 лет. Однако именно с 90-х годов XX в. данный подход стал доминирующим. Развитие концепции доказательной медицины связано с рядом имен. Во-первых, следует упомянуть A.Cochrane. Занимаясь проблемой медицинских ошибок и в конечном итоге став эпидемиологом, он был сторонником экспериментального подхода в клинической медицине, направленного на получение достоверных данных в отношении диагностики и лечения: в основе такой научной достоверности, по его мнению, должны лежать рандомизированные контролируемые исследования. Данная точка зрения сразу же привлекла внимание медицинских чиновников во многом благодаря чрезвычайно чувствительному для них посылу: стоимость медицинской помощи весьма велика, и любые процедуры, эффективность которых не доказана, не могут рекомендоваться для применения и, более того, должны быть «искоренены». Еще одной ключевой фигурой для развития концепции доказательной медицины является A.Feinstein. Будучи по первому образованию математиком и лишь в дальнейшем занявшись медициной, он очень хорошо понимал возможности и ограничения предлагаемых методик, а его способность давать меткие характеристики была весьма чувствительной для оппонентов. В частности, чрезмерную увлеченность рандомизированными контролируемыми исследованиями он называл «рандофилией», метаанализы – «статистической алхимией XXI столетия», а ряд методов клинической биостатистики сравнивал с туманом и воздушными замками. Как клиницист, A.Feinstein обращал внимание на гетерогенность проявлений заболевания, наблюдаемых в клинической практике: у одних больных может наблюдаться одна группа симптомов, у других – другая, а у части пациентов отмечается их полный спектр. По его мнению, эти данные должны быть тщательно собраны, систематизированы и использованы для определения лечения и прогноза, что и составляет основу клинического суждения – ключевого понятия в его системе (книга с аналогичным названием вышла в 1967 г.). Преимущества рандомизированных контролируемых исследований он видел в их способности отвечать на административные вопросы, однако без прояснения клинических. При этом он с сожалением отмечал, что подход, основанный на клиническом суждении, умирает: выросло поколение, которое «никогда не слышало о нем», и в большинстве случаев клиническая эпидемиология игнорирует его, увлекшись математической моделью. Подчеркивая, что он не нападает на рандомизированные контролируемые исследования, которые, по его мнению, внесли блестящий вклад в науку, A.Feinstein указывал, что совершенно неверно думать, что они могут ответить на вопросы клинической практики, отмечая, что «если вы не хотите думать, рандомизированные исследования – прекрасный путь избежать этого». Однако несмотря на это, он довольно тесно сотрудничал с отделом клинической эпидемиологии и биостатистики университета Макмастера. Появление данного подразделения в конце 60-х годов XX в. В значительной степени было связано с ростом стоимости медицинской помощи, который достиг кризисного уровня в последующие десятилетия. В основе разработок данной группы лежало положение A.Feinstein о возможности оценить эффективность клинической помощи, объединенное с подходом A.Cochrane, предлагавшего с помощью рандомизированных контролируемых исследований решать задачи администрирования, что оказалось весьма своевременным в условиях нарастающего напряжения между клинической практикой и системой организации здравоохранения. Ключевым положением этих разработок являлось утверждение о возможности использования только тех профилактических, диагностических и лечебных методов, эффективность которых была достоверно доказана и польза от применения которых превышает потенциальные нежелательные явления. Указывалось, что рандомизированные контролируемые исследования могут дать ответ на вопрос «что работает?», а концепция A.Feinstein адресуется процессу принятия решения клиницистом в определенной клинической ситуации. Все это позволило авторам говорить о возникновении новой научной дисциплины – медицины, основанной на доказательствах. Ее методической основой является клиническая эпидемиология, разрабатывающая методы клинических исследований, которые дают возможность делать научно обоснованные заключения, сводя к минимуму влияние систематических и случайных ошибок на результаты исследования. Основным инструментом клинической эпидемиологии является статистика – дисциплина, занимающаяся изучением приемов систематического наблюдения над массовыми явлениями, составлением численных их описаний и научной обработкой этих описаний. С помощью биомедицинской статистики описываются результаты любых биологических и медицинских исследований, представленных в виде цифр, таблиц, графиков, гистограмм.днако исследовательская группа из университета Макмастера не ограничилась только статистическими описаниями. Как подчеркивал ее основатель и первый руководитель D.Sackett, доказательная медицина не исчерпывается исключительно рандомизированными исследованиями и метаанализами: «Без клинической квалификации практика рискует подавиться доказательствами, поскольку даже превосходно внешне обоснованное доказательство может быть неприменимым или несоответствующим отдельному пациенту» – необходимо объединение индивидуального профессионализма (квалификация и клиническое мышление, приобретаемые в процессе накопления клинического опыта) с доказательствами, полученными из систематического исследования. С этой точки зрения, огромной заслугой специально созданной рабочей группы по доказательной медицине (Evidence Based Medicine Working Group) являлась публикация большой серии статей, дающих рекомендации специалистам-медикам о том, каким образом оценивать результаты и выводы тех или иных статей, клинических исследований, обзоров, руководств по клинической практике, клинических анализов: насколько надежны приводимые данные, какова их суть, как оценивать безопасность анализируемых методов и их влияние на качество жизни больных. Чрезвычайно важным является тот факт, что авторы наряду с рассмотрением значения представленных данных для медицинской службы (в том числе с точки зрения экономики здравоохранения) большое внимание уделили вопросу, каким образом они могут быть полезны для выбора тактики в отношении конкретного пациента. В настоящее время значение этих работ, учитывая все увеличивающийся вал публикаций, еще больше возрастает. Вместе с тем для широкого круга специалистов предлагается использовать довольно простую схему, отражающую иерархию достоверности полученных результатов (по возрастающей): описание отдельных случаев, описание серии случаев, ретроспективное исследование «случай– контроль», аналитическое одномоментное исследование, проспективное когортное (популяционное исследование), рандомизированное контролируемое исследование медицинских вмешательств (методов лечения, профилактики), метаанализ. Из этой схемы вытекают общепринятые уровни доказательности исследований (по убывающей): уровень I (А) – большие двойные слепые плацебо-контролируемые исследования, а также данные, полученные при метаанализе нескольких рандомизированных контролируемых исследований; уровень II (В) – небольшие рандомизированные и контролируемые исследования, при которых статистические данные построены на небольшом числе больных; уровень III (С) – нерандомизированные клинические исследования на ограниченном количестве пациентов; уровень IV (D) – выработка группой экспертов консенсуса по определенной проблеме. На сегодняшний день представленный подход стал общепринятым и практически канонизировался, нередко с игнорированием всех других подходов и систем доказательств (например, качественного анализа) или с низведением их значимости (отдельные «классические» случаи). В значительной степени это обусловлено тем, что он дает простые и строго регламентированные критерии для организаторов здравоохранения, менеджеров компаний-разработчиков, представителей страховых компаний и грантодателей, пациентов, их родственников и адвокатов, т.е. лиц, как правило, не являющихся специалистами по собственно оказанию медицинской помощи, но которые могут быть вовлечены в ее оценку и принятие организационных и юридических решений. В этих случаях строго регламентированный подход оказывается безусловно выигрышным. Однако в том виде, в котором он существует в настоящее время, позволяет ли он получать данные для выработки тактики ведения конкретного пациента? Сомнения в этом, в частности в отношении психиатрической помощи, налицо. Так, указывается, что существует разрыв между клиническими исследованиями и обстоятельствами конкретных больных, обусловленный преимущественно бизнес-направленностью клинических исследований: их целью главным образом является одобрение со стороны административных структур и продвижение на рынок. В некоторых работах отмечается, что стандарты доказательной медицины не вполне применимы в психиатрии, по крайней мере на данном этапе ее развития, из чего обосновывается вывод о необходимости разработки для психиатрии специальных стандартов доказательности. Но не является ли данная точка зрения артефактом клинического впечатления, столь низко оцениваемого доказательной медициной? Этот вопрос требует прояснения, на что в значительной степени и направлена данная статья.
При проведении корректных клинических исследований, отвечающих принципам доказательной медицины, необходимо соблюдать ряд этапов, планирование и осуществление которых должно соответствовать определенным требованиям. В основу проведенного в данной работе анализа была заложена оценка как собственно содержания этих требований, так и особенностей их выполнения при подготовке и осуществлении исследований. Конкретным содержанием анализа являлись цели и задачи, которые ставились при их планировании, подходы к формированию выборки пациентов, оцениваемые показатели, полученные результаты и их обработка, а также выводы (их полнота, обоснованность и практическая значимость). В этой связи следует упомянуть активно обсуждаемую в последнее время проблему проведения плацебо-контролируемых исследований. Помимо рассмотрения этичности данного подхода (этот аспект выходит за рамки задач проводимого анализа), существенным является определение возможности терапевтического действия плацебо: значительное число специалистов сознательно используют его в своей повседневной практике для терапевтических целей. Так, в США 56% семейных врачей используют плацебо (правда, в этих случаях, как правило, применяется не нейтральное вещество, а лекарственное средство, однако, не обладающее соответствующим фармакологическим эффектом), причем 97% указывают на его терапевтический эффект, 85% считают, что оно оказывает как психологическое, так и соматическое лечебное действие. Только 8% специалистов высказались за то, чтобы применение плацебо в клинической практике было категорически запрещено. Следует отметить, что подобная точка зрения была выявлена не только у врачей первичной помощи, но и у специалистов, работающих в университетских клиниках (в частности, данный опрос проводился в Чикаго), т.е. потенциально более осведомленных в отношении новейших достижений медицины: 45% из них используют плацебо в своей клинической практике, 97% указывают на его терапевтический эффект, 40% предполагают в том числе и физиологическое действие в отношении курируемого заболевания, и только 12% предлагают категорически запретить применение плацебо для лечения больных. В упомянутых работах обращает на себя внимание, что даже в США (с их высоким уровнем стандартизации помощи и контролем со стороны страховых компаний) существует практически полная (97%) убежденность специалистов в реальном терапевтическом действии плацебо. Данный факт, по-видимому, требует постановки ряда вопросов. При каких болезнях, какой их тяжести и других особенностях эффект плацебо более выражен и почему? Существует ли плацебо-эффект при применении препаратов с доказанной эффективностью, и если да, то суммируется ли он с их собственно терапевтическим действием, формируя результирующий эффект в виде простой суммы отдельных составляющих (результирующий эффект = эффект препарата + плацебо-эффект), частично поглощаясь (результирующий эффект = эффект препарата + k ¥ плацебо-эффект, где k<1) или усиливая «клинически обоснованное» действие препарата (результирующий эффект = эффект препарата + k ¥ плацебо-эффект, где k>1)? Какие факторы могут повлиять на этот процесс: в частности, собственно эффективность препарата (можно ли утверждать, что более эффективные лекарства обладают и более выраженным плацебо-эффектом, и какие отдельные составляющие терапевтического действия являются наиболее значимыми); индивидуальные (личностные и соматические) характеристики пациентов, а также обстоятельства осуществления терапии? Последнее является особенно важным в случаях использования плацебо в клинических исследованиях. При их проведении курация больных существенно отличается от рутинной практики. Пациенты часто (во многих случаях еженедельно) наблюдаются персоналом, им уделяют большое внимание, интересуясь обстоятельствами жизни, обследуют, проводят значительное число диагностических процедур, нередко мало доступных в обычных условиях. Участие в исследовании дает шанс получать самые современные препараты (рандомизация в группы с активным лекарственным средством составляет в зависимости от дизайна исследования от 50 до 80%). В этих условиях возможность развития эффекта терапии, не связанного с фармакологическим действием изучаемого препарата, значительно возрастает. Фактически, помимо назначения медикаментозного лечения, осуществляется своего рода психотерапия. Следует отметить, что ответы на часть из поставленных выше вопросов известны. Так, указывается, что плацебо-эффект труднее «отделить» от терапевтического действия активного препарата при наличии депрессивной симптоматики по сравнению с галлюцинаторно-бредовой, а также при меньшей тяжести расстройств. Однако большинство аспектов развития плацебо-эффекта, в частности при проведении клинических исследований, остаются без рассмотрения. Так, дизайн анализируемых в данной работе исследований (см. ниже) ни в одном случае не был направлен на минимизацию дополнительных возможностей влияния нелекарственных воздействий на результат лечения (за исключением введения периода «отмывки» – washout period), а последующий анализ полученных результатов не вводил поправки на их наличие. Складывается впечатление, что на практике при проведении клинических исследований эффективность в группе плацебо рассматривается как артефакт, некое случайное стечение обстоятельств, по существу приравниваемое к спонтанному улучшению без проведения терапии. Соответственно, проблемы «отделения» изучаемого препарата от плацебо решаются не путем учета факторов, могущих сказаться на выраженности плацебо-эффекта, а большей стандартизации и «объективизации» оценок (например, проведение диагностических тестов «третьей стороной», специально обученными высококвалифицированными независимыми экспертами): предполагается, что чрезмерно высокая эффективность терапии в группе плацебо преимущественно связана с недостаточным качеством работы исследователей. В ряде публикаций демонстрируются положительные результаты такого подхода, однако это не исключает необходимости учета других факторов, сказывающихся на плацебо-эффекте: в клинических исследованиях его влияние должно быть минимизировано (в отличие от повседневной клинической практики, когда его можно использовать в терапевтических целях), поскольку является «шумом» при оценке эффективности изучаемого лекарственного средства. Возвращаясь к анализу целей проведения клинических исследований, следует отметить, что сопоставление нового препарата с плацебо является лишь первым этапом доказательства его клинической эффективности. На следующей стадии необходимо продемонстрировать преимущества исследуемого вещества по сравнению с другим препаратом с доказанной эффективностью. Однако проблема состоит в том, что в разных исследованиях нередко получают прямо противоположные результаты. Анализ этих работ выявил существенное значение в этом отношении факта, кем было организовано и финансировано то или иное исследование. При формальном соблюдении основных принципов доказательной медицины (рандомизированные двойные слепые плацебо-контролируемые исследования) и публикации в журналах с высоким рейтингом и требованиями к предоставляемым статьям (например, в упомянутых выше случаях это «Американский журнал психиатрии» и «Журнал клинической психофармакологии») выявляются факторы, в конечном итоге оказывающие решающее значение на основные результаты. Согласно специально осуществленному анализу в 90% абстрактов статей, поддерживаемых фирмами-производителями, их препарат имеет преимущество перед препаратом сравнения. Хотя авторы данной работы признают высокое качество исследований, спонсируемых фармацевтическими компаниями, в методологическом отношении нередко превышающее качество «независимых» исследований (к таким методологическим преимуществам относятся достаточный размер выборки, ее валидная центральная рандомизация, высокие требования к сбору материала, его мониторированию и аудиту), ряд особенностей разработанного спонсором протокола позволяет представлять «свой» препарат в более выгодном свете. К таким существенным характеристикам относятся критерии включения и исследуемая выборка, используемые дозы и их титрация, а также методика обработки полученных данных. Указывается, что рецензенты должны учитывать эти особенности в своих отзывах, а читатели в обязательном порядке обращать на них внимание при чтении научных статей, хотя формат публикаций зачастую не позволяет полностью изложить все существенные аспекты проведенного исследования. Кроме того, публиковаться должны все полученные результаты, как демонстрирующие преимущества изучаемого метода лечения, так и потерпевшие неудачу (в последнее время подобное требование становится обязательным).
Учитывая огромное количество работ, ежегодно публикуемых в психиатрической периодической печати, тщательное рассмотрение и отбор которых угрожал бы своим объемом блокировать собственно рассмотрение изучаемой проблемы, было решено использовать представленную в литературе уже осуществленную другими авторами селекцию статей. При этом представлялось целесообразным ограничиться исследованиями, касающимися фармакотерапии шизофрении современными антипсихотиками: подобные исследования достаточно многочисленны, как правило, тщательно мониторируются регуляторными органами, что положительно сказывается на их соответствии требованиям доказательной медицины. Таким образом, выбор остановился на метаанализе международной группы авторов, посвященном прямому сравнению эффективности антипсихотиков второго поколения, зарегистрированных на момент проведения данной работы (амисульприд, арипипразол, зипрасидон, зотепин, кветиапин, клозапин, оланзапин, рисперидон, сертиндол). Авторы провели поиск публикаций (по состоянию на май 2007 г.) в регистре Кохрановской группы по шизофрении (Cochrane Schizophrenia Groups’s Register), который формируется с использованием значительного числа международных баз данных (BIOSIS, CINAHL, Dissertation Abstracts, EMBASE, LILACS, MEDLINE, PSYNDEX, PsycINFO, RUSSMED, Sociofile). Всего в результате поиска было выявлено 3620 ссылок. Из них были выбраны 612 работ, в которых изучалась анализируемая проблема, однако 319 публикаций были исключены вследствие несоответствия критериям отбора (оценивались только рандомизированные слепые исследования, уровень доказательности A или В). Таким образом, в анализ было включено 293 публикации, отражавшие 78 исследований при общем числе участников – 13 558 больных. Полный список публикаций приводится в метаанализах авторов, посвященных прямому парному сравнению указанных атипичных антипсихотиков. Как уже указывалось, согласно критериям отбора все исследования, вошедшие в анализ, были рандомизированными и включали большое число пациентов из значительного числа исследовательских центров. Таким образом, согласно принятой классификации, данные работы имеют наивысший уровень доказательности. Однако если позволить себе усомниться в абсолютной ценности подобного канонизированного подхода (A.Cochrane некоторые авторы сравнивают с иконой), то необходимо обратить внимание на ряд существенных моментов. Корректно проведенная рандомизация позволяет распределить исследуемую случайную выборку на сопоставимые группы. Однако данная методика никак не влияет на репрезентативность выборки. В целом очевидно, что контингент пациентов, принимавших участие в клинических исследованиях, отличается от всей популяции больных с данной патологией, но вопрос, в какой степени, остается без ответа: ни в одной из изученных публикаций он даже не ставился. Дополнительный поиск в базе данных PubMed позволил выявить лишь единичные работы, касающиеся данного вопроса, которые при этом только отчасти проливали свет на интересующую проблему. Так, в одной из публикаций указывалось, что 70–77% пациентов, поступивших в психиатрическую больницу, готовы участвовать в клинических исследованиях лекарственных препаратов (в том числе двойных слепых). В то же время только 13% больных из 279 обследованных с деменцией альцгеймеровского типа могли быть отобраны в соответствующее исследование как отвечающие критериям включения/исключения. Близкие результаты сообщаются и для других диагностических групп (шизофрении, биполярного расстройства, депрессии, панического расстройства): число отобранных для скрининга больных составляло 10–25% от общего количества обследованных, лишь в одном случае достигая 34%. Кроме того, ряд авторов отмечает, что ввиду трудности набора участников клинических исследований нередко в них включаются одни и те же пациенты, которые «кочуют» из одних исследований в другие. Так, по данным S.Woods и соавт., из 137 пациентов, участвовавших на протяжении ряда лет в проводимых авторами клинических исследованиях эффективности терапии шизофрении и шизоаффективного расстройства, 27 (19,7%) человек включались последовательно в несколько из них.
Значительный интерес представляют прямые сопоставления контингента больных, принимавших участие в исследованиях и не участвовавших в них. Так, в упоминавшейся уже работе S.Woods и соавт. пациенты – участники клинических исследований (119 человек) в Центре психического здоровья New Haven (штат Коннектикут, США) сравнивались с остальной выборкой больных шизофренией и шизоаффективным расстройством, наблюдавшейся в этом же центре и не принимавшей участия в исследованиях (1536 человек). Авторы выявили значимые различия между группами по демографическим и некоторым социальным показателям (образование, работа, семейное положение, принадлежность к национальным меньшинствам). Кроме того, участники исследований были зарегистрированы в психиатрической службе более длительный период времени и имели большее количество (но не суммарную длительность) госпитализаций. Диагноз параноидной шизофрении чаще отмечался у пациентов, участвующих в исследованиях, но различия не достигали статистически значимого уровня. В другой подобной работе на основе анализа большого материала (10 тыс. пациентов медицинской службы Управления по делам ветеранов, США) показано, что среди больных шизофренией, не принимавших участия в проводимом исследовании, лишь 23,3% соответствовали основному критерию включения. При этом даже они (не говоря уже о тех пациентах, кто не соответствовал критериям включения) статистически значимо отличались от участников исследований по ряду социально-демографических (раса, возраст, семейное положение) и, что более существенно, клинико-организационных показателей (в частности, касающихся психиатрических госпитализаций, наличия стационирований в связи с соматическими причинами, характера и интенсивности амбулаторной психиатрической помощи, особенностей психофармакотерапии). Обращает на себя внимание, что в упомянутых работах, осуществленных в США, практически не оцениваются клинические характеристики сравниваемых групп больных, что, однако, представляется наиболее существенным при решении вопроса о репрезентативности выборок пациентов, участвующих в клинических исследованиях. В этом отношении значительный интерес вызывает работа, осуществленная на кафедре психиатрии и психотерапии Университета Людвига–Максимилиана (Мюнхен, Германия). Авторы сопоставили выборку из 100 стационарных больных, принимавших участие в клинических исследованиях, начиная с 1 января 1995 г. (последний пациент, включенный в данную группу, был отобран для участия в исследовании в 1999 г.), с таким же количеством больных (100 человек), получавших лечение в университетском госпитале на общих основаниях, без осуществления исследовательских процедур. Последние (контрольная группа) поступали в госпиталь примерно в те же сроки, что и исследовательская группа, и отбирались таким образом, что соответствовали ей по диагнозу (основной критерий отбора), полу и возрасту. В результате пациенты 2 групп не обнаруживали статистически значимых отличий по большинству социальных показателей (образование, семейное положение, условия жизни) и уровню социального функционирования (оцененного по шкале оценки общего функционирования – GAF), однако различались по ряду клинических. Так, хотя возраст начала болезни, возраст первой госпитализации и семейная отягощенность психозами не имели существенных различий в сравниваемых группах, длительность заболевания и число предшествующих госпитализаций были выше у больных, не принимавших участия в исследованиях, так же как и худшее состояние соматического здоровья и связанная с ним более интенсивная сопутствующая соматическая терапия. Кроме того, несмотря на отсутствие различий в исходном уровне тяжести симптоматики, оцененной по шкале общего клинического впечатления (CGI), для ее контроля у пациентов, не принимавших участия в клинических исследованиях, судя по хлорпромазиновому эквиваленту, требовались более высокие дозы антипсихотиков. Также у больных сравниваемых групп несколько отличалась структура выявленных расстройств. В частности, у больных исследовательской группы отмечалась большая выраженность галлюцинаторно-бредовой симптоматики (p<0,05) и апатии (значимость на уровне тенденции). Наоборот, маниакальный аффект (p<0,005) и враждебность, включая собственно агрессивность (значимость на уровне тенденции), в большей степени выявлялись у больных контрольной группы. Число больных, имевших суицидальные тенденции и нарушения формального мышления, также было выше в контрольной группе (p<0,05), а негативная симптоматика чаще выявлялась в исследовательской (p<0,05). Полученные результаты не кажутся неожиданными и вполне объяснимы: определенная интенсивность галлюцинаторно-бредовых расстройств, как правило, является одним из критериев включения в исследование (с менее выраженной симптоматикой пациенты не могут быть скринированы), однако при наборе больных врачи по вполне понятным причинам стараются отбирать пациентов без нарушений поведения (включая агрессивные и аутоагрессивные тенденции), признаков остроты состояния, предпочитая им более аутизированных и погруженных в мир собственных переживаний больных, имеющих при этом удовлетворительный соматический статус, уменьшающий вероятность развития нежелательных явлений терапии. Таким образом, исходя из имеющихся немногочисленных работ, понятно, что больные, принимающие участие в клинических исследованиях, далеко не в полной мере соответствуют «усредненному типичному пациенту». При этом вопрос, в какой степени результаты, полученные в клинических исследованиях, могут быть применимы ко всей генеральной совокупности больных, остается открытым и требующим дальнейшего изучения. В частности, далеко не очевидно, что выборки больных в разных исследованиях являются сопоставимыми, – этот вопрос особенно актуален при проведении метаанализов, когда обработке подвергаются результаты исследований, осуществленных в разное время, по различному дизайну и разными группами исследователей, не участвовавших в совместных тренингах, которые могли бы позволить получать более согласованные данные. Сопоставление описания исследований, включенных в метаанализ прямого сравнения антипсихотиков второго поколения, позволил получить следующие результаты. Возраст пациентов в разных исследованиях (в данном случае не учитывались исследования, касающиеся исключительно лечения больных старших возрастных групп и молодых пациентов с впервые возникшими психотическими состояниями) находился в интервале 32,4±11,0÷46,4±9,1 года; соотношение по полу (мужчины/женщины) – 31,8/68,2%÷ 88,9/11,1%.Во всех случаях изучались больные шизофренией, а в ряде работ дополнительно шизоаффективным расстройством или в целом расстройствами шизофренического спектра. Диагностика в подавляющем большинстве наблюдений (вне зависимости от региона проведения исследования – Северная Америка, Европа, Австралия и Новая Зеландия) осуществлялась по DSM-IV (в более ранних публикациях по DSM-IIIR) и лишь в единичных работах – по Международной классификации болезней Всемирной организации здравоохранения, в определенной степени отличающейся от Американской национальной классификации. В исследования включались все формы шизофрении с наибольшей частотой встречаемости параноидной формы, распространенность которой в разных работах варьировала от 50,0 до 90,0% (данные представлены преимущественно в публикациях европейских авторов). Диапазон диагностики дезорганизованной формы составлял от 0 до 32,6%; недифференцированной – от 0 до 40,0%; кататонической – от 0 до 3,4%; резидуальной шизофрении – от 0 до 7,3%. Количество предшествующих госпитализаций варьировало от 5,9±4,8 до 14,0±10,8 (т.е. согласно правилу трех сигм в последнем случае у 99,7% больных число госпитализаций находится в интервале от 0 до 46). Длительность текущего обострения симптоматики составляла от 7 дней до 2 лет и более (разница медиан достигала 10 мес). Тяжесть расстройств (суммарная оценка по PANSS) при включении больных в исследования находилась в интервале 69,3±18,5÷ 112,4±17,6 балла; по субшкале позитивной симптоматики – 15,9±5,8÷27,2±6,2 балла; негативной симптоматики – 19,6±7,2÷ 29,4±6,9 балла. Таким образом, не только по демографическим показателям, но и по представленным в публикациях (к сожалению, далеко не в полном объеме) клиническим характеристикам, группы пациентов обнаруживали определенный спектр по крайней мере в своих крайних точках существенно различающихся между собой значений. В целом можно сделать вывод, что выборки пациентов, включаемых в клинические исследования, по ряду клинико-социальных показателей не только отличаются от всей когорты больных шизофренией в этих же исследовательских центрах, но и обнаруживают существенные расхождения при сопоставлении контингента пациентов, принимавших участие в разных исследованиях. Исходя из этого полученные в анализируемых клинических исследованиях результаты не могут быть распространены на всю генеральную совокупность больных шизофренией и касаются лишь ограниченной группы, которая соответствует только изученной (причем, учитывая заметную скудость имеющихся во многих публикациях клинических описаний, идентифицировать эту группу бывает достаточно сложно). Следующий аспект проведенного анализа касался изучаемых в клинических исследованиях показателей. Как уже отмечалось выше, основными задачами изучения в этих случаях являются определение эффективности и безопасности/переносимости исследуемого препарата. С этой целью используются психометрические шкалы и стандартизированные опросники, позволяющие унифицировать оценку и минимизировать влияние на нее субъективного фактора. В то же время негативной стороной подобного подхода является ограниченность сведений, получаемых с помощью любой, пусть даже самой совершенной шкалы, которая, безусловно, не способна охватить все богатство психопатологической структуры расстройств, в значительной степени редуцируя их, а некоторые прямо не учитывая. Все большую популярность приобретают краткие шкалы или версии шкал и опросников, экономящие время исследователей, но еще более сокращающие спектр изучаемых показателей [так, краткая психиатрическая рейтинговая шкала BPRS, разработанная в 1962 г. и до сих пор пользующаяся большой популярностью, содержит всего 18 пунктов (первоначальная версия имела 16 пунктов), и ее заполнение занимает только 20–30 мин]. В части случаев для характеристики клинического статуса больных используются лишь отдельные пункты шкал. Например, в ряде анализируемых работ тяжесть состояния больных определялась лишь по четырем пунктам шкалы позитивных и негативных расстройств PANSS («необычное содержание мыслей», «галлюцинаторное поведение», «концептуальная дезорганизация», «подозрительность»), причем для установления требуемой по протоколу глубины расстройств достаточно было иметь определенный минимальный балл лишь по двум из них. При этом динамика указанных пунктов при окончательном анализе не учитывалась. Подобный подход характерен для всех проанализированных работ: при оценке терапевтической динамики психопатологических расстройств основной акцент делался на изучении суммарных показателей («общая эффективность»), а также в значительном числе случаев показателей позитивных и негативных расстройств. Ни в одной из изученных публикаций не осуществлялся детальный анализ отдельных пунктов используемых шкал (т.е. отдельных проявлений заболевания), и лишь в некоторых из них проводилось изучение групп факторов (таких, например, как «нарушение мышления», «анергия», «тревога–депрессия», «враждебность–подозрительность» и др. при использовании BPRS). Однако и в этих случаях основное внимание уделялось глобальной оценке их динамики (более детальные данные при их наличии приводились преимущественно в виде табличного материала и практически не обсуждались в тексте). В анализируемых публикациях ни в одном случае не определялось соотношение полученных результатов с социально-демографическими и клинико-организационными характеристиками, представленными при описании контингента больных (в этих условиях их наличие в тексте статей фактически было лишено смысловой нагрузки, превращаясь в пустую формальность, усугубляющуюся еще и тем, что в части публикаций различия между сравниваемыми группами по этим показателям достигали статистически значимого уровня). Заметно более детально в тексте изученных статей были представлены характер и частота встречаемости побочных эффектов и нежелательных явлений терапии. Однако как и в отношении клинических проявлений заболевания, анализ во всех случаях основывался на усредненных показателях. Ни в одной работе не обсуждалось, у каких больных развились те или иные побочные эффекты и что предрасполагало к их развитию или способствовало ему. Отсутствие в статьях полной информации о полученных в исследованиях результатах, по-видимому, является одним из наиболее типичных их недостатков. В частности, как следует из обсуждаемых метаанализов, только в 15,3% публикаций результаты были изложены в полном объеме, а в 83,5% случаев отмечалось выборочное изложение материала (в части случаев определить это, по мнению авторов, было затруднительно), причем данный недостаток касался в том числе и ряда аспектов, которые декларировались как дополнительные или даже основные задачи работы. Переходя к анализу статистической обработки представленных в изученных публикациях данных, следует обратить внимание на один существенный, на наш взгляд, аспект: считается, что для повышения непредвзятости доказательных исследований необходимо заранее жестко определить, какие показатели и какими статистическими методами будут обрабатываться. Однако при таком подходе стремлению к повышению объективности приносится в жертву гибкость анализа. Действительно, при обнаружении некоторых данных для их осмысления может потребоваться дополнительная, в том числе статистическая, обработка материала (например, выделение субгрупп, различающихся по вновь исследуемым признакам, специальные методы статистического анализа и пр.). Соответственно, при отсутствии такого подхода в тексте публикаций (как это и оказалось в целом ряде анализируемых статей) появляются статистические данные, которые трудно понять и объяснить, т.е. представляющие исключительно статистический феномен, не обнаруживающий какой-либо смысловой нагрузки и, естественно, только регистрирующийся, но не обсуждающийся. В целом статистический анализ в изученных публикациях, несмотря на определенное разнообразие применяемых методик, касался довольно узкого аспекта: при обработке материала основное внимание исследователей уделялось выявлению статистически значимых различий между сравниваемыми показателями (причем, как уже отмечалось выше, в основном это касалось суммарных оценок, без сопоставления отдельных характеристик). Между тем доказательство статистических отличий между обследованными выборками указывает лишь на то, что они сохранятся в том же объеме и в генеральной совокупности. Однако этот статистический показатель ничего не говорит о величине различий. Для оценки последнего обычно используются другие подходы. К ним, например, относится вычисление «величина эффекта» (effect size), которая определяет силу изучаемого воздействия. Еще одним используемым с этой целью показателем является относительный риск, или соотношение рисков (risk ratio), рассчитываемый как частное вероятности наступления изучаемого исхода в основной группе к аналогичному показателю в контрольной. И наконец, NNT (Number Need to Treat) – среднее количество больных, которых необходимо пролечить исследуемым методом, чтобы получить положительный результат (предотвратить неблагоприятный исход болезни) дополнительно у 1 пациента по сравнению с терапией сравнения. Обращает на себя внимание, что, несмотря на очевидное практическое значение оценки величины (а не только статистической значимости) различий сравниваемых показателей, эти данные приводятся только в отдельных работах, причем, как правило, не являясь центральной частью изложения (о чем, например, свидетельствует отсутствие этих данных в резюме статей и представление их в тексте преимущественно лишь в таблицах с короткими ссылками на них). Тем не менее, используя имеющиеся в статьях данные, расчет указанных величин произвести можно: в частности, эти расчетные данные приводятся в анализируемых метаанализах, где выявлены определенные количественные различия в эффективности антипсихотиков второго поколения. Вместе с тем авторы признают полученные результаты лишь в небольшой степени полезными в повседневной клинической практике. Дело в том, что в баллах PANSS различия составляли от 1,9 (для пары оланзапин/рисперидон) до 8,3 (при сопоставлении оланзапина и зипрасидона). Колебания величины эффекта (effect size) составили, соответственно, от 0,11 до 0,29, что соответствует ее слабой/умеренной выраженности. Более того, средние различия в эффективности между атипичными антипсихотиками и плацебо составили только 10 баллов PANSS (величина эффекта 0,51). В результате одним из наиболее значимых факторов для выбора препарата в каждом конкретном случае авторы признают спектр его побочных эффектов, подчеркивая, что это может оказаться «более важным, чем небольшие отличия в эффективности». Однако, хотя выводы об ограничении использования того или иного препарата с определенным спектром побочных эффектов в случае наличия у пациента соответствующей этим побочным эффектам патологии логически оправданны, они, как правило, не подкреплены клиническими данными. В результате постулируется, что назначение терапии в каждом конкретном случае происходит путем проб и ошибок, т.е. фактически отрицается возможность целенаправленного подбора лечения.
Описанные выше особенности получения и анализа клинического материала, безусловно, сказываются на возможности использования результатов исследований в повседневной клинической практике в отношении отдельных пациентов. Первое, что необходимо отметить, это факт, что, как известно из биомедицинской статистики, данные, полученные на репрезентативных выборках, применимы исключительно в отношении соответствующих групп больных, но их использование у отдельных пациентов не является корректным (т.е. полученное в клинических исследованиях доказательство эффективности того или иного метода лечения является основанием говорить об его эффективности при применении, например, у больных шизофренией в целом, но не указывает на обоснованность его выбора при терапии конкретного пациента). Во-вторых, как следует из анализа литературных данных, выборки пациентов, включаемых в клинические исследования, в значительной степени отличаются от контингента больных, наблюдаемых в тех же клинических центрах, и, кроме того, по ряду социально-демографических и клинико-организационных показателей обнаруживают существенные различия между отдельными исследованиями. Это обусловливает серьезные ограничения генерализации полученных в них результатов. В-третьих, опубликованные данные, полученные в ходе клинических исследований, касаются преимущественно суммарных оценок изучаемых характеристик и, как правило, не рассматривают детали влияния на отдельные психопатологические феномены и их совокупности (синдромы/дименсии). В тех же случаях, когда такая оценка осуществлялась, она также носила обобщенный характер, концентрируясь на суммарной тяжести расстройств (например, таких факторов, как «депрессия», «враждебность» и пр.) или степени уменьшения выраженности «нежелательного» поведения (агрессивного или аутоагрессивного) без анализа динамики стоящей за этим клинической симптоматики, что затрудняет возможность дифференцированного назначения терапии. Кроме того, негативную роль играет заметная выборочность представления полученных в исследованиях данных, часть из которых остается недоступной и, таким образом, не может использоваться в клинической практике. С последним в определенной степени смыкаются особенности принятой статистической обработки материала, которая в значительной степени носит редукционистский характер. Статистический анализ ограничивается преимущественно выявлением достоверности различий между сравниваемыми группами больных без определения выраженности этих различий. При этом изначальная предопределенность форм и методов обработки результатов значительно сужает возможности клинико-статистического анализа. В результате полученные в клинических исследованиях данные и выводы из них лишь в небольшой степени оказываются полезными в повседневной клинической практике, поскольку касаются только ограниченного круга интересующих клиницистов вопросов, не содержат важных практических деталей, а порой страдают очевидным лукавством (например, широко публикуются данные о влиянии ряда психотропных средств на негативную симптоматику, хотя большинством исследователей признается, что в подобных наблюдениях речь идет главным образом о вторичной негативной симптоматике, а терапевтическое влияние антипсихотиков на собственно негативную симптоматику ограниченно и противоречит концепции развития дефицитарных расстройств при шизофрении). В целом можно констатировать, что на сегодняшний день так называемые доказательные исследования в психиатрии являются таковыми лишь в ограниченной степени. В их основу положен достаточно узкий круг подходов (к ним в первую очередь относятся рандомизация и двойная слепая контролируемая методика), которые были объявлены «золотым стандартом» и, по существу, канонизировались с игнорированием или низведением на менее значимый уровень всех других возможностей сбора и анализа материала, некоторые из которых в конкретных, соответствующих определенным целям и задачам ситуациях могут являться, безусловно, более адекватными (анализ особенностей, сильных и слабых сторон этих методических подходов, вне всякого сомнения, чрезвычайно важен, однако его проведение выходит за рамки данной работы и требует специального рассмотрения). Рискнем предположить, что причины сложившегося положения дел скорее всего лежат, как уже отмечалось в начале данной статьи, в значительной востребованности доказательных исследований со стороны разных регуляторных органов, для которых, однако, наиболее значимыми являются присутствующие в них формальные аспекты (с использованием дихотомии: метод эффективен или неэффективен, полученная польза перевешивает недостатки или нет и пр.), причем преимущественно на уровне групп больных (что необходимо для принятия административных решений, в том числе на региональном и государственном уровне), а не отдельных пациентов (что оказывается более важным для практикующих врачей). Значительная часть доказательных исследований в психиатрии проводится компаниями – производителями лекарственных препаратов для получения разрешения на их использование и регистрации клинических показаний. Подобная работа подразумевает привлечение больших сил и средств: в них принимает участие значительное число клиницистов, нередко из многих стран мира, а количество изученных больных исчисляется сотнями, а иногда и тысячами, что, безусловно, требует тщательной координации деятельности всех участников и крупных финансовых вложений. Естественно, компании-производители стараются минимизировать объем работы и затраты, в том числе исключив из задач исследования «лишние», т.е. не требуемые регуляторными органами в обязательном порядке. Кроме того, здесь могут присутствовать и маркетинговые соображения, в частности, касающиеся того, какие показания данного препарата регистрировать в первую очередь, а какие отложить, что конечно же сказывается на содержании клинических исследований лекарственных средств. Следует отметить, что в последние годы все больше стало появляться независимых от фармацевтических компаний исследований, что могло бы изменить ситуацию. Однако, к сожалению, этого не происходит, что объясняется рядом причин. Так, часть подобных исследований спонсируется другими «заинтересованными» учреждениями (например, страховыми компаниями), для которых также важен формализованный, исключительно статистический подход. Другой возможной причиной может быть сложность проведения крупных многоцентровых исследований, требующих огромной организационной работы, специального административного и координирующего аппарата (количество клинических центров, принимающих участие в таких исследованиях, может достигать нескольких десятков в разных регионах мира) и чрезвычайно крупных финансовых вложений, значительно превышающих средства стандартных исследовательских грантов. Соответственно, в реальной практике такие независимые исследования оказываются весьма небольшими по объему изученного материала, что не всегда позволяет получить адекватную доказательную базу. И наконец, за прошедшие десятилетия сложился определенный стереотип «правильного» («качественного») проведения клинических исследований, изменение которого потребует, по-видимому, значительных объективных и субъективных усилий (потребуется признать, что привычный и одобряемый профессиональным сообществом подход является не всегда достаточно приемлемым). Однако если мы хотим проводить в психиатрии действительно доказательные исследования, необходимо разработать обновленные требования к их осуществлению, которые заменят старые и не отвечающие современным реалиям. Разработка научных основ и организационной структуры проведения исследований, основанных на доказательствах, является амбициозной, но чрезвычайно насущной задачей профессионального сообщества психиатров.
Общие положения
Анализ публикаций
Значительный интерес представляют прямые сопоставления контингента больных, принимавших участие в исследованиях и не участвовавших в них. Так, в упоминавшейся уже работе S.Woods и соавт. пациенты – участники клинических исследований (119 человек) в Центре психического здоровья New Haven (штат Коннектикут, США) сравнивались с остальной выборкой больных шизофренией и шизоаффективным расстройством, наблюдавшейся в этом же центре и не принимавшей участия в исследованиях (1536 человек). Авторы выявили значимые различия между группами по демографическим и некоторым социальным показателям (образование, работа, семейное положение, принадлежность к национальным меньшинствам). Кроме того, участники исследований были зарегистрированы в психиатрической службе более длительный период времени и имели большее количество (но не суммарную длительность) госпитализаций. Диагноз параноидной шизофрении чаще отмечался у пациентов, участвующих в исследованиях, но различия не достигали статистически значимого уровня. В другой подобной работе на основе анализа большого материала (10 тыс. пациентов медицинской службы Управления по делам ветеранов, США) показано, что среди больных шизофренией, не принимавших участия в проводимом исследовании, лишь 23,3% соответствовали основному критерию включения. При этом даже они (не говоря уже о тех пациентах, кто не соответствовал критериям включения) статистически значимо отличались от участников исследований по ряду социально-демографических (раса, возраст, семейное положение) и, что более существенно, клинико-организационных показателей (в частности, касающихся психиатрических госпитализаций, наличия стационирований в связи с соматическими причинами, характера и интенсивности амбулаторной психиатрической помощи, особенностей психофармакотерапии). Обращает на себя внимание, что в упомянутых работах, осуществленных в США, практически не оцениваются клинические характеристики сравниваемых групп больных, что, однако, представляется наиболее существенным при решении вопроса о репрезентативности выборок пациентов, участвующих в клинических исследованиях. В этом отношении значительный интерес вызывает работа, осуществленная на кафедре психиатрии и психотерапии Университета Людвига–Максимилиана (Мюнхен, Германия). Авторы сопоставили выборку из 100 стационарных больных, принимавших участие в клинических исследованиях, начиная с 1 января 1995 г. (последний пациент, включенный в данную группу, был отобран для участия в исследовании в 1999 г.), с таким же количеством больных (100 человек), получавших лечение в университетском госпитале на общих основаниях, без осуществления исследовательских процедур. Последние (контрольная группа) поступали в госпиталь примерно в те же сроки, что и исследовательская группа, и отбирались таким образом, что соответствовали ей по диагнозу (основной критерий отбора), полу и возрасту. В результате пациенты 2 групп не обнаруживали статистически значимых отличий по большинству социальных показателей (образование, семейное положение, условия жизни) и уровню социального функционирования (оцененного по шкале оценки общего функционирования – GAF), однако различались по ряду клинических. Так, хотя возраст начала болезни, возраст первой госпитализации и семейная отягощенность психозами не имели существенных различий в сравниваемых группах, длительность заболевания и число предшествующих госпитализаций были выше у больных, не принимавших участия в исследованиях, так же как и худшее состояние соматического здоровья и связанная с ним более интенсивная сопутствующая соматическая терапия. Кроме того, несмотря на отсутствие различий в исходном уровне тяжести симптоматики, оцененной по шкале общего клинического впечатления (CGI), для ее контроля у пациентов, не принимавших участия в клинических исследованиях, судя по хлорпромазиновому эквиваленту, требовались более высокие дозы антипсихотиков. Также у больных сравниваемых групп несколько отличалась структура выявленных расстройств. В частности, у больных исследовательской группы отмечалась большая выраженность галлюцинаторно-бредовой симптоматики (p<0,05) и апатии (значимость на уровне тенденции). Наоборот, маниакальный аффект (p<0,005) и враждебность, включая собственно агрессивность (значимость на уровне тенденции), в большей степени выявлялись у больных контрольной группы. Число больных, имевших суицидальные тенденции и нарушения формального мышления, также было выше в контрольной группе (p<0,05), а негативная симптоматика чаще выявлялась в исследовательской (p<0,05). Полученные результаты не кажутся неожиданными и вполне объяснимы: определенная интенсивность галлюцинаторно-бредовых расстройств, как правило, является одним из критериев включения в исследование (с менее выраженной симптоматикой пациенты не могут быть скринированы), однако при наборе больных врачи по вполне понятным причинам стараются отбирать пациентов без нарушений поведения (включая агрессивные и аутоагрессивные тенденции), признаков остроты состояния, предпочитая им более аутизированных и погруженных в мир собственных переживаний больных, имеющих при этом удовлетворительный соматический статус, уменьшающий вероятность развития нежелательных явлений терапии. Таким образом, исходя из имеющихся немногочисленных работ, понятно, что больные, принимающие участие в клинических исследованиях, далеко не в полной мере соответствуют «усредненному типичному пациенту». При этом вопрос, в какой степени результаты, полученные в клинических исследованиях, могут быть применимы ко всей генеральной совокупности больных, остается открытым и требующим дальнейшего изучения. В частности, далеко не очевидно, что выборки больных в разных исследованиях являются сопоставимыми, – этот вопрос особенно актуален при проведении метаанализов, когда обработке подвергаются результаты исследований, осуществленных в разное время, по различному дизайну и разными группами исследователей, не участвовавших в совместных тренингах, которые могли бы позволить получать более согласованные данные. Сопоставление описания исследований, включенных в метаанализ прямого сравнения антипсихотиков второго поколения, позволил получить следующие результаты. Возраст пациентов в разных исследованиях (в данном случае не учитывались исследования, касающиеся исключительно лечения больных старших возрастных групп и молодых пациентов с впервые возникшими психотическими состояниями) находился в интервале 32,4±11,0÷46,4±9,1 года; соотношение по полу (мужчины/женщины) – 31,8/68,2%÷ 88,9/11,1%.Во всех случаях изучались больные шизофренией, а в ряде работ дополнительно шизоаффективным расстройством или в целом расстройствами шизофренического спектра. Диагностика в подавляющем большинстве наблюдений (вне зависимости от региона проведения исследования – Северная Америка, Европа, Австралия и Новая Зеландия) осуществлялась по DSM-IV (в более ранних публикациях по DSM-IIIR) и лишь в единичных работах – по Международной классификации болезней Всемирной организации здравоохранения, в определенной степени отличающейся от Американской национальной классификации. В исследования включались все формы шизофрении с наибольшей частотой встречаемости параноидной формы, распространенность которой в разных работах варьировала от 50,0 до 90,0% (данные представлены преимущественно в публикациях европейских авторов). Диапазон диагностики дезорганизованной формы составлял от 0 до 32,6%; недифференцированной – от 0 до 40,0%; кататонической – от 0 до 3,4%; резидуальной шизофрении – от 0 до 7,3%. Количество предшествующих госпитализаций варьировало от 5,9±4,8 до 14,0±10,8 (т.е. согласно правилу трех сигм в последнем случае у 99,7% больных число госпитализаций находится в интервале от 0 до 46). Длительность текущего обострения симптоматики составляла от 7 дней до 2 лет и более (разница медиан достигала 10 мес). Тяжесть расстройств (суммарная оценка по PANSS) при включении больных в исследования находилась в интервале 69,3±18,5÷ 112,4±17,6 балла; по субшкале позитивной симптоматики – 15,9±5,8÷27,2±6,2 балла; негативной симптоматики – 19,6±7,2÷ 29,4±6,9 балла. Таким образом, не только по демографическим показателям, но и по представленным в публикациях (к сожалению, далеко не в полном объеме) клиническим характеристикам, группы пациентов обнаруживали определенный спектр по крайней мере в своих крайних точках существенно различающихся между собой значений. В целом можно сделать вывод, что выборки пациентов, включаемых в клинические исследования, по ряду клинико-социальных показателей не только отличаются от всей когорты больных шизофренией в этих же исследовательских центрах, но и обнаруживают существенные расхождения при сопоставлении контингента пациентов, принимавших участие в разных исследованиях. Исходя из этого полученные в анализируемых клинических исследованиях результаты не могут быть распространены на всю генеральную совокупность больных шизофренией и касаются лишь ограниченной группы, которая соответствует только изученной (причем, учитывая заметную скудость имеющихся во многих публикациях клинических описаний, идентифицировать эту группу бывает достаточно сложно). Следующий аспект проведенного анализа касался изучаемых в клинических исследованиях показателей. Как уже отмечалось выше, основными задачами изучения в этих случаях являются определение эффективности и безопасности/переносимости исследуемого препарата. С этой целью используются психометрические шкалы и стандартизированные опросники, позволяющие унифицировать оценку и минимизировать влияние на нее субъективного фактора. В то же время негативной стороной подобного подхода является ограниченность сведений, получаемых с помощью любой, пусть даже самой совершенной шкалы, которая, безусловно, не способна охватить все богатство психопатологической структуры расстройств, в значительной степени редуцируя их, а некоторые прямо не учитывая. Все большую популярность приобретают краткие шкалы или версии шкал и опросников, экономящие время исследователей, но еще более сокращающие спектр изучаемых показателей [так, краткая психиатрическая рейтинговая шкала BPRS, разработанная в 1962 г. и до сих пор пользующаяся большой популярностью, содержит всего 18 пунктов (первоначальная версия имела 16 пунктов), и ее заполнение занимает только 20–30 мин]. В части случаев для характеристики клинического статуса больных используются лишь отдельные пункты шкал. Например, в ряде анализируемых работ тяжесть состояния больных определялась лишь по четырем пунктам шкалы позитивных и негативных расстройств PANSS («необычное содержание мыслей», «галлюцинаторное поведение», «концептуальная дезорганизация», «подозрительность»), причем для установления требуемой по протоколу глубины расстройств достаточно было иметь определенный минимальный балл лишь по двум из них. При этом динамика указанных пунктов при окончательном анализе не учитывалась. Подобный подход характерен для всех проанализированных работ: при оценке терапевтической динамики психопатологических расстройств основной акцент делался на изучении суммарных показателей («общая эффективность»), а также в значительном числе случаев показателей позитивных и негативных расстройств. Ни в одной из изученных публикаций не осуществлялся детальный анализ отдельных пунктов используемых шкал (т.е. отдельных проявлений заболевания), и лишь в некоторых из них проводилось изучение групп факторов (таких, например, как «нарушение мышления», «анергия», «тревога–депрессия», «враждебность–подозрительность» и др. при использовании BPRS). Однако и в этих случаях основное внимание уделялось глобальной оценке их динамики (более детальные данные при их наличии приводились преимущественно в виде табличного материала и практически не обсуждались в тексте). В анализируемых публикациях ни в одном случае не определялось соотношение полученных результатов с социально-демографическими и клинико-организационными характеристиками, представленными при описании контингента больных (в этих условиях их наличие в тексте статей фактически было лишено смысловой нагрузки, превращаясь в пустую формальность, усугубляющуюся еще и тем, что в части публикаций различия между сравниваемыми группами по этим показателям достигали статистически значимого уровня). Заметно более детально в тексте изученных статей были представлены характер и частота встречаемости побочных эффектов и нежелательных явлений терапии. Однако как и в отношении клинических проявлений заболевания, анализ во всех случаях основывался на усредненных показателях. Ни в одной работе не обсуждалось, у каких больных развились те или иные побочные эффекты и что предрасполагало к их развитию или способствовало ему. Отсутствие в статьях полной информации о полученных в исследованиях результатах, по-видимому, является одним из наиболее типичных их недостатков. В частности, как следует из обсуждаемых метаанализов, только в 15,3% публикаций результаты были изложены в полном объеме, а в 83,5% случаев отмечалось выборочное изложение материала (в части случаев определить это, по мнению авторов, было затруднительно), причем данный недостаток касался в том числе и ряда аспектов, которые декларировались как дополнительные или даже основные задачи работы. Переходя к анализу статистической обработки представленных в изученных публикациях данных, следует обратить внимание на один существенный, на наш взгляд, аспект: считается, что для повышения непредвзятости доказательных исследований необходимо заранее жестко определить, какие показатели и какими статистическими методами будут обрабатываться. Однако при таком подходе стремлению к повышению объективности приносится в жертву гибкость анализа. Действительно, при обнаружении некоторых данных для их осмысления может потребоваться дополнительная, в том числе статистическая, обработка материала (например, выделение субгрупп, различающихся по вновь исследуемым признакам, специальные методы статистического анализа и пр.). Соответственно, при отсутствии такого подхода в тексте публикаций (как это и оказалось в целом ряде анализируемых статей) появляются статистические данные, которые трудно понять и объяснить, т.е. представляющие исключительно статистический феномен, не обнаруживающий какой-либо смысловой нагрузки и, естественно, только регистрирующийся, но не обсуждающийся. В целом статистический анализ в изученных публикациях, несмотря на определенное разнообразие применяемых методик, касался довольно узкого аспекта: при обработке материала основное внимание исследователей уделялось выявлению статистически значимых различий между сравниваемыми показателями (причем, как уже отмечалось выше, в основном это касалось суммарных оценок, без сопоставления отдельных характеристик). Между тем доказательство статистических отличий между обследованными выборками указывает лишь на то, что они сохранятся в том же объеме и в генеральной совокупности. Однако этот статистический показатель ничего не говорит о величине различий. Для оценки последнего обычно используются другие подходы. К ним, например, относится вычисление «величина эффекта» (effect size), которая определяет силу изучаемого воздействия. Еще одним используемым с этой целью показателем является относительный риск, или соотношение рисков (risk ratio), рассчитываемый как частное вероятности наступления изучаемого исхода в основной группе к аналогичному показателю в контрольной. И наконец, NNT (Number Need to Treat) – среднее количество больных, которых необходимо пролечить исследуемым методом, чтобы получить положительный результат (предотвратить неблагоприятный исход болезни) дополнительно у 1 пациента по сравнению с терапией сравнения. Обращает на себя внимание, что, несмотря на очевидное практическое значение оценки величины (а не только статистической значимости) различий сравниваемых показателей, эти данные приводятся только в отдельных работах, причем, как правило, не являясь центральной частью изложения (о чем, например, свидетельствует отсутствие этих данных в резюме статей и представление их в тексте преимущественно лишь в таблицах с короткими ссылками на них). Тем не менее, используя имеющиеся в статьях данные, расчет указанных величин произвести можно: в частности, эти расчетные данные приводятся в анализируемых метаанализах, где выявлены определенные количественные различия в эффективности антипсихотиков второго поколения. Вместе с тем авторы признают полученные результаты лишь в небольшой степени полезными в повседневной клинической практике. Дело в том, что в баллах PANSS различия составляли от 1,9 (для пары оланзапин/рисперидон) до 8,3 (при сопоставлении оланзапина и зипрасидона). Колебания величины эффекта (effect size) составили, соответственно, от 0,11 до 0,29, что соответствует ее слабой/умеренной выраженности. Более того, средние различия в эффективности между атипичными антипсихотиками и плацебо составили только 10 баллов PANSS (величина эффекта 0,51). В результате одним из наиболее значимых факторов для выбора препарата в каждом конкретном случае авторы признают спектр его побочных эффектов, подчеркивая, что это может оказаться «более важным, чем небольшие отличия в эффективности». Однако, хотя выводы об ограничении использования того или иного препарата с определенным спектром побочных эффектов в случае наличия у пациента соответствующей этим побочным эффектам патологии логически оправданны, они, как правило, не подкреплены клиническими данными. В результате постулируется, что назначение терапии в каждом конкретном случае происходит путем проб и ошибок, т.е. фактически отрицается возможность целенаправленного подбора лечения.
Выводы и обсуждение
Список исп. литературыСкрыть список1. Asenjo Lobos C, Komossa K, Rummel-Kluge C et al. Clozapine vs other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2010; 11. CD 006633.
2. Azorin J-M, Spiegel R, Remington G et al. A double-blind comparative study of clozapine and risperidone in the management of severe chronic schizophrenia. Am J Psychiat 2001; 158: 1305–13.
3. Azorin J-M, Strub N, Loft H. A double-blind, controlled study sertindole versus risperidone in the treatment of moderate to severe schizophrenia. Int J Psychopharmacol 2006; 21: 49–56.
4. Barnett PG, Scott JY, Rosenheck RA. How do clinical trial compare to other patients with schizophrenia? Schizophr Res 2011; 130: 34–9.
5. Bekelman JE, Li Y, Gross CP. Scope and impact of financial conflict of interests in biomedical research: a systematic review. JAMA 2003; 289: 454–65.
6. Bowen J, Hirsch S. Recruitment rates and factors affected recruitment for a clinical trial of a putative anti-psychotic agent in the treatment of acute schizophrenia. Human Psychopharmacol 1992; 7: 337–41.
7. Bowden CL, Calabrese JR, Wallin BA et al. Illness characteristics of patients in clinical drug studies of mania. Psychopharmacol Bull 1995; 31: 103–9.
8. Carpenter WT, Heinrichs DW, Wagman AM. Deficit and nondeficit forms of schizophrenia: the concept. Am J Psychiat 1988; 145: 578–83.
9. Conley RR, Mahmoud R. A randomized double-blind study of risperidone and olanzapine in the treatment of schizophrenia and schizoaffective disorder. Amer J Psychiat 2001; 158: 765–74.
10. Daly J. A short history of evidence-based medicine. Contemporary endocrinology: evidence-based endocrinology. V.Montori (ed.); с. 11–24.
11. Dans AL, Dans LF, Guyatt GH, Richardson WS. User’s guides to the medical literature. XIV. How to decide on the applicability of clinical trial results to your patient. The Evidence Based Medicine Working Group. JAMA 1998; 279 (7): 545–9.
12. Drummond MF, Richardson WS, O’Brien DJ et al. User’s guides to the medical literature. XIII. How to use an article on economic analysis of clinical practice. Are the results of the study valid? The Evidence Based Medicine Working Group. JAMA 1997; 277 (19): 1552–7.
13. Evidence Based Medicine Working Group. Evidence based medicine. A new approach to teaching the practice of medicine. JAMA 1992; 268: 2420–5.
14. Fournier JC, De Rubeis RJ, Hollon SD et al. Antidepressant drug effects and depression severity. A patient level meta-analysis. JAMA 2010; 303 (1): 47–53.
15. Grell W, Ludwig-Mayerhofer W, Steller B et al. The recruitment process for a multi-center study on the long-term prophylactic treatment of affective disorders. J Affect Dis 1993; 28: 257–65.
16. Gupta M. Does evidence-based medicine apply to psychiatry? Theoretic Med and Bioethics 2007; 28: 103–20.
17. Guyatt CH, Sackett DL, Cook DJ. User’s guides to the medical literature. How to use an article about therapy or prevention. Are the results of the study valid? The Evidence Based Medicine Working Group. JAMA 1993; 270 (21): 2598–601.
18. Guyatt CH, Sackett DL, Cook DJ. User’s guides to the medical literature. How to use an article about therapy or prevention. What were the results and will they help me in caring for my patients? The Evidence Based Medicine Working Group. JAMA 1994; 271 (1): 59–63.
19. Guyatt CH, Sackett DL, Sinciair JC et al. User’s guides to the medical literature. A method for grading health care recommendations. The Evidence Based Medicine Working Group. JAMA 1995; 274 (22): 1800–4.
20. Guyatt CH, Naylor CD, Juniler E et al. User’s guides to the medical literature. How to use an article about health-related quality of life. The Evidence Based Medicine Working Group. JAMA 1997; 277 (15): 1232–7.
21. Hayward RS, Wilson MC, Tunis SR et al. User’s guides to the medical literature. How to use a clinical practice guidelines. Are the results of the recommendations valid? The Evidence Based Medicine Working Group. JAMA 1995; 274 (7): 570–4.
22. Healy D. Evidence based psychiatry? Psychiat Bull 2001; 25: 290–1.
23. Heres S, Davis J, Maino K et al. Why olanzapine beats risperidone, risperidone beats quetiapine, quetiapine beats olanzapine: an exploratory analysis of head-to-head comparison studies of second generation of antipsychotics. Amer J Psychiat 2006; 163: 185–94.
24. Hofmann SG, Barlow DH, Papp LA et al. Pretreatment attrition in a comparative treatment outcome study of panic disorder. Amer J Psychiat 1998; 155: 43–7.
25. Jaeschke R, Guyatt CH, Sackett DL. User’s guides to the medical literature. How to use an article about a diagnostic test. Are the results of the study valid? The Evidence Based Medicine Working Group. JAMA 1994; 271 (5): 389–91.
26. Jaeschke R, Guyatt CH, Sackett DL. User’s guides to the medical literature. How to use an article about a diagnostic test. What are the results and will they help me in caring for my patients? The Evidence Based Medicine Working Group. JAMA 1994; 271 (9): 703–7.
27. Kermen R, Hickner J, Brody H, Hasham I. Family physician believe the placebo effect is therapeutic but often use real drug as placebo. Family Med 2010; 42 (9): 636–42.
28. Khan A, Leventhal RM, Khan SR. Severity of depression and response of antidepressants and placebo: an analysis of the Food and Drug Administration database. J Clin Psychopharmacol 2002; 22: 40–5.
29. Kirsch I, Deacon BJ, Huedo-Medina TB et al. Initial severity and antidepressant benefits: a meta-analysis of data submitted to the Food and Drug Administration. PLoS Med 2008; 5 (2): e45.
30. Kobak KA, Kane JM, Thase ME, Nierenberg AA. Why do clinical trials fail? J Clin Psychopharmacol 2007; 27 (1): 1–5.
31. Kobak KA, Leuchter A, De Brota D et al. Site vs centralized rater in a clinical depression trial. J Clin Psychopharmacol 2010; 30: 193–7.
32. Komossa K, Rummel-Kluge C, Hunger H et al. Sertindole versus other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2009; 2. CD 006752.
33. Komossa K, Rummel-Kluge C, Schmid F et al. Aripiprazole versus other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2009; 4. CD 006569.
34. Komossa K, Rummel-Kluge C, Hunger H et al. Ziprasidone versus other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2009; 4. CD 006627.
35. Komossa K, Rummel-Kluge C, Hunger H et al. Amisulpride versus other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2010; 1. CD 006624.
36. Komossa K, Rummel-Kluge C, Schmid F et al. Quetiapine vs other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2010; 1. CD 006625.
37. Komossa K, Rummel-Kluge C, Hunger H et al. Olanzapine vs other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2010; 3. CD 006654.
38. Komossa K, Rummel-Kluge C, Schwarz S et al. Risperidone versus other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2011; 1. CD 006626.
39. Laupacis A, Wells G, Richardson WS, Tugwell P. User’s guides to the medical literature. How to use an article about prognosis? The Evidence Based Medicine Working Group. JAMA 1994; 272 (3): 234–7.
40. Leucht S, Arbter D, Engel RR et al. How effective are second-generation antipsychotic drugs? A meta-analysis of placebo-controlled trials. Mol Psychiat 2008; 14 (4): 429–47.
41. Leucht S, Komossa K, Rummel-Kluge C et al. A meta-analysis of head-to-head comparisons of second-generation antipsychotics in the treatment of schizophrenia. Am J Psychiat 2009; 166 (2): 152–63.
42. Levine M, Walter S, Lee H et al. User’s guides to the medical literature. How to use an article about harm? The Evidence Based Medicine Working Group. JAMA 1994; 271 (20): 1615–9.
43. Licht RW, Couliaev G, Vestergaard P et al. Generalisability of results from randomised drug trials: a trial on antimanic treatment. Br J Psychiat 1997; 170: 264–7.
44. Naylor CD, Guyatt GH. User’s guides to the medical literature. How to use an article about a clinical utilization review. The Evidence Based Medicine Working Group. JAMA 1996; 275 (18): 1435–9.
45. O’Brien DJ, Heyland D, Richardson WS et al. User’s guides to the medical literature. How to use an article on economic analysis of clinical practice. What are the results and will they help me in caring for my patients? The Evidence Based Medicine Working Group. JAMA 1997; 277 (22): 1802–6.
46. Overall JE, Gorham DR. The brief psychiatric rating scale. Psycholog Report 1962; 10: 799–812.
47. Oxman AD, Sackett DL, Guyatt CH. User’s guides to the medical literature. How to get started. The Evidence Based Medicine Working Group. JAMA 1993; 270 (17): 2093–5.
48. Oxman AD, Cook DJ, Guyatt CH. User’s guides to the medical literature. How to use an overview. The Evidence Based Medicine Working Group. JAMA 1994; 272 (17): 1367–71.
49. Partonen T, Silvo S, Lonnqvist JK. Patients excluded from an antidepressant efficacy trial. J Clin Psychiat 1996; 57: 572–5.
50. Richardson WS, Detsky AS. User’s guides to the medical literature. How to use a clinical decision analysis. Are the results of the study valid? The Evidence Based Medicine Working Group. JAMA 1995; 273 (16): 1292–5.
51. Richardson WS, Detsky AS. User’s guides to the medical literature. How to use a clinical decision analysis. What are the results and will they help me in caring for my patients? The Evidence Based Medicine Working Group. JAMA 1995; 273 (20): 1610–3.
52. Riedel M, Strassing M, Muller N et al. How representative of everyday clinical populations are schizophrenia patient enrolled in clinical trials? Eur Arch Psychiat Clin Neurosci 2005; 255: 143–8.
53. Sackett DL, Rosenberg WM, Gray JA et al. Evidence based medicine: what it is and what it isn’t. BMJ 1996; 312 (7023): 71–2.
54. Sharp IR, Kobak KA, Osman DA. The use of videoconferencing with patients with psychosis: a review of the literature. Ann Gen Psychiat 2011; 10: 14–24.
55. Sherman R, Hickner J. Academic physicians use placebo in clinical practice and believe in the mind-body connection. J Gen Int Med 2006; 23 (1): 7–10.
56. Subramanian S, Rummel-Kluge C, Hunger H et al. Zotepine vs other atypical antipsychotics for schizophrenia. Cochrane Database Syst Rev 2010; 10. CD 006628.
57. Tandon R, Nasrallah H, Keshavan MS. Shizophrenia, just the facts. Treatment and prevention. Past, present and future. Schizophr Res 2010; 122: 1–23.
58. Tran PV, Hamilton SH, Kuntz AJ et al. Double-blind comparison of olanzapine vs risperidone in the treatment of schizophrenia and other psychotic disorder. J Clin Psychopharmacol 1997; 17: 407–18.
59. Treves TA, Verchovsky R, Klimovitsky R, Korchin AD. Recruitment rate to drug trials for dementia of Alzheimer type. Alzheimer Dis Assos Dis 2000; 14 (4): 209–11.
60. User’s guides to the medical literature. How to use an article reporting variations in the outcomes of health service. The Evidence Based Medicine Working Group. JAMA 1996; 275 (7): 554–8.
61. Wilson MC, Hayward RS, Tunis SR et al. User’s guides to the medical literature. How to use a clinical practice guidelines. What are the recommendations and will they help me in caring for your patients? The Evidence Based Medicine Working Group. JAMA 1995; 274 (20): 1630–2.
62. Woods SW, Zieldonis DM, Sernyak MJ et al. Characteristics of participants and nonparticipants in medication trials for treatment of schizophrenia. Psychiat Serv 2000; 51 (1): 79–84.
63. Zullino D, Conus Ph, Borgeat F, Bonsack C. Readiness to participate in psychiatric research. Can J Psychiat 2003; 48: 480–4.
21 декабря 2012
Количество просмотров: 2245