Психиатрия Всемирная психиатрия
№01 2020

Валидация технологий цифрового фенотипирования для клинического использования: важность «высокого разрешения» №01 2020

Номера страниц в выпуске:114-115
Цифровое фенотипирование, определяемое как сбор данных о фенотипах людей in situ с использованием цифровых устройств, становится все более привлекательным методом для понимания и лечения психических расстройств1.
Alex S. Cohen, Elana Schwartz, Thanh Le et al. Validating digital phenotyping technologies for clinical use: the critical importance of «resolution». World Psychiatry 2020;19(1):114-15.

Цифровое фенотипирование, определяемое как сбор данных о фенотипах людей in situ с использованием цифровых устройств, становится все более привлекательным методом для понимания и лечения психических расстройств1. Популярность этого метода частично отражает почти повсеместное распространение смартфонов, геолокации, социальных сетей и других поведенческих и физиологических записывающих технологий среди большинства людей в современном обществе. Эти технологии относительно недорогие и часто продуцируют непрерывные потоки данных, которые можно ненавязчиво собирать, пока люди занимаются повседневными вещами. Это дает возможность -проведения оценки далеко за пределами традиционных клинических условий и может потенциально повысить эффективность и снизить стоимость различных вмешательств.
На сегодняшний день существует впечатляющее количество литературы, демонстрирующее «проверку и подтверждение принципа действия» («proof of principle/concept») для широкого спектра технологий2. Огромный объем получаемого с помощью этих технологий материала прекрасно подходит для «больших данных» и сложных вычислительных подходов для их понимания и интерпретации. Литература изобилует алгоритмами, показывающими впечатляющую точность для прогнозирования множества клинических событий и состояний с использованием этих технологий. Однако, насколько нам известно, ни один из них не был одобрен для клинического психиатрического или психологического использования государственными регулирующими органами, и лишь немногие, если таковые имеются, были приняты клиницистами, пациентами или организациями. Это резко контрастирует с медициной в целом, которая адаптировала большое количество амбулаторных объективных технологий для оценки и принятия решений в лечении3.
Мы считаем, что проблемы, возникающие при внедрении этих технологий, частично отражают недостаточность психометрии для их эффективной оценки и понимания4. Традиционно характеристики психиатрических/психологических явлений оцениваются с использованием принципа достоверности и обоснованности (валидности). Достоверность касается постоянства характеристик во времени (достоверность повторного тестирования), индивидуальных особенностях (внутреннее постоянство), информаторах (например, межгрупповой достоверности) и ситуациях (например, ситуативной достоверности). С другой стороны, обоснованность касается точности характеристики, оцениваемой на основе предполагаемой структуры (например, структурной валидности) и потенциальной конвергенции с концептуально связанными (например, сходящиеся характеристики) и несвязанными (например, дискриминантная валидность) конструкциями и клинически значимыми критериями (например, конкурентный и предиктивный критерий обоснованности).
Важно отметить, что достоверность и обоснованность характеристик в клинической психиатрии намного ниже, чем в других науках. Значения достоверности, объясняющие 50% дисперсии баллов, обычно считаются приемлемыми5. Значения обоснованности еще более свободно интерпретируются: например, характеристики, показывающие отклонение, составляющее менее 50%, с концептуально значимыми мерами, часто считаются приемлемыми, если не хорошими/превосходными2. Такое большое количество необъяснимых отклонений было бы неприемлемым во многих прикладных науках: медицине, физике, химии, технике, биологии, информатике и смежных науках. 
Почему достоверность и обоснованность недостаточны для понимания психиатрических явлений? Психиатрические фенотипы не являются статичными во времени и пространстве. При исследовании с использованием, если фигурально выражаться, «оптики с достаточно высоким разрешением» мы видим, что, например, психоз изменяется в зависимости от близости к стрессовым ситуациям, пограничные симптомы в основном появляются как функция близости к межличностным «объектам», а злоупотребление психоактивными веществами как функция близости доступа к веществам или упоминания о них2,6. Даже психологические конструкции, такие как нарциссизм и познание, значительно различаются во времени и пространстве при измерении с «высоким разрешением»6,7. Например, эффекты «захода солнца», включая прогрессирующее ухудшение когнитивных ресурсов в течение дня, являются признаком многих нейродегенеративных расстройств и потенциально полезной целью для дифференцирования деменции и депрессии.
Используемые в настоящее время клинические измерения дают ограниченную информацию о временной и пространственной динамике, лежащей в основе психиатрических фенотипов. Структурированные клинические интервью, личностные тесты, перечни симптомов и функциональные характеристики обычно основаны на самоотчетах и других, побочных, наблюдениях/информации, полученных во время пространственно «ограниченного» взаимодействия (т. е. клинического визита). Они также обычно не точны в отношении изменения конкретных аспектов конструкции в зависимости от временных и пространственных особенностей. Более того, немногие, если таковые вообще имеются, часто используемые клинические измерения предоставляют данные, которые можно масштабировать в определенные пользователем периоды времени или в конкретные пространственные контексты.
Представьте себе, например, что можно было бы понять психоз пациента с помощью интерфейса, похожего на онлайн-географические карты. Можно «уменьшить разрешение», чтобы наблюдать симптомы психоза в течение дней, недель и месяцев, и можно «увеличить разрешение», чтобы наблюдать, систематически ли меняется психоз как функция времени (например, хуже вечером) или пространственных условий (например, хуже при взаимодействии с определенными сверстниками). Этот вид динамических данных и интерфейса предоставил бы беспрецедентные возможности для понимания психических расстройств и для персонализации фармакологических, психосоциальных и неотложных вмешательств.
Точно так же, как достоверность и обоснованность биомедицинских показателей, таких как уровень глюкозы или частота сердечных сокращений3, регистрируются и оцениваются только при определенных и контролируемых обстоятельствах, следует понимать достоверность и обоснованность технологий цифрового фенотипирования как функции времени и пространства. Цифровые технологии фенотипирования сами по себе не являются «достоверными и валидными», они скорее могут обладать достоверностью и обоснованностью при определенных обстоятельствах и для конкретных целей. Сообщение о психометрических характеристиках с учетом соответствующих временных и пространственных характеристик может помочь при внедрении технологий цифрового фенотипирования, улучшить интерпретацию их данных и, возможно, помочь оптимизировать сигнал и уменьшить шум. Вероятно, это может улучшить параметры достоверности и обоснованности так, чтобы они приблизились к биомедицинским тестам в общем.
Чтобы проиллюстрировать, как разрешение может улучшить валидацию цифрового фенотипирования, рассмотрим технологии обработки родного языка, используемые для количественной оценки психоза. Беглый обзор литературы показывает, что была установлена «обоснованность», в которой была задокументирована скромная конвергенция между различными семантическими речевыми характеристиками, полученными в вычислительном отношении, и «золотым стандартом» рейтингов клинических симптомов8. Такой подход к валидации кажется неуместным, если учесть несоответствие в разрешении между этими показателями – первый получен из систематического анализа кратких языковых выборок, полученных во время довольно искусственного клинического взаимодействия или когнитивного задания, а второй представляет порядковый рейтинг, назначенный клиницистом на основе расширенного клинического интервью9. Эти рейтинги отражают очень разные временные и пространственные характеристики, и, следовательно, неудачи в поиске большой конвергенции неудивительны. Однако основанные на машинном обучении алгоритмы, объединяющие технологии цифрового фенотипирования и клинические рейтинги, продемонстрировали впечатляющую точность, они, как правило, также игнорировали явное несоответствие разрешающей способности между этими переменными и не демонстрировали обобщаемость для новых выборок, речевых заданий или клинических показателей2,9.
Насколько нам известно, «разрешение» обычно не рассматривается в исследованиях цифрового фенотипирования. Для того чтобы цифровое фенотипирование психиатрических расстройств рассматривалось наравне с таковым для биомедицинских расстройств в целом, их психометрия должна быть такой же точной. Эта точность может быть достигнута путем тщательно выполненной разносторонней оценки «разрешения». 

Перевод: Мамедова Г.Ш. (Москва)
Редактура: к.м.н. Резников М.К. (Воронеж)

DOI:10.1002/wps.20703
Список исп. литературыСкрыть список
1. Insel TR. World Psychiatry 2018;17:276-7.
2. Cohen AS. Psychol Assess 2019;31:277-84.
3. Rodbard D. Diabetes Technol Ther 2016;18(Suppl. 2):S3-13.
4. Holmlund TB, Foltz PW, Cheng J et al. Psychol Assess 2019;31:292-303.
5. Koo TK, Li MY. J Chiropr Med 2016;15:155-63.
6. Wright AGC, Hopwood CJ. Assessment 2016;23:399-403.
7. Salthouse TA. Neuropsychology 2007;21:401-11.
8. Cohen AS, Elvevåg B. Curr Opin Psychiatry 2014;27:203-9.
9. Elvevåg B, Foltz PW, Rosenstein M et al. Schizophr Bull 2017;43:509-13.
Количество просмотров: 762
Предыдущая статьяПолнотранскриптомный анализ ассоциаций открывает новые возможности клинического применения генетических открытий для психических расстройств
Следующая статьяОбеспечение качества психологической поддержки: развитие глобальной компетентной рабочей силы
Прямой эфир