Понимание медицинских тестов и их результатов

Обновлено: 16.05.2024

Медицина, основанная на доказательствах (Evidence-based medicine), - это совокупность методологических подходов к проведению клинических исследований, оценке и применению их результатов. В узком смысле «доказательная медицина» - это способ (разновидность) медицинской практики, когда врач применяет в ведении пациента только те методы, полезность которых доказана в доброкачественных исследованиях.

Проблема медицины, основанной на доказательствах, глубже, чем просто сбор, обработка и накоплеие информации. На самом деле можно говорить об изменении миовоззрения врача, о появлении нового врачебного кодекса, основанного на доказательствах. Однао доказательная медицина не ограничивается анализом результатов рандомизированных клинических исследований. Границы ее применима к любой области медицинской науки, включая общие проблемы организации оптимальной системы здравоохранения

Каковы предпосылки к прогрессивному развитию этого направления в последние 20 лет? Мы являемся свидетелями внедрения в медицину сложных технологий, точных методов диагностики; изменился не только характер информации, но и значительно возрос ее объем. Все это диктует закономерный переход к новому качеству медицинской практики, повышению ее эффективности При этом имеются в виду как гуманистические аспекты этого направления, так и экономические, основанные на рациональном использовании национальных ресурсов, направленных на сохранение здоровья При подобном подходе важен баланс между экономикой, целесообразностью и гуманистическим направлением. Методом внедрения научных исследований в практическое здравоохранение является создание клинических руководств и протоколов ведения больных. Применение протоколов позволяет врачу осуществлять выбор терапии не на основании мнений, а на основании доказательств. В настоящее время в России идет разработка более тридцати протоколов ведения больных с самыми социально значимыми заболеваниями В январе 2000 года Министерством здравоохранения РФ принят и ежегодно обновляется «Перечень жизненно необходимых и важнейших лекарственных средств», созданный экспертами преимущественно на основе системы доказательств. «Перечень жизненно необходимых и важнейших лекарственных средств» и «Федеральное руководство по использованию лекарственных средств» являются звеньями одной цепи: первый документ носит регламентирующий характер, второй - рекомендательный.

Наиболее «читаемые» научные публикации представлены в описательных обзорах, которые часто отражают позицию автора по конкретной проблеме. В противоположность этому систематизированные обзоры представляют собой серьезные научные исследования. На их основе обычно проводится мета-анализ - обобщение и статистический анализ результатов отдельных клинических исследований. Систематизированный обзор и мета-анализ, как любое научное исследование, требует четкого планирования. На этом этапе необходимо сформулировать цель анализа, определить критерии отбора научных исследований, методы статистического анализа, методологию поиска информации и т.д.

Информация о контролируемых рандомизированных исследованиях содержится в электронных базах данных,- Меdicine, Cochrane Controlled Triels Register и др.

Одним из ключевых моментов таких исследований является их достоверность. Нередко в медицинской литературе сообщается о больших и трудоемких иследованиях, результаты которых при внимательном рассмотрении нельзя счиать достоверными. Это связано с недооценкой значения выполнения совреенных методических требований к научным клиническим исследованиям.

Одним из таких требований является проведение контролируемых клинических испытаний - ККИ (Controlled Clinical Trials, ССТ). ККИ являются наиболее научно обоснованным способом получения достоверных результатов. При их проведении используются методы контроля, позволяющие получать объективные данные:
сравнительные исследования (Comparative Study);
рандомизация (Randomization);
ослепление исследования (Blinding Masking).

Человек с трудом оценивает высоту музыкального тона, но может услышать малую разницу между близкими тонами. Этот психофизиологический пример иллюстрирует фундаентальную проблему, решенную в ККИ, - проблему сравнения, контроля и стандарта для оценки результатов метода. В методологии науки такая классическая организация эксперимента имеет навание метод единственной разницы. Если создать в двух случаях абсолютно одинаковые условия, то должны наблюдаться одинаковые результаты (в пределах точности измерения и поддержания одинаковых условий). Если изменение условия приводит к изменению результата в одном случае по сравнению с другим, то этот результат можно связывать с измененным условием. Принципиально важно, что такой эксперимент дает основание для оценки связи измененного условия и полученного результата как причинной связи. .

Вторым достижением методологии ККИ является стремление исключить влияние внешних незаданных условий на результат, т.е. осуществить подбор одинаковых (эквивалентных) сравниваемых групп не только по известным данным (например, по полу, возрасту, сопутствующим заболеваниям), но и любым другим признакам, значение которых исследоватею может быть неизвестно. Таким методом является рандомизация.

Рандомизация настолько важна, что рандомизированные контролируемые исследования (РКИ) стали верншной методологии, лучшим стандартом клинических испытаний. Без рандомизации группы могут быть и обычно бывают неоднородными по каким-то признакам. Из-за этих различий результаты нельзя уверенно связывать именно с используемым воз- ; . :. действием. Создание РКИ как метода клинического исследования стало возможым только 50 лет назад, когда были сформированы представления о причинности болезней и разработаны статистические концепции и способы рандомизации.

Несмотря на популярность рандомизации, ее суть нередко понимают неверно и вместо случайного распределения пациентов используют упрощенные способы (по алфавиту имен, датам рождения, дням недели и ТА) и даже произвольное распределение пациентов в группы. Такая «псевдорандомизация» не приводит к ожидаемым результатам. Признанными методами рандомизации являются использование таблиц случайных чисел и более сложных методов. Компьютерная программа генерирует случайную последовательность распределения пациентов по группам, подобную последовательности в таблице. Чтобы уменьшить разницу между очевидно различающимися группами пациентов, включаемых в исследование, используют метод стратификации (stratification), или стратификационной рандомизации. Например, если на результат исследования может повлиять один из заданных параметров (возраст, уровень артериального давления, перенесенный инфаркт миокарда и др.) пациентов вначале делят на подгруппы. Рандомизацию проводят так, что случайное распределение препарата происходит в каждой подгруппе.

Третьим «китом» методологии ККИ является исключение и/или оценка влияния внутренних условий, то есть субъективного фактора. Любой из участников испытания, невольно или преднамеренно, может исказить данные и повлиять тем самым на результат исследования. Например, пациент, знающий, что он получает активный препарат, может более целенаправленно искать у себя признаки улучшения и давать «позитивную» интерпретацию настоящим или мнимым изменениям в своем состоянии. Или врач-исследователь, заведомо убежденный в преимуществах одного из сравниваемых видов лечения, может субъективно трактовать те или иные наблюдения. ККИ стали моделью, в которой впервые были четко распределены исследуемые метод лечения (прием, маневр, воздействие) и его контекст. Следствием этого понимания стало применение ослепления и пящебо-контролируемых исследований. Золотым стандартом клинических исследований является проведение рандомизированного двойного слепого сравнительного исследования.

Клинические исследования могут быть ретроспективными и проспективными. В ретроспективных исследованиях (Retrospective study) оценивают уже Н^^Н прошедшие события (например, по историям болезни). В проспективных иследованиях (Prospective study) вначале составляется план исследования, устанавливается порядок сбора и обработки данных, а затем проводится исслеование по этому плану. Понятно, что в полной мере контролируемыми исследованиями являются пропективные исследования. Отношение к анамнестическому (историческому) контролю в настоящее время скептическое. Доказательная медицина не отрицает традиционного стиля медицинской практики, основанного на традиционных представлениях, она только обращает внимание на качество доказательств различных исследований.

В дальнейшем при анализе полученных результатов исследований применяют шкалу оценки доказательств:
А. Доказательства убедительны:
есть веские доказательства в пользу применения данного метода
В: относительная убедительность доказательств:
есть достаточно доказательств в пользу того, чтобы рекомендовать данное предложение.
С. Достаточных доказательств нет: имеющихся доказательств недостаточно для вынесения рекомендации, но рекомендации могут быть даны с учетом иных обстоятельств.
D. Достаточно отрицательных доказательств: имеется достаточно доказательств, чтобы рекомендовать отказаться от применения данного метода в определенной ситуации.
Е. Веские отрицательные доказательства: имеются достаточно убедительные доказательства того, чтобы исключить данный метод из рекомендаций.

Одним из принципиальных моментов исследования в области доказательной медицины является оценка эффективности и безопасности метода лечения. Контролируемые рандомизированные клинические испытания имеют определенные ограничения.

Группы больных, которые включаются в исследования, обычно не полностью соответствуют нозологической популяции пациентов. Например, эффективость антигипертензивных средств обычно изучается у пациентов с мягкой или умеренной гипертонической болезнью и, соответственно, остается неустановенной у больных тяжелой вторичной гипертонией. В большинстве исследований критериями исключения являются детский или старческий возраст, беременность, сопутствующая тяжелая соматическая па тология. При наличии «жестких» критериев отбора исследуемая нозологичес кая популяция может существенно сократиться.

Следует учитывать гетерогенность, присущую любому из патологических состояний, поэтому результаты клинических исследований обычно имеют невысокую статистическую достоверность. Поэтому, если в отношении лечебного метода существует подобная неопределенность, любые его эффекты на смертность или основные тяжелые исходы заболевания, скорее всего, будут практически неопределенными или только умеренными по своей выраженности. Очевидно, что доказать достоверность таких терапевтических эффектов можно только тогда, когда любые ошибки при их оценке будут намного меньше, чем заслуживающий внимание эффект.

Единственным способом уменьшить такие случайные ошибки является увеличение количества исследований, проведение крупномасштабных международных исследований, с последующим проведением мета-анализа. Данные, полученные в крупном международном исследовании, имеют большую практическую значимость и в силу того, что они применимы к более широкому региону. При этом следует учитывать, что даже почти полное сведение на нет случайных ошибок не может гарантировать достоверность оценки при допуении системных ошибок. Риск такой ошибки особенно велик, если прогноз пациентов, исключенных из одной группы, отличается от прогноза пациентов, выбывших из другой группы. Результаты такого исследования рекомендуется анализировать по группам на количестве больных из числа ран- " домизированных в исследовании - intention-to-treat anatysis (ITT). При оценке частоты некоторых очень специфических и редких побочных эффектов более предпочтительным может быть их анализ только у тех пациентов, кто действительно получал лечение без учета выбывших досрочно по разным причинам - comptiers - onfy analysis (CO). Таким образом, до проведения клинического исследования должен быть составлен план статистического анализа (Statistical Analysis Plan) - документ, который содержит подробное описание принципиальных подходов к анализу результатов и детальное описание методов выполнения статистического анализа первичных (основных) и вторичных (дополнительных) переменных, а также других данных. Проспективные исследования ограничены во времени, и поэтому редко встречающиеся явления можно оценить только ретроспективно. Проводя проспективные исследования, мы невольно и сознательно создаем ситуацию эксперимента, что в определенной мере искусственно. Наблюдение за пациентом в реальной жизни всегда намного богаче, при этом можно выявить новые неожиданные явления. Обычная клиническая практика наблюдения за пациентом всегда включает ретроспективный анализ в комплексе с проспективным наблюдением. Тем не менее, существует неизбежное противоречие между доказательными выводами относительно эффективности лечения при различных типах течения заболевания, которых ждут от испытаний врачи и пациенты, и ненадежными данными, которые могут быть получены в результате анализа исходов в отдельных подгруппах. Несмотря на то, что критический подход к результатам исследований диктует необходимость ориентироваться на ясные и измеримые эффекты, нельзя пренебрегать тем, как пациент сам оценивает изменение своего качества жизни под влиянием лечения. Таким образом, клиническое наблюдение проверяется контролируемым исследованием, а эксперимент - клинической практикой. Для отечественных врачей планирование и проведение исследований по правилам качественной клинической практики ICH-GCP с рядом больших организационных и финансовых трудностей. Однако принципиальное возражение вызывают исследования, в которых вообще пренебрегают основными требованиями качественной клинической практики. Главное в критическом подходе - использовать на практике только сведения, полученные в ходе правильным образом организованных клинических исследований. Сегодня существуют различные взгляды на медицину, основанную на доказательствах. Имеется достаточно много критиков этого подхода. Например, в США доказательную медицину часто сравнивают с поваренной книгой, в которой содержатся рецепты лечения больных. С другой стороны, радикальные сторонники медицины, основанной на доказательствах, доводят до абсолюта значение рандомизированных контролируемых исследований. Конечно, истина находится посередине. Современная медицина приближается к точным наукам, однако все равно никогда ей не станет, поэтому индивидуальный опыт и личность врача всегда имели и будут иметь важное значение. Клиницист, не использующий результаты контролируемых рандомизированных клинических исследований, подобен капитану, плавающему без компаса и карты. Вместе с тем врач, слепо следующий стандартам и не имеющий собственного клинического опыта, не учитывающий индивидуальные особенности пациента, похож на человека, путешествующего по карте. Клиническое исследование, выполненное без соблюдения требований ICH-GCP, не является доказательным, научно обоснованным для оценки эффективности и безопасности, а отражает лишь субъективное отношение автора к рассматриваемому явлению, чаще всего с учетом уже известных данных авторитетных научных исследований. Золотым стандартом является клиническое исследование, выполненное в соответствии с правилами ICH-GCP. Наконец, как оказалось, качество клинического исследования тесно связано с соблюдением этических норм, т.е. клиническая наука и практика должны быть нравственны.

Когнитивные ошибки в принятии клинического решения

Хотя количественные математические модели могут служить руководством при принятии клинических решений, клиницисты в своей ежедневной практике довольно редко могут использовать формальные вычисления, чтобы принять решение об оказании пациенту медицинской помощи. Скорее при клинической оценке они руководствуются интуитивным пониманием вероятностей в сочетании с познавательными процессами, называемыми эвристикой.

К эвристике часто относятся как к эмпирическим правилам, обоснованным предположениям или ментальным «быстрым клавишам». Эвристика обычно включает модели опознания и полагается на подсознательную интеграцию в некоторой степени случайно собранных данных о пациенте с предварительным опытом, а не на осознанную выработку строго дифференциального диагноза, который получил формальную оценку с использованием конкретных данных из литературы.

Подобные неформальные рассуждения ошибочны, потому что эвристика может вызвать несколько типов бессознательных ошибок (когнитивные ошибки). Исследования показывают, что большей степени медицинские ошибки включают когнитивную ошибку, чем отсутствие знаний или информации.

Виды когнитивных ошибок

Существует много типов когнитивных (логических) ошибок, и хотя очевидно, важнее избегать ошибок, чем правильно их классифицировать после их совершения, знание распространенных когнитивных ошибок может помочь клиницистам распознавать и избегать их.

Грубо, когнитивные ошибки можно классифицировать как связанные:

С ошибочной оценкой отрицательного предсказательного значения (переоценка или недооценка вероятности болезни)

Неспособностью серьезно рассмотреть все соответствующие возможности

Здравый смысл и предостережения

Существует множество различных наименований типов когнитивных ошибок, но, как правило, все они делятся на 2 группы: ошибочная оценка предтестовой вероятности и неспособность серьезно учесть все соответствующие возможности.

Оба типа ошибок могут привести к неправильному тестированию (слишком много или слишком мало) и пропущенным диагнозам.

Ошибка наличия

Когнитивная ошибка представляет собой явление, при котором лечащие врачи выбирают первое, что приходит им в голову. В этом случае фактическая претестовая вероятность заболевания часто недооценивается, поскольку недавний или хорошо запомнившийся опыт придает данному диагнозу более «доступный» статус, приходящий на ум.

Опыт часто приводит к переоценке вероятности, если в памяти есть информация о случае либо драматическом, либо касавшемся пациента с плохими результатами лечения, либо связанном с судебным иском. К примеру, врач, который недавно не поставил диагноз «тромбоэмболия легочной артерии» у здоровой молодой женщины, которая жаловалась на неопределенный дискомфорт в груди, но не было никаких других выявленных симптомов или очевидных факторов риска, может впоследствии переоценивать риски наличия тромбоэмболии легочной артении у подобных больных и быть более склонным к назначению КТ-ангиографии грудной клетки у подобных пациентов, несмотря на низкую вероятность заболевания.

Опыт также может привести к недооценке. Например, младший резидент, который наблюдал только несколько пациентов с болью в груди, у всех из которых, как оказалось, были доброкачественные причины, может провести весьма поверхностною оценку пациента на наличие сердечно-сосудистой или тромбоэмболической болезни даже среди тех групп пациентов, у которых распространенность заболевания довольно высокая.

Ошибка представления

Ошибка представления заключается в том, что лечащие врачи обращают внимание на наличие или отсутствие классических проявлений заболевания, не принимая во внимание распространенность заболевания. К примеру, хотя несколько часов смутного дискомфорта в груди у стройного, спортивного, здорового с виду 60-летнего мужчины, который не имеет никаких известных медицинских проблем и теперь выглядит и чувствует себя хорошо, не соответствует типичному профилю инфаркта миокарда, было бы неразумно исключать такую вероятность, потому что инфаркт миокарда распространен среди мужчин этого возраста и имеет крайне изменчивые проявления. С другой стороны, при внезапно возникших резких болях в груди и боли в спине у 20-летнего здорового человека может возникнуть подозрение на расслоение аневризмы грудной аорты, потому что эти клинические характеристики распространены при расслоении аорты. Когнитивная ошибка не принимает во внимание тот факт, что расслоения аорты возникают исключительно редко у 20-летних, во всем остальном здоровых пациентов без семейного анамнеза подобных событий; это заболевание можно исключить и следует рассматривать другие, более вероятные причины (например, пневмоторакс, плеврит). Ошибка представления также наблюдается, когда врачи не признают, что положительные результаты теста (для любого теста со специфичностью менее 100%) в популяции, где исследуемое заболевание встречается редко, является скорее всего ложноположительным, а не истинно положительным.

Преждевременное закрытие

Преждевременное закрытие - это поспешные выводы. Это является одной из наиболее распространенных ошибок; лечащие врачи быстро ставят диагноз (часто на основании распознавания паттерна), не учитывают другие возможные диагнозы, а также преждевременно прекращают сбор данных. Предполагаемый диагноз часто даже не подтверждается необходимыми методами обследования. Ошибки преждевременного закрытия могут возникать в любом случае, но особенно часто, когда у пациентов наблюдается обострение известных расстройств—например, если женщина с длительно наблюдаемой мигренью поступает с сильной головной болью (а на самом деле имеет новое субарахноидальное кровоизлияние), головную боль можно ошибочно принять за новый приступ мигрени. Вариант преждевременного закрытия наблюдается, когда последующие врачи (например, консультанты по сложным случаям) беспрекословно принимают предыдущий рабочий диагноз без независимого сбора и анализа соответствующих данных. Электронные медицинские записи могут усугубить ошибки преждевременного закрытия, так как до момента их удаления неверные диагнозы уже могут распространиться.

«Якорные ошибки»

«Якорные ошибки» - когда врачи упорно цепляются за первое впечатление, даже если накапливаются несовместимые и противоречивые данные. К примеру, рабочий диагноз острого панкреатита вполне допустим у 60-летнего мужчины, имеющего боль в эпигастрии и тошноту, который сидит, наклонившись вперед, схватившись за живот, и у кого в истории болезни зафиксировано несколько приступов алкогольного панкреатита, во время которых, по его утверждениям, он чувствовал себя подобно тому, как он чувствует себя в настоящее время. Однако, если пациент заявляет, что он не употреблял никакого алкоголя в течение многих лет и имеет нормальные уровни ферментов поджелудочной железы в крови, врачи, которые просто пропускают или оправдывают (например, пациент лжет, его поджелудочная железа дистрофически изменена, лаборатория допустила ошибку) эти противоречивые данные, совершают «якорную ошибку». Клиницисты должны рассматривать противоречивые данные в качестве доказательства необходимости продолжать искать истинный диагноз (острый инфаркт миокарда), вместо того чтобы не принимать во внимание аномалии. В некоторых случаях совершения «якорных ошибок» (например, в случае установления ошибочного диагноза), подтверждающие доказательства могут отсутствовать.

Предвзятость подтверждения

Склонность к подтверждению своей точки зрения представляет собой «снятие сливок», что означает то, что лечащие врачи избирательно принимают клинические данные, подтверждающие желаемую гипотезу, и игнорируют данные, которые этого не делают. Предвзятость подтверждения часто смыкается с «якорной ошибкой», когда клиницист использует подтверждающие данные в поддержку «якорной» гипотезы даже тогда, когда имеются явно противоречивые доказательства. К примеру, врач может упорно цепляться за фрагменты истории болезни пациента, предлагая острый коронарный синдром (ОКС) для подтверждения первоначального подозрения ОКС, даже когда серийный ЭКГ и сердечные ферменты в норме.

Ошибки атрибуции

Ошибки атрибуции включают в себя принятие решений на основании негативными стереотипов, которые могут заставить лечащих врачей игнорировать или свести к минимуму возможность серьезного заболевания. К примеру, врачи могут предположить, что пациент в бессознательном состоянии с запахом алкоголя «просто еще один пьяница», и пропустить гипогликемию, кетоз или внутричерепные травмы, или они могли бы предположить, что явный наркоман с болями в спине просто ищет наркотики, и пропустить эпидуральный абсцесс. Психические больные, у которых развиваются физические расстройства, особенно часто подвергаются ошибкам аттрибуции, потому что они не только могут стать жертвой негативных стереотипов, но они часто описывают свои симптомы неясным, противоречивым или вводящим в заблуждение образом, что заставляет неосторожных клиницистов предположить, что их жалобы по своей природе функциональны.

Аффективная ошибка

Аффективная ошибка подразумевает, что личные чувства (положительные или отрицательные) в отношении пациента влияют на решения. Например, избегать неприятных, но необходимых тестов или обследований из-за привязанности или сочувствия к пациенту (например, избегать гинекологического осмотра и тестирования на ЗППП у религиозного пациента или высокопоставленного руководящего работника или избегать посева крови на тяжело больного пациента, который имеет плохие вены). Точно так же аффективная ошибка включает в себя неспособность провести стандартное обследование у маловероятного пациента (например, сведение к минимуму значимости одышки у пациента, который грубо выражается, или у человека с хронической обструктивной болезнью легких, который продолжает курить).

Факторы риска когнитивной ошибки

Внутренние и внешние факторы могут увеличивать риск когнитивной ошибки.

К внутренним факторам относятся

Медицинские знания, обучение и опыт

Баланс между принятием и неприятием рисков

К внешним факторам относятся

Управление командными ресурсами и давление сверстников

Минимизация когнитивных ошибок

Некоторые конкретные стратегии могут помочь минимизировать когнитивные ошибки. Как правило, после изучения истории болезни и проведения физического обследования клиницисты часто создают рабочий диагноз на основе эвристики. В этот момент можно относительно легко сделать формальную паузу для размышлений, задав несколько вопросов:

Если это нерабочий диагноз, что еще это может быть?

Какие из наиболее опасных вещей это могли быть?

Есть ли доказательства того, что идет вразрез с рабочим диагнозом?

Эти вопросы могут помочь расширить дифференциальную диагностику, чтобы включить вещи, которые, возможно, остались упущенными из-за когнитивных ошибок, и, таким образом, подтолкнуть врачей к поиску дополнительной необходимой информации.

Основные тесты в диагностике анемий

Основной представитель - железодефицитная анемия (ЖДА).

Распространенность железодефицитной анемии в мире по данным ВОЗ (2008 г.)

населения	Prevalence of anaemia Распространенность анемии
населения	Percent Процент
Preschool-age children Дошкольного возраста	47.4 47,4
School-age children Детей школьного возраста	25.4 25,4
Pregnant women Беременные женщины
41.8 41,8
Non-pregnant women Небеременных женщин	30.2 30,2
Men Люди	12.7 12,7
Elderly Пожилым людям	23.9 23,9
Total population Общая численность населения	24.8 24,8

Железодефицитная анемия (ЖДА) - гематологический синдром, характеризующийся нарушением синтеза гемоглобина вследствие дефицита железа и проявляющийся анемией и сидеропенией. Основными причинами ЖДА являются кровопотери и недостаток богатой гемом пищи - мяса и рыбы. Мышечная слабость, нарушения вкуса и обоняния - желание есть необычную пищу, вдыхать обычно неприятные запахи, появление "заед" в углах рта, тусклый цвет волос и их "сечение", затруднение при глотании твердой и жидкой пищи, эпизоды недержания мочи - вот набор жалоб, с которыми появляется женщина средних лет. Далее выясняется, что менструальный цикл нарушен - выявляется гиперполименоррея, нередки геморроидальные кровотечения. В анамнезе упоминаются несколько абортов и повторные роды с кровопотерей. При осмотре видны дистрофические изменения ногтей - они в форме ложек - койлонихии. При железодефицитной анемии, как правило, кожа и слизистые оболочки бледны. При длительной анемии у детей обнаруживаются дефекты иммунитета (частые простудные заболевания, гнойно-воспалительные изменения кожи и т.д.), расстройства памяти, нарушения интеллекта. У взрослых, особенно часто у пожилых, - кардиопатии с недостаточностью кровообращения.

Методы оценки медицинских тестов и биомаркеров

Идентификация исследований точности диагностических тестов (DTA) является сложной задачей. Плохая отчетность и непоследовательная индексация затрудняют поиск, а отсутствие проверенных фильтров означает, что чувствительный поиск часто дает десятки тысяч результатов, которые требуют дальнейшей ручной оценки. Машинное обучение (ML) и краудсорсинг показали свою высокую эффективность при выявлении отчетов о рандомизированных испытаниях, а проект скрининга Cochrane Embase точно идентифицирует более 20 000 отчетов с использованием модели.

Можно выделить две стратегии машинного обучения: 1. Моделирование «активного обучения», в котором отрывки, представленные для ручной оценки, расставлены по приоритетам в зависимости от их прогнозируемой вероятности релевантности; 2. Бинарный классификатор, оцененный посредством перекрестной проверки. . Подход активного обучения обеспечивает запоминание 95% при затратах 30% на проверку вручную, увеличиваясь до 100% после проверки 77%. Бинарный классификатор извлекает статьи DTA с точностью до 95% и точностью 40%; 100% отзыв возможен, но с соответствующей точностью 13%.

Обобщение информации многих исследований с использованием метаанализа становится все более важным, в том числе в области диагностических исследований. Особая проблема метаанализа исследований диагностической точности заключается в том, что в целом чувствительность и специфичность являются второстепенными конечными точками. В исследованиях обе конечные точки коррелированы, и эту корреляцию необходимо учитывать при анализе. Стандартный подход для такого метаанализа - это двумерная логистическая модель случайных эффектов. Альтернативный, более гибкий подход - использовать маргинальные бета-биномиальные распределения для истинных положительных и истинно отрицательных значений, связанных распределениями копул.Однако оба подхода могут привести к проблемам конвергенции.

Чувствительность, специфичность и прогностические значения положительного (PPV) и отрицательного (NPV) теста могут существенно отличаться от средних результатов метаанализа из-за неоднородности. . Таким образом, клиницистам необходимо больше рекомендаций: с учетом метаанализа, может ли тест быть полезным в новых популяциях, и если да, то как результаты тестов должны информировать о вероятности существующего заболевания (для диагностического теста) или будущих неблагоприятных исходов (для прогностический тест)?

Включение решения о ведении пациента в исследования диагностической точности улучшает понимание при сравнении роли диагностических тестов. Включение процесса принятия решений по ведению пациентов может быть обременительным с точки зрения времени, затрачиваемого клиническими специалистами и исследователями. Снижение систематической ошибки за счет скрытия результатов тестов и решений по ведению пациентов между сравниваемыми путями тестирования может быть достигнуто только в том случае, если решения по ведению пациентов принимаются за пределами обычных клинических путей.

Доказательная медицина и клинические руководства

Врачи всегда чувствовали, что их решения были основаны на доказательствах; таким образом, нынешний термин «доказательная медицина» является чем-то неправильным. Однако, для многих клиницистов «доказательство» является часто смутной комбинацией припоминаемых стратегий, эффективных у предыдущих пациентов, советы наставников и коллег и общее впечатление от того «что делается», основанное на случайных журнальных статьях, рефератах, симпозиумах и рекламы. Такая практика приводит к различиям в стратегиях для диагностики и управлению аналогичными состояниями, даже при наличии убедительных доказательств в пользу одной конкретной стратегии в сравнении с другой. Существуют варианты в разных странах, разных регионах, разных больницах и даже внутри отдельных групповых практик. Данные вариации привели к призыву создать более систематический подход к определению наиболее подходящей стратегии для конкретного пациента. Такой подход называется доказательной медициной (ДМ). ДМ строится на обзорах соответствующей медицинской литературы и следует дискретному ряду шагов.

Доказательная медицина (ДМ)

ДM не слепое применение советов, почерпнутых из недавно опубликованных в литературе по проблемам конкретного пациента. Она не подразумевает универсальной модели медицинской помощи. Доказательная медицина требует применения определенных этапов сбора достаточного объема необходимой информации для ответа на четко поставленный вопрос в отношении конкретного пациента. Скорее ДМ требует использования ряда шагов, чтобы собрать достаточно полезной информации для тщательного ответа доказательной медицины, также включает систему ценностей пациента, куда входят такие вещи, как понесенные расходы, религиозные или моральные убеждения пациента и самостоятельность пациента. Применение принципов доказательной медицины обычно включает в себя следующие этапы:

Формулирование клинического вопроса

Сбор доказательств, чтобы ответить на вопрос

Оценка качества и достоверности доказательств

Принятие решения о том, чтобы применить полученные результаты для лечения определенного пациента

Формулирование клинического вопроса

Вопросы должны быть конкретными. Конкретные вопросы скорее всего должны быть рассмотрены в медицинской литературе. Хорошо разработанный вопрос определяет население, вмешательство (диагностический тест, лечение), сравнение (лечение А против лечения B) и результат. «Какой наилучший способ оценки пациента с болью в животе?» не является слишком полезным вопросом для литературного поиска. Лучшим, более конкретным вопросом может быть такой: «Является ли КТ или УЗИ предпочтительнее для диагностики острого аппендицита у 30-летнего мужчины с острой болью внизу живота?»

Сбор доказательств, чтобы ответить на вопрос

Обзор литературы предоставляет широкий выбор соответствующих исследований. Для поиска используют стандартные ресурсы (например, MEDLINE или PubMed для первичных справочных материалов, Кокрановского сообщества [варианты лечения, часто отвечают на конкретные вопросы], ACP Journal Club).

Оценка качества и достоверности доказательств

Не все научные исследования имеют равную ценность. Различные типы исследований имеют различную научную силу и легитимность, и для любого данного типа исследования отдельные примеры часто отличаются по качеству методологии внутренних действий, а также обобщению результатов и применимостью к конкретному пациенту (внешняя валидность).

Уровень достоверности оценивается от 1 до 5 в порядке убывания качества. Формы обучения на каждом уровне несколько изменяются в зависимости от клинического вопроса (например, о диагностике, лечении или экономическом анализе), но обычно включают в себя следующее:

Доказательства 1 уровня (высокое качество): систематические обзоры или мета-анализ рандомизированных контролируемых исследований и высококачественных единичных рандомизированных контролируемых исследований

2 уровень: тщательно спланированные когортные исследования

3 уровень: тщательно отрецензированные исследования с применением методики «случай-контроль»

4 уровень: исследования серий случаев и менее качественные когортные исследования, а также исследования с применением методики «случай-контроль»

Уровень 5: экспертное заключение, основанное не на критической оценке, а на доводах физиологии, доклинических исследований или основополагающих принципов.

Для анализа ДM выбирают самый высокий уровень из всех имеющихся данных. В идеале, имеется значительное количество крупных, хорошо проведенных исследований 1 уровня. Тем не менее, поскольку количество высококачественных, рандомизированных, контролируемых испытаний исчезающе мало по сравнению с числом возможных клинических вопросов, менее надежные свидетельства 4 или 5 уровня очень часто все, что доступно. Низкое качество доказательств не означает, что процессу ДМ не возможно использовать только потому, что сила выводов слабее.

Принятие решения о том, чтобы применить полученные результаты для лечения данного пациента

Поскольку наилучшие доступные доказательства могут быть получены от групп пациентов с характеристиками, отличными от таковых у данного пациента, при применении результатов рандомизированного исследования к конкретному пациенту требуется значительная оценка. Кроме того, должны быть приняты во внимание пожелания пациента относительно агрессивных или инвазивных диагностических исследований и лечения, а также их терпимость к дискомфорту, риски и неопределенности. К примеру, даже если обзор ДМ может убедительно показать выгоду 3 месяца выживаемости от агрессивной химиотерапии при лечении определенной формы рака, пациенты могут иметь расхождения относительно того, предпочитают ли они получить дополнительное время жизни или хотят избежать дополнительных неудобств. Стоимость тестов и лечения может также влиять на принятие решений врачом и пациентом, особенно когда некоторые из вариантов значительно дороже для пациента. Два общих момента, вызывающих обеспокоенность, заключаются в том, что пациенты, которые добровольно участвуют в клинических испытаниях, не являются такими же, как пациенты в реальной клинической практике, и медицинский уход, оказываемый в условиях клинических испытаний, не идентичен реальному уходу в медицинском сообществе.

Ограничения доказательного подхода

В оживленной практике врачи в течение даже одного дня сталкиваются с десятками клинических вопросов. Хотя некоторые из них могут быть предметом существующего обзора ДМ, доступного для ознакомления, большинство из них нет, и подготовка формального анализа ДM слишком затратна по времени, чтобы быть полезной при ответе на немедленный клинический вопрос. Даже когда время не является проблемой, по многим клиническим вопросам отсутствуют соответствующие исследования в медицинской литературе.

Клинические руководства

Клинические руководства стали широко доступными в медицинской практике; многие профессиональные организации уже опубликовали такие руководства. Большинство хорошо продуманных клинических рекомендаций разрабатываются с использованием указанного метода, который включает в себя принципы ДM и консенсус или процесс Дельфи рекомендаций группы экспертов. Хотя Клинические рекомендации могут описывать идеализированную практику, сами по себе они не могут устанавливать стандарт медицинской помощи для конкретного пациента.

Некоторые Клинические рекомендации следуют правилу «если, то» (например, если у пациента наблюдается лихорадка и нейтропения, то следует прописать антибиотики широкого спектра). Более сложные, многоступенчатые правила могут быть оформлены в виде алгоритма. Руководства и алгоритмы, как правило, просты и удобны в использовании, но должны применяться только к тем пациентам, чьи клинические характеристики (например, демографические данные, сопутствующие заболевания, клинические признаки) аналогичны характеристикам группы пациентов, используемых для создания руководства. Кроме того, руководящие принципы не принимают во внимание степень неопределенности, присущей результатам испытаний, вероятность успешного лечения и относительные риски и преимущества каждого курса действий. Для того чтобы включить неопределенность и значимость медицинских результатов в процесс принятия клинических решений, часто лечащим врачам приходится применять принципы количественных или аналитических врачебных решений (см. также Стратегии принятия клинических решений [Clinical Decision-Making Strategies] Стратегия принятия клинического решения Одна из наиболее часто используемых стратегий для медицинского принятия решений отражает научный метод гипотезы поколения с последующей проверкой гипотезы. Диагностические гипотезы принимаются. Прочитайте дополнительные сведения ). Кроме того, многие организации, публикующие руководства, требуют использования данных только рандомизированных исследований, что часто является существенным ограничением.

Читайте также: