Desde que o IBM Watson foi lançado em 2007, a humanidade tem buscado continuamente o desenvolvimento da inteligência artificial (IA) médica. Um sistema de IA médica utilizável e poderoso tem enorme potencial para remodelar todos os aspectos da medicina moderna, permitindo um atendimento mais inteligente, preciso, eficiente e inclusivo, trazendo bem-estar aos profissionais de saúde e pacientes e, assim, melhorando significativamente a saúde humana. Nos últimos 16 anos, embora pesquisadores de IA médica tenham se acumulado em diversas áreas menores, até o momento, eles ainda não conseguiram transformar a ficção científica em realidade.
Este ano, com o desenvolvimento revolucionário da tecnologia de IA, como o ChatGPT, a IA médica fez grandes progressos em muitos aspectos. Avanço sem precedentes na capacidade da IA médica: o periódico Nature lançou continuamente a pesquisa do modelo de linguagem médica de grande porte e do modelo básico de imagem médica; o Google lança o Med-PaLM e seu sucessor, alcançando um nível de especialista nas questões do exame de médico praticante dos EUA. Os principais periódicos acadêmicos se concentrarão em IA médica: a Nature divulga a perspectiva sobre o modelo básico de IA médica geral; Após uma série de revisões de IA na Medicina no início deste ano, o New England Journal of Medicine (NEJM) publicou sua primeira revisão de saúde digital em 30 de novembro e lançou a primeira edição do sub-periódico NEJM NEJM AI em 12 de dezembro. O solo de pouso da IA médica está mais maduro: o sub-periódico JAMA publicou a iniciativa global de compartilhamento de dados de imagens médicas; a Food and Drug Administration (FDA) dos EUA está desenvolvendo diretrizes preliminares para a regulamentação da IA médica.
Abaixo, revisamos o progresso significativo que pesquisadores ao redor do mundo fizeram na direção da IA médica utilizável em 2023
Modelo básico de IA médica
A construção do modelo básico de IA médica é, sem dúvida, o foco de pesquisa mais quente deste ano. Os periódicos Nature publicaram artigos de revisão sobre o modelo básico universal de saúde e o modelo de linguagem ampla de saúde durante o ano. A Medical Image Analysis, o principal periódico do setor, revisou e analisou os desafios e oportunidades da pesquisa de modelos básicos em análise de imagens médicas e propôs o conceito de "pedigree do modelo básico" para resumir e orientar o desenvolvimento da pesquisa de modelos básicos de IA médica. O futuro dos modelos básicos de IA para a saúde está se tornando mais claro. Com base nos exemplos bem-sucedidos de modelos de linguagem ampla, como ChatGPT, usando métodos de pré-treinamento autossupervisionados mais avançados e vasto acúmulo de dados de treinamento, pesquisadores na área de IA médica estão tentando construir 1) modelos básicos específicos da doença, 2) modelos básicos gerais e 3) modelos grandes multimodais que integram uma ampla gama de modos com parâmetros massivos e capacidades superiores.
Modelo de IA para aquisição de dados médicos
Além dos grandes modelos de IA que desempenham um papel importante nas tarefas de análise de dados clínicos a jusante, na aquisição de dados clínicos a montante, a tecnologia representada por modelos de IA generativos também surgiu. O processo, a velocidade e a qualidade da aquisição de dados podem ser significativamente aprimorados por algoritmos de IA.
No início deste ano, a Nature Biomedical Engineering publicou um estudo da Universidade Straits da Turquia que se concentrou no uso de IA generativa para resolver o problema do diagnóstico assistido por imagem patológica em aplicações clínicas. Artefatos em tecido de secção congelada durante a cirurgia são um obstáculo à avaliação diagnóstica rápida. Embora o tecido embebido em formalina e parafina (FFPE) forneça uma amostra de maior qualidade, seu processo de produção é demorado e frequentemente leva de 12 a 48 horas, tornando-o inadequado para uso em cirurgia. A equipe de pesquisa, portanto, propôs um algoritmo chamado AI-FFPE, que pode fazer com que a aparência do tecido na secção congelada seja semelhante à FFPE. O algoritmo corrigiu com sucesso os artefatos de secções congeladas, melhorou a qualidade da imagem e reteve as características clinicamente relevantes ao mesmo tempo. Na validação clínica, o algoritmo AI-FFPE melhora significativamente a precisão diagnóstica dos patologistas para subtipos de tumor, ao mesmo tempo que encurta significativamente o tempo de diagnóstico clínico.
O Cell Reports Medicine relata um trabalho de pesquisa realizado por uma equipe da Terceira Faculdade Clínica da Universidade de Jilin, do Departamento de Radiologia do Hospital Zhongshan afiliado à Universidade de Fudan e da Universidade de Ciência e Tecnologia de Xangai [25]. Este estudo propõe uma estrutura de fusão de reconstrução iterativa e aprendizado profundo de uso geral (DL-IR híbrido) com alta versatilidade e flexibilidade, apresentando excelente desempenho de reconstrução de imagem em ressonância magnética rápida, tomografia computadorizada de baixa dosagem e PET rápido. O algoritmo pode realizar varredura multissequencial de órgão único por ressonância magnética em 100 segundos, reduzir a dose de radiação para apenas 10% da imagem de TC e eliminar ruídos, além de reconstruir pequenas lesões a partir da aquisição de PET com aceleração de 2 a 4 vezes, ao mesmo tempo em que reduz o efeito de artefatos de movimento.
IA médica em colaboração com profissionais da área médica
O rápido desenvolvimento da IA médica também levou os profissionais médicos a considerar e explorar seriamente como colaborar com a IA para melhorar os processos clínicos. Em julho deste ano, a DeepMind e uma equipe de pesquisa multi-institucional propuseram em conjunto um sistema de IA chamado Complementary Driven Clinical Workflow Delay (CoDoC). O processo de diagnóstico é primeiro diagnosticado por um sistema de IA preditivo, depois julgado por outro sistema de IA com base no resultado anterior e, em caso de dúvida, o diagnóstico é finalmente feito por um clínico para melhorar a precisão do diagnóstico e a eficiência do equilíbrio. Quando se trata de rastreamento do câncer de mama, o CoDoC reduziu as taxas de falsos positivos em 25% com a mesma taxa de falsos negativos, enquanto reduziu a carga de trabalho do clínico em 66%, em comparação com o atual processo de "arbitragem de dupla leitura" no Reino Unido. Em termos de classificação de TB, as taxas de falsos positivos foram reduzidas em 5 a 15 por cento com a mesma taxa de falsos negativos em comparação com IA independente e fluxos de trabalho clínicos.
Da mesma forma, Annie Y. Ng et al., da Kheiron Company em Londres, Reino Unido, introduziram leitores de IA adicionais (em cooperação com examinadores humanos) para reexaminar os resultados quando não havia resultados de recall no processo de arbitragem de leitura dupla, o que melhorou o problema de detecção perdida no rastreamento precoce do câncer de mama, e o processo quase não teve falsos positivos. Outro estudo, liderado por uma equipe da Escola Médica McGovern da Universidade do Texas e concluído em quatro centros de AVC, aplicou a tecnologia de IA baseada em angiografia por tomografia computadorizada (ATC) para automatizar a detecção de grandes AVC isquêmicos oclusivos vasculares (AVC isquêmicos oclusivos vasculares). Médicos e radiologistas recebem alertas em tempo real em seus celulares minutos após a conclusão da imagem de TC, notificando-os da possível presença de AVC isquêmico agudo. Este processo de IA melhora os fluxos de trabalho hospitalares para AVC isquêmico agudo, reduzindo o tempo da porta à virilha da admissão ao tratamento e fornecendo oportunidades para resgate bem-sucedido. As descobertas foram publicadas no JAMA Neurology.
Um modelo de assistência médica de IA para benefício universal
2023 também verá muitos trabalhos de qualidade que usam IA médica para encontrar características invisíveis ao olho humano a partir de dados mais facilmente disponíveis, permitindo diagnóstico universal e triagem precoce em larga escala. No início do ano, a Nature Medicine publicou estudos realizados pelo Zhongshan Eye Center da Universidade Sun Yat-sen e pelo Segundo Hospital Afiliado da Universidade Médica de Fujian. Usando smartphones como terminais de aplicativos, eles usaram imagens de vídeo semelhantes a desenhos animados para induzir o olhar das crianças e registrar o comportamento do olhar e as características faciais das crianças, e analisaram modelos anormais usando modelos de aprendizado profundo para identificar com sucesso 16 doenças oculares, incluindo catarata congênita, ptose congênita e glaucoma congênito, com uma precisão média de triagem de mais de 85%. Isso fornece um meio técnico eficaz e fácil de popularizar para a triagem precoce em larga escala de deficiência visual infantil e doenças oculares relacionadas.
No final do ano, a Nature Medicine divulgou um trabalho realizado por mais de 10 instituições médicas e de pesquisa em todo o mundo, incluindo o Instituto de Doenças Pancreáticas de Xangai e o Primeiro Hospital Afiliado da Universidade de Zhejiang. O autor aplicou IA ao rastreamento de câncer de pâncreas em pessoas assintomáticas em centros de exame físico, hospitais, etc., para detectar características da lesão em imagens de tomografia computadorizada simples que são difíceis de detectar a olho nu, a fim de alcançar uma detecção precoce eficiente e não invasiva do câncer de pâncreas. Ao revisar dados de mais de 20.000 pacientes, o modelo também identificou 31 casos de lesões clinicamente não detectadas, o que melhorou significativamente os desfechos clínicos.
Compartilhamento de dados médicos
Em 2023, muitos outros mecanismos perfeitos de compartilhamento de dados e casos de sucesso surgiram ao redor do mundo, garantindo cooperação multicêntrica e abertura de dados sob a premissa de proteger a privacidade e a segurança dos dados.
Primeiro, com a ajuda da própria tecnologia de IA, pesquisadores de IA contribuíram para o compartilhamento de dados médicos. Qi Chang e outros da Universidade Rutgers, nos Estados Unidos, publicaram um artigo na Nature Communications, propondo uma estrutura de aprendizagem federal (DSL) baseada em redes adversárias sintéticas distribuídas, que usa IA generativa para treinar os dados gerados específicos de multicentros e, em seguida, substitui os dados reais de multicentros pelos dados gerados. Garanta o treinamento de IA com base em big data multicêntrico, protegendo a privacidade dos dados. A mesma equipe também tornou público um conjunto de dados de imagens patológicas geradas e suas anotações correspondentes. O modelo de segmentação treinado no conjunto de dados gerado pode alcançar resultados semelhantes aos dos dados reais.
A equipe de Dai Qionghai, da Universidade Tsinghua, publicou um artigo sobre a npj Digital Health, propondo o Relay Learning, que utiliza big data multisite para treinar modelos de IA sob a premissa de soberania de dados local e sem conexão de rede entre sites. Ele equilibra as preocupações com a segurança e privacidade dos dados com a busca pelo desempenho da IA. Posteriormente, a mesma equipe desenvolveu e validou em conjunto o CAIMEN, um sistema de diagnóstico de tumores panmediastinais por TC de tórax baseado em aprendizado federal, em colaboração com o Primeiro Hospital Afiliado da Universidade Médica de Guangzhou e 24 hospitais em todo o país. O sistema, que pode ser aplicado a 12 tumores mediastinais comuns, alcançou uma precisão 44,9% maior quando usado isoladamente do que quando usado apenas por especialistas humanos, e uma precisão de diagnóstico 19% maior quando especialistas humanos foram auxiliados por ele.
Por outro lado, várias iniciativas estão em andamento para construir conjuntos de dados médicos seguros, globais e em larga escala. Em novembro de 2023, Agustina Saenz e outros do Departamento de Informática Biomédica da Harvard Medical School publicaram online na Lancet Digital Health uma estrutura global para compartilhamento de dados de imagens médicas chamada Artificial Intelligence Data for All Healthcare (MAIDA). Eles estão trabalhando com organizações de saúde em todo o mundo para fornecer orientação abrangente sobre coleta e desidentificação de dados, usando o modelo US Federal Demonstration Partner (FDP) para padronizar o compartilhamento de dados. Eles planejam liberar gradualmente conjuntos de dados coletados em diferentes regiões e ambientes clínicos ao redor do mundo. O primeiro conjunto de dados deve ser lançado no início de 2024, com mais por vir à medida que a parceria se expande. O projeto é uma tentativa importante de construir um conjunto global, em larga escala e diversificado de dados de IA disponíveis publicamente.
Na esteira da proposta, o UK Biobank deu o exemplo. O UK Biobank divulgou novos dados em 30 de novembro a partir do sequenciamento completo do genoma de seus 500.000 participantes. O banco de dados, que publica a sequência completa do genoma de cada um dos 500.000 voluntários britânicos, é o maior banco de dados completo de genoma humano do mundo. Pesquisadores em todo o mundo podem solicitar acesso a esses dados desidentificados e usá-los para investigar a base genética da saúde e da doença. Dados genéticos sempre foram altamente sensíveis para verificação no passado, e esta conquista histórica do UK Biobank prova que é possível construir um banco de dados global aberto e sem privacidade em larga escala. Com esta tecnologia e banco de dados, a IA médica está fadada a inaugurar o próximo salto.
Verificação e Avaliação de IA Médica
Comparado ao rápido desenvolvimento da própria tecnologia de IA médica, o desenvolvimento da verificação e avaliação da IA médica é ligeiramente lento. A validação e a avaliação no campo geral da IA frequentemente ignoram as reais necessidades de médicos e pacientes para IA. Os ensaios clínicos randomizados controlados tradicionais são muito trabalhosos para acompanhar a rápida iteração das ferramentas de IA. Aprimorar o sistema de verificação e avaliação adequado para ferramentas de IA médica o mais rápido possível é o mais importante para promover a IA médica e realmente dar um salto na pesquisa e no desenvolvimento para a prática clínica.
No artigo de pesquisa do Google sobre Med-PaLM, publicado na Nature, a equipe também publicou o benchmark de avaliação MultiMedQA, usado para avaliar a capacidade de modelos de linguagem de grande porte de adquirir conhecimento clínico. O benchmark combina seis conjuntos de dados de perguntas e respostas médicas profissionais existentes, abrangendo conhecimento médico profissional, pesquisa e outros aspectos, bem como um conjunto de dados de banco de dados de perguntas médicas de busca online, considerando perguntas e respostas online entre médico e paciente, buscando treinar a IA para que ela se torne um médico qualificado sob diversos aspectos. Além disso, a equipe propõe uma estrutura baseada na avaliação humana que leva em consideração múltiplas dimensões de fato, compreensão, raciocínio e possível viés. Este é um dos esforços de pesquisa mais representativos para avaliar a IA na área da saúde publicados este ano.
No entanto, o fato de modelos de linguagem de grande porte apresentarem um alto nível de codificação de conhecimento clínico significa que eles são competentes para tarefas clínicas do mundo real? Assim como um estudante de medicina que passa no exame de médico profissional com nota máxima ainda está longe de ser um médico chefe solo, os critérios de avaliação propostos pelo Google podem não ser uma resposta perfeita para o tópico de avaliação de IA médica para modelos de IA. Já em 2021 e 2022, pesquisadores propuseram diretrizes de relatórios como Decid-AI, SPIRIT-AI e INTRPRT, na esperança de orientar o desenvolvimento inicial e a validação de IA médica sob a condição de considerar fatores como praticidade clínica, segurança, fatores humanos e transparência/interpretabilidade. Recentemente, a revista Nature Medicine publicou um estudo de pesquisadores da Universidade de Oxford e da Universidade de Stanford sobre o uso de "validação externa" ou "validação local recorrente" para validar ferramentas de IA.
A natureza imparcial das ferramentas de IA também é uma importante direção de avaliação que recebeu atenção este ano em artigos da Science e do NEJM. A IA frequentemente apresenta viés por se limitar a dados de treinamento. Esse viés pode refletir desigualdade social, que evolui para discriminação algorítmica. Os Institutos Nacionais de Saúde (NIH) lançaram recentemente a iniciativa Bridge2AI, com custo estimado em US$ 130 milhões, para construir conjuntos de dados diversos (em linha com os objetivos da iniciativa MAIDA mencionados acima) que podem ser usados para validar a imparcialidade das ferramentas de IA médica. Esses aspectos não são considerados pelo MultiMedQA. A questão de como mensurar e validar modelos de IA médica ainda precisa de discussão ampla e aprofundada.
Em janeiro, a Nature Medicine publicou um artigo de opinião intitulado “A Próxima Geração da Medicina Baseada em Evidências”, de Vivek Subbiah, do MD Anderson Cancer Center da Universidade do Texas, revisando as limitações dos ensaios clínicos expostas no contexto da pandemia de COVID-19 e apontando a contradição entre inovação e adesão ao processo de pesquisa clínica. Por fim, aponta para o futuro da reestruturação dos ensaios clínicos – a próxima geração de ensaios clínicos usando inteligência artificial, ou seja, o uso de inteligência artificial a partir de um grande número de dados históricos de pesquisa, dados do mundo real, dados clínicos multimodais e dados de dispositivos vestíveis para encontrar evidências-chave. Isso significa que a tecnologia de IA e os processos de validação clínica de IA podem se reforçar mutuamente e coevoluir no futuro? Esta é a questão em aberto e instigante de 2023.
Regulamentação da IA Médica
O avanço da tecnologia de IA também representa desafios para a regulamentação da IA, e formuladores de políticas em todo o mundo estão respondendo com cautela e cuidado. Em 2019, a FDA publicou pela primeira vez uma Proposta de Estrutura Regulatória para Mudanças de Software em Dispositivos Médicos de Inteligência Artificial (Rascunho para Discussão), detalhando sua abordagem potencial para a revisão pré-comercialização de modificações de software baseadas em IA e aprendizado de máquina. Em 2021, a FDA propôs o “Plano de Ação para Software Baseado em Inteligência Artificial/Aprendizado de Máquina como Dispositivo Médico”, que esclareceu cinco medidas regulatórias médicas específicas de IA. Este ano, a FDA reeditou a Submissão Pré-comercialização para Recursos de Software de Dispositivo para fornecer informações sobre recomendações de submissão pré-comercialização para a avaliação da FDA da segurança e eficácia dos recursos de software do dispositivo, incluindo alguns recursos de dispositivos de software que usam modelos de aprendizado de máquina treinados por meio de métodos de aprendizado de máquina. A política regulatória da FDA evoluiu de uma proposta inicial para uma orientação prática.
Após a publicação do Espaço Europeu de Dados de Saúde em julho do ano passado, a UE promulgou novamente a Lei de Inteligência Artificial. A primeira visa fazer o melhor uso dos dados de saúde para fornecer cuidados de saúde de alta qualidade, reduzir as desigualdades e apoiar dados para prevenção, diagnóstico, tratamento, inovação científica, tomada de decisões e legislação, garantindo ao mesmo tempo que os cidadãos da UE tenham maior controle sobre seus dados pessoais de saúde. A segunda deixa claro que o sistema de diagnóstico médico é um sistema de IA de alto risco e precisa adotar supervisão forte e direcionada, supervisão de todo o ciclo de vida e supervisão de pré-avaliação. A Agência Europeia de Medicamentos (EMA) publicou um Projeto de Documento de Reflexão sobre o uso da IA para apoiar o desenvolvimento, a regulamentação e o uso de medicamentos, com ênfase na melhoria da credibilidade da IA para garantir a segurança do paciente e a integridade dos resultados da pesquisa clínica. No geral, a abordagem regulatória da UE está gradualmente tomando forma, e os detalhes finais da implementação podem ser mais detalhados e rigorosos. Em forte contraste com a regulamentação rigorosa da UE, o projeto regulatório de IA do Reino Unido deixa claro que o governo planeja adotar uma abordagem branda e não promulgar novos projetos de lei ou criar novos reguladores por enquanto.
Na China, o Centro de Revisão Técnica de Dispositivos Médicos (NMPA) da Administração Nacional de Produtos Médicos emitiu anteriormente documentos como “Pontos de Revisão de Software de Decisão Assistida por Aprendizado Profundo”, “Princípios Orientadores para a Revisão de Registro de Dispositivos Médicos de Inteligência Artificial (Rascunho para Comentários)” e “Circular sobre Princípios Orientadores para a Classificação e Definição de Produtos de Software Médico de Inteligência Artificial (nº 47 em 2021)”. Este ano, o "Resumo dos primeiros resultados da classificação de produtos de dispositivos médicos em 2023" foi lançado novamente. Esta série de documentos torna a definição, classificação e regulamentação de produtos de software médico de inteligência artificial mais clara e fácil de operar, e fornece orientações claras para o posicionamento de produtos e estratégias de registro de diversas empresas do setor. Esses documentos fornecem uma estrutura e decisões de gestão para a regulamentação científica de dispositivos médicos de IA. Vale a pena aguardar que a agenda da Conferência de Inteligência Artificial Médica da China, realizada em Hangzhou de 21 a 23 de dezembro, crie um fórum especial sobre governança médica digital e desenvolvimento de alta qualidade de hospitais públicos e um fórum de desenvolvimento da indústria de padronização de tecnologia de testes e avaliação de dispositivos médicos de inteligência artificial. Naquela ocasião, autoridades da Comissão Nacional de Desenvolvimento e Reforma e da NMPA participarão da reunião e poderão divulgar novas informações.
Conclusão
Em 2023, a IA médica começou a se integrar a todo o processo médico, abrangendo coleta, fusão, análise, diagnóstico e tratamento de dados hospitalares e triagem comunitária, colaborando organicamente com profissionais médicos/de controle de doenças, demonstrando o potencial de trazer bem-estar à saúde humana. Pesquisas úteis em IA médica estão começando a surgir. No futuro, o progresso da IA médica não depende apenas do desenvolvimento tecnológico em si, mas também da plena cooperação da indústria, universidades e pesquisadores médicos, além do apoio de formuladores de políticas e reguladores. Essa colaboração entre domínios é a chave para alcançar serviços médicos integrados à IA e certamente promoverá o desenvolvimento da saúde humana.
Horário de publicação: 30 de dezembro de 2023




