Análisis de la capacidad de los clasificadores de procesamiento del lenguaje basados en el modelo latxa-7b: aplicaciones médicas y ejemplo de textos clínicos de cirugía ortopédica y traumatología
Resumen
Objetivo: En este trabajo se analiza la posibilidad de crear un clasificador de textos sintéticos de cirugía ortopédica escritos en euskera adaptado al Modelo de Lenguaje Grande Latxa7b, creado por el Grupo Hitz (Universidad del País Vasco).
Métodos: Se crea una base de datos sintética con 20.000 notas clínicas de pacientes en las que aparecen menciones a patologías musculoesqueléticas. Se desarrolla un clasificador basado en Latxa-7b; se entrena con notas clínicas y finalmente se analiza su rendimiento a la hora de detectar tumores óseos malignos.
Resultados: Se crea un clasificador cuyo rendimiento en los grupos de datos de entrenamiento y test es de 97,7% de precisión, 98,6% exactitud, 94,2% de sensibilidad, 0,99 de área bajo curva y 0,96 de F1.
Conclusiones: El excelente rendimiento del clasificador descrito en este trabajo debería servir de acicate para comenzar a aplicar el Procesamiento de Lenguaje Natural en las historias clínicas digitalizadas que utilizamos en nuestros sistemas sanitarios.
Palabras clave
Texto completo:
PDF (Euskara)Enlaces refback
- No hay ningún enlace refback.
Copyright (c) 2024 Academia de Ciencias Médicas de Bilbao
Patrocinador: