RESUMEN
El rostro humano puede revelar valiosa información sobre el estado saludable o no saludable de las personas. SEMEOTICONS tiene como objetivo explotar el rostro humano como indicador del estado de salud del individuo y traducir el código semiótico del rostro en medidas y descriptores evaluados automáticamente por aplicaciones informáticas. El WP5, en concreto, se centra en el desarrollo de métodos para la evaluación del estrés, la ansiedad y la fatiga basados en el análisis automático de la expresión facial mediante vídeo. En consecuencia, se realiza un análisis completo y exhaustivo de enfoques autónomos, métodos especializados y resultados de investigación informados para el análisis de expresiones faciales, dirigido a la detección de signos que revelan tales estados psicofísicos.
Se analizaron las técnicas de detección, normalización y segmentación de rostros, seguidas de una descripción general completa de las técnicas de extracción de características para las características, que representan signos faciales relacionados con los estados psicofísicos que se examinan. Estos signos están fuertemente vinculados a regiones faciales específicas, incluidos los ojos y la boca (p. ej., contracciones oculares, frecuencia de parpadeo, deformación de la boca). También se pueden extraer datos biométricos adicionales del área facial utilizando datos de video. Dichos signos faciales y bioseñales se pueden detectar con éxito con los métodos existentes informados y analizados en este entregable. La elección de características en términos de métricas define la técnica requerida para su extracción, pero también es una función de la calidad de los datos de imagen/video y las limitaciones de recursos del dominio. De manera similar, la elección del clasificador está correlacionada con la selección de características ya que el desempeño de la clasificación depende tanto de la extracción de características con alta capacidad discriminativa como de la elección de un clasificador apropiado.
El contenido de este entregable proporciona la información necesaria para una selección informada del enfoque más adecuado para WP5. Finalmente, se establecen los requisitos del conjunto de datos experimentales revisando los conjuntos de datos existentes relacionados con el análisis de la expresión facial, y se concluye que ninguno de ellos cubre completamente las necesidades de SEMEOTICONS para el desarrollo de su tubería de análisis, por lo que se establecieron los requisitos iniciales para el conjunto de datos de referencia que registrará el consorcio. .
RESUMEN EJECUTIVO
Hoy en día, la semiótica médica considera el rostro como una importante fuente de evidencia para la manifestación de valiosa información sobre el estado saludable o no saludable de los individuos, producida por la combinación de signos físicos y rasgos expresivos. Los signos físicos habitualmente considerados son el color de la piel y las mucosas, la distribución de la grasa subcutánea, la transpiración, el gesto y la expresión facial, y las alteraciones de las zonas leves y óseas. La idea detrás de SEMEOTICONS es explotar el rostro humano como indicador del estado de salud de un individuo y traducir el código semiótico del rostro en medidas y descriptores evaluados automáticamente por aplicaciones informáticas.
El objetivo es obtener una medida concreta del bienestar de la persona con respecto a la enfermedad cardiovascular. En este contexto, el WP5 se centra en el desarrollo de métodos para la evaluación del estrés, la ansiedad y la fatiga basados en el análisis automático de la expresión facial mediante vídeo. Bajo este alcance, se realiza un análisis completo y exhaustivo de enfoques autónomos, métodos especializados y resultados para el análisis de expresiones faciales, dirigido a la detección de signos que revelan dichos estados psicofísicos. El análisis de la expresión facial comienza con la detección de rostros, una tarea que ha sido abordada minuciosamente por numerosos investigadores. La mayoría de los algoritmos modernos de detección de rostros basados en imágenes se basan en el trabajo de Viola & Jones, un método que usa características similares a las de Haar, calculadas eficientemente usando imágenes integrales. Los avances recientes en la captura de datos 3D y la prevalencia resultante de los datos 3D (rango) simplificaron un poco la tarea de detección de rostros en comparación con la detección de rostros en datos 2D (imagen), ya que la diferenciación entre objetos de primer plano y de fondo es significativamente más fácil, un enfoque que se espera que sea seguido por SEMEOTICONS.
Un paso posterior a menudo necesario para la detección de rostros es la normalización de rostros, que juega un papel importante en el análisis automático de rostros, ya que la variabilidad de la apariencia del rostro en una imagen podría estar dominada por cambios en la postura de la cabeza y las condiciones de iluminación y, por lo tanto, ocultar características de manera efectiva. utilizado para discriminar diferentes sujetos o diferentes articulaciones faciales. Un método prometedor en esa dirección es el método de imagen de autocociente que puede sintetizar una nueva imagen de rostro desde una posición de cámara o condición de iluminación arbitraria. Para evaluar las expresiones faciales para la evaluación del estado psicofísico o el reconocimiento de emociones, es necesario extraer las características faciales de imágenes o videos. Las técnicas basadas en músculos estiman el movimiento de los músculos faciales a partir de videos e imágenes.