Roberto Valle, egresado del MUVA, y José Miguel Buenaposada, profesor del máster, publican un paper de detección de landmarks faciales en Pattern Recognition Letters #MUVA #PRL #ComputerVision #DeepLearning
El artículo “Cascade of encoder-decoder CNNs with learned coordinates regressor for robust facial landmarks detection” (acceso libre por 50 días al paper aquí) aplica una cascada de dos redes enconder-decoder y una capa especial que aprende a extraer las coordenadas de cada landmark a partir de los heapmaps (un mapa de probabilidad de la posición por cada landmak) que son la salida de la cascada de redes. Esta nueva capa unida a una forma especial de entrenamiento obtienen el estado del arte en una base de datos complicada como WFLW (ver CHR2C).
El código para probar los modelos entrenados de detección de landmark faciales está disponible en github. Si usas el código y te ha parecido útil, por favor, coloca una estrella en github.