EL RETO DESDE DENTRO: PREPARACIÓN, CRONOLOGÍA, DESAFÍOS Perez PRESENTACION RETO… ·...
Transcript of EL RETO DESDE DENTRO: PREPARACIÓN, CRONOLOGÍA, DESAFÍOS Perez PRESENTACION RETO… ·...
EL RETO DESDE DENTRO: PREPARACIÓN,
CRONOLOGÍA, DESAFÍOS
Noviembre 2018
Zaragoza, 10 julio del 2017
Objetivo:
El estudio de tecnologías orientadas a la automatización de parte del trabajo de documentación de contenidos audiovisuales y sonoros de RTVE, tanto en la fase de producción de programas como en la de archivo definitivo en los fondos documentales, además de ayuda en temas de accesibilidad.
Director:Profesor Eduardo Lleida SolanoCon el apoyo del grupo de investigación en tecnologías
del habla y multimedia VIVoLab
Firma cátedra
Análisis de contenido
Reconocimiento de entidades: caras, voces, edificios
Creación de resúmenes de forma automática
Descripción automática de imágenes, planos y secuencias
Áreas de trabajo
• 8 junio 2018• Se liberaron datos para entrenamiento y desarrollo
• 24 septiembre2018• Se liberaron datos de evaluación
• 21 octubre 2018:• Fecha límite de entrega de trabajos
• 31 octubre 2018• Se distribuyeron resultados a participantes
• 21-23 noviembre 2018• Presentación ganadores en Iberspeech 2018
Algunas fechas
VOZ a TEXTO: ¿Qué se ha dicho?
DIARIZACIÓN: ¿Quién habla y cuándo?
DIARIZACIÓN MULTIMODAL:¿Quién habla, cuándo y qué aspecto tiene?
M1 M1 M1F1 F2 F1
Entrada
Salida
Aparece
Aparece y habla
Apartados
La BBDD se utilizó también para la propuesta de evaluación de la Universidad San Pablo-CEU y el grupo AuDIaS de la Universidad Autónoma de Madrid:
Search on Speech Challenge, con dos apartados:
• SPOKEN TERM DETECTION, dónde la entrada al sistema es una lista de palabras en texto
• QUERY-BY-EXAMPLE SPOKEN TERM DETECTION, donde la entrada al sistema es una lista de palabras por voz
En ambos casos la salida del sistema será el conjunto de palabras encontrado con los códigos de tiempo de dónde aparecen
Otras evaluaciones
• Elección cuidadosa de programas• De temática variada• Con dinámicas diferentes:
• Un único Locutor,• Diálogos superpuestos• Debates tranquilos
• Intentando cubrir muchos formatos• Documentales• Tertulias• Noticias• Magazines
• Con distintos acentos y procedencia de hablantes:• De distintas regiones españolas• Latino hablantes
Nuestra base de datos
• Se incorporaron a la BBDD cerca de 550 horas de programación propia: • 493 horas de programas para la fase de entrenamiento
• 40 horas para la de desarrollo
• 35 horas para la evaluación
• Todas ellas subtituladas
• Algunas horas etiquetadas para desarrollo y evaluación de los apartados de diarización
Nuestra base de datos
Todo esto es posible con la colaboración de distintas áreas de RTVE: Accesibilidad, Interactivos, Fondos Documentales, Asesoría Jurídica, etc.
42 horas 38 minutos
Actualidad informativa
69 horas 38 minutos
Análisis noticias y directos de eventos informativos mas destacados
19 horas 08 minutos
Debate con análisis de acontecimientos cotidianos
20H MillenniumAsuntos Públicos
Entrenamiento
11 horas 09 minutos
Documental sobre deportes de riesgo al aire libre
18 horas 03 minutos
Tema de actualidad a través de la mirada coral de varios reporteros
13 horas 02 minutos
Reportajes e información de actualidad sobre las distintas comunidades
Al filo de lo imposible España en comunidadComando actualidad
Entrenamiento
16 horas 19 minutos
Análisis e información centrado en Iberoamérica
96 horas
Tertulia de análisis de las noticias del día
231 horas 58 minutos
Magazine en directo con oferta variada de contenidos
Latinoamérica en 24H La mañanaLa noche en 24H
Entrenamiento
4 horas 51 minutos
Espacio económico
Economía
10 horas 26 minutos
Tertulia de actualidad política y ecónómica
Tertulia
4 horas 54 minutos
Entrevista a personajes de diferentes ámbitos
Entrevista
31 horas 11 minutos
Información meteorológica de España, Europa y América
El tiempo
La tarde en 24H
Entrenamiento
Asuntos Públicos: 8 h 11 min
20H: 9 h 13 min
Comando Actualidad: 7 h 53 m
La noche en 24H: 7 h 26 min
Millennium: 7 h 42 min
La mañana: 1 h 51 min
S2T DIARIZAC D. MULTIM. SoS
Desarrollo
TOTAL: 40 h 26 min
España en comunicad:8 h 9 min
La tarde en 24H, tertulia: 8 h 52 min
Latinoamérica en 24H: 4 h 6 min
Millennium: 1 h 52 min
La mañana: 8 h 5 min
S2T DIARIZAC D. MULTIM. SoS
Evaluación
Al filo de lo imposible:4 h 10 min
TOTAL:TOTAL: 35 h 18 min
Participación
• De varias nacionalidades:• Alemania (2)
• Bélgica (1)
• Francia (2)
• Portugal (1)
• Suiza (1)
• Reino Unido (3)
• Cataluña (1)
• Galicia (1)
• Madrid (4)
• País Vasco (3)
• Valencia (3)
Un total de 27 participantes
• Brasil (1)
• Cuba (1)
• USA (3)
• España (12)
• De Universidades• Centros/grupos tecnológicos
y de investigación• Startup• Empresas consolidadas
•17 Grupos distintos han entregado proyectos
• 7 al apartado 1: Voz a Texto
• 8 al apartado 2: Diarización
• 4 al apartado 3: Diarización multimodal
• 4 al apartado 4: Search on speech
Participación
Muchas gracias