HAIKO lidera proyecto de Transcripción y Traducción automáticas usando Inteligencia Artificial

PROYECTO STREAMS – Live Streaming with Automated Multilingual Subtitling

Siguiendo con nuestra estrategia en HAIKO Technologies de ser un referente en los Servicios y Soluciones basados en Inteligencia Artificial, desde nuestro departamento de I+D hemos formado parte del consorcio del proyecto STREAMS – Live Streaming with Automated Multilingual Subtitling, dentro del ámbito del programa HAZITEK de SPRI, durante las anualidades 2021, 2022 y 2023.

HAIKO ha actuado como líder de dicho proyecto en un consorcio formado por las empresas GOIENA, JARKATZA, MIXER, MONDRAGON LINGUA, NOTICIAS DE GIPUZKOA y ONDA VASCA, con la colaboración técnica del centro de investigación Fundación Vicomtech miembro de la Basque Research and Technology Alliance (BRTA) y de la RVCTI.

En la ejecución del proyecto se han utilizado tecnologías de inteligencia artificial, machine learning, redes neuronales y Masked Language Models.
Como resultados tangibles del proyecto se ha implementado una solución tecnológica con las siguientes capacidades:

  • Transcripción de contenidos de audio y vídeo en los idiomas: castellano, euskera, inglés y francés.
  • Traducción automática entre los mencionados idiomas.
  • Generación automática de subtítulos multi lenguaje
  • Síntesis de voz, o creación de Audio a partir de texto utilizando modelos de Inteligencia Artificial


Casos de uso

Los resultados del proyecto permitirán a las empresas miembros del consorcio generar nuevas oportunidades de negocio, en el caso de HAIKO Technologies el avance tecnológico que supone STREAMS nos permitirá integrar la Transcripción («Speech-To-Text») y Traducción automática en Entornos corporativos, para casos de uso como:

  • Grabación y análisis de reuniones.
  • Atención al cliente.
  • Atención y Soporte a equipos internos.
  • Sistemas de gestión documental.
  • Formación interna y externa.
  • Procesos de on-boarding.
  • Capacitación de equipos en entornos multi culturales y distribuidos geográficamente.
  • Despliegue de servicios multilingües.
  • Colectivos con Discapacidad visual y/o cognitiva.


Privacidad y seguridad

STREAMS nos da posibilidad de ejecutar dichos servicios en entornos privados («on-premise»), sin exponer los datos de nuestros clientes en proveedores externos de servicios cloud, asegurando con ello la privacidad del uso de los contenidos.


Publicaciones científicas

Como fruto del trabajo del equipo científico, los investigadores  David Ponce, Thierry Etchegoyhen y Victor Ruiz, miembros de la Fundación Vicomtech, Basque Research and Technology Alliance (BRTA) y de la Universidad del País Vasco UPV / EHU, han llevado a cabo la siguiente publicación: Unsupervised Subtitle Segmentation with Masked Language Models.

En ella se describe un novedoso método no supervisado de segmentación de subtítulos, basado en Masked Language Models previamente entrenados, en los que los finales de línea y los saltos de subtítulo se predicen en función de la probabilidad de que se produzcan signos de puntuación en los puntos de segmentación candidatos.

El método obtuvo resultados competitivos en términos de precisión de segmentación en todas las métricas, al tiempo que preservaba íntegramente el texto original y cumplía las restricciones de longitud. Aunque los modelos supervisados entrenados con datos del propio dominio y con acceso a la información de audio de origen pueden proporcionar una mayor precisión de segmentación, este método es altamente portátil en todos los idiomas y dominios y puede constituir una solución robusta para la segmentación de subtítulos.

Aquí se puede encontrar un vídeo demostrativo de dicha tecnología:

Toda la información sobre dicha publicación científica en: https://aclanthology.org/2023.acl-short.67/

Te puede interesar:

Estamos encantados de descubrir un logro revolucionario que está ampliando los límites de lo que es posible en inteligencia artificial. El equipo de Groq ha

En un entorno empresarial cada vez más digitalizado, el software desempeña un papel fundamental en el éxito de las organizaciones. Desde aplicaciones móviles hasta sistemas

En la actualidad, la IA se ha convertido en un componente esencial para impulsar la innovación y el progreso en diversas industrias. En este artículo,

En la actualidad, la seguridad de los datos y la protección de los activos digitales son preocupaciones clave para las organizaciones en todos los sectores.

Somos Haiko

Somos Haiko

Casos de éxito

Actualidad / Blog

Contacto