Inicio › Traductor de entrevistas en tiempo real › Subtítulos en vivo para Zoom y Google Meet
Subtítulos en vivo para Zoom y Google Meet — escritorio, prueba gratis
Tanto Zoom como Google Meet llevan años ofreciendo subtítulos integrados, y sobre el papel eso debería resolver el problema de los subtítulos en vivo. En la práctica, cualquiera cuya primera lengua no sea el inglés conoce los límites en el segundo en que intenta apoyarse en ellos para una entrevista de verdad: los subtítulos son solo en inglés, la precisión se desploma con el habla acentuada, y no puede mover la tira de subtítulos para que no estorbe el recuadro de vídeo del ponente. Una app de escritorio de subtítulos en vivo dedicada para Zoom y Google Meet resuelve los tres problemas ejecutándose fuera del cliente de videoconferencia y capturando el audio a nivel del sistema operativo.
Esta guía recorre los límites de los subtítulos integrados, explica la diferencia entre la captura del audio del sistema y las API de accesibilidad específicas de cada plataforma, lista los idiomas soportados y muestra los pasos exactos de configuración en macOS y Windows.
Por qué los subtítulos integrados no bastan
La «Transcripción en vivo» de Zoom y la función de «Subtítulos» de Google Meet tienen tres límites estructurales que ninguna cantidad de pulido de la interfaz puede arreglar.
- Inglés primero y carencias de traducción. Los subtítulos de Zoom son solo en inglés en el plan gratuito y en la mayoría de los planes de pago. Los subtítulos traducidos existen en el plan Business+ pero requieren que tanto el anfitrión como el participante estén en el mismo plan de pago — inútil si se entrevista en una empresa que no lo habilitó. Los subtítulos traducidos de Google Meet solo soportan un puñado de pares de idiomas y a menudo se saltan frases enteras con entradas acentuadas.
- Colapso por acento. Tanto Zoom como Meet se entrenaron principalmente con inglés estadounidense. El inglés con acento indio, español, eslavo, chino y francés degrada la precisión rápidamente, a menudo hasta el punto en que la tira de subtítulos distrae más de lo que ayuda.
- Interfaz fija. La tira de subtítulos vive dentro de la ventana de Zoom o Meet. No puede moverla junto a la cara del entrevistador, no puede fijarla en un segundo monitor, no puede mantener un historial deslizante de las últimas cinco frases. Una vez que una línea se desplaza, desaparece.
Una app de escritorio de subtítulos esquiva las tres cosas. Oye la llamada directamente desde la salida de audio de su ordenador, ejecuta un modelo de ASR de mayor precisión que no estaba limitado por el sistema de planes de Zoom, traduce a los cinco idiomas principales con los que entregamos el producto, y pone el resultado en una pequeña ventana que puede arrastrar a donde la necesite.
Captura del audio del sistema vs la API de accesibilidad
Hay dos formas en que una app de terceros puede «oír» una videollamada, y la diferencia importa tanto para la privacidad como para la practicidad.
El enfoque de la API de accesibilidad. Es lo que suelen usar las extensiones de navegador y los plugins del marketplace de Zoom. La app le pide a Zoom o Meet que comparta su flujo de subtítulos a través de una API oficial, y eso requiere o bien que un administrador de Zoom apruebe un plugin o bien que el anfitrión de la reunión habilite los subtítulos para todos. En una entrevista, casi nunca controla los ajustes del anfitrión, y un plugin del marketplace sería visible para el equipo de TI de la empresa si audita las instalaciones.
El enfoque de la captura del audio del sistema. Es lo que usa Quest2Offer. La app de escritorio graba el audio que su sistema operativo está a punto de enviar a sus altavoces o auriculares — en macOS a través del tap de audio de ScreenCaptureKit (desde macOS 13), en Windows a través del loopback de WASAPI. El cliente de Zoom o Meet no es consciente de que ningún otro proceso esté leyendo el audio, porque no lo está: el propio sistema operativo lo suministra. No hay plugin, no hay ficha en el marketplace, no hay aprobación de TI.
El efecto práctico es que el traductor funciona de la misma forma en todas las apps de videoconferencia, incluidas las que no tienen ningún ecosistema de plugins — Webex, Around, Whereby, huddles de Discord, HireVue, CodeSignal Interview, incluso un softphone ejecutando una entrevista telefónica.
Soporte multiidioma
Quest2Offer traduce entre inglés, ruso, alemán, francés y español en tiempo real. La matriz completa son veinte pares (cada una de las cinco lenguas de origen a cada una de las cuatro lenguas de destino), y el mismo modelo Qwen3.5 autoalojado maneja todas las direcciones. En la práctica, la configuración más común para nuestros usuarios es:
- Inglés → ruso, español, alemán o francés — hablantes no nativos entrevistándose en empresas internacionales cuya lengua de entrevista es el inglés.
- Alemán → inglés o ruso — candidatos entrevistándose en alemán en una empresa de Berlín, Múnich o Viena.
- Español → inglés — candidatos latinoamericanos entrevistándose en remoto con equipos con sede en EE. UU.
Como el modelo de traducción es el mismo que usa el resto de Quest2Offer, se beneficia del contexto de su currículum y de la descripción de la vacante. El vocabulario técnico — «shard the read replica», «feature flag rollout», «blue-green deployment» — sale como el término equivalente que los ingenieros de su lengua de destino usan realmente, no como una traducción literal palabra por palabra.
Recorrido de configuración: macOS y Windows
La configuración es la misma para Zoom y Google Meet porque al traductor no le importa qué app produce el audio. Todo el flujo lleva unos tres minutos la primera vez y cero segundos cada vez después.
- Descargue la app de escritorio. Elija macOS o Windows en la sección de descarga de escritorio de la página de inicio. Ambas builds están firmadas; macOS le pedirá que la permita en el primer arranque.
- Inicie sesión. Use la misma cuenta de Quest2Offer que usa en la web. Si aún no ha creado una, la app se ofrecerá a hacerlo en línea.
- Conceda permisos de audio. En macOS, el sistema le pide permitir la grabación de Pantalla y Audio del sistema (es lo que ScreenCaptureKit necesita). En Windows, no se necesita ningún permiso — el loopback de WASAPI funciona de fábrica.
- Elija la lengua de origen y de destino. En la pequeña ventana del traductor, fije la lengua de origen (la que hablará el entrevistador) y la lengua de destino (su lengua materna).
- Inicie su llamada de Zoom o Meet. Abra la llamada con normalidad, en el cliente de escritorio o en el navegador. El traductor capta el audio en el momento en que Zoom o Meet empieza a reproducirlo.
- Coloque la ventana. Arrastre la ventana del traductor justo debajo del recuadro de vídeo del ponente, o a un segundo monitor si tiene uno. Permanece siempre visible para que no desaparezca detrás de Zoom.
Esa es toda la configuración. El traductor funciona durante toda la llamada y se detiene cuando lo cierra. Nada se graba; lo único que persiste es el recuento de segundos consumidos contra la cuota de su plan.
Preguntas habituales antes de decidirse
La mayoría de las preguntas que la gente hace antes de descargar caen en los mismos cinco grupos. El resto las respondemos en las preguntas frecuentes de abajo.
- ¿Ralentiza mi ordenador? No. El trabajo pesado — ASR y traducción — corre en nuestras GPU, no en las suyas. La app de escritorio es un cliente ligero que transmite PCM mono a 16 kHz por un websocket y renderiza texto; ambos son insignificantes en cualquier portátil de los últimos siete años.
- ¿Verá el entrevistador que lo estoy usando? No. El traductor es una ventana aparte en su máquina. No aparece en la lista de pantalla compartida de Zoom o Meet a menos que comparta explícitamente esa ventana concreta.
- ¿Puedo usarlo durante entrevistas en plataformas de contratación como HireVue? Sí. HireVue, CodeSignal Interview, Karat y plataformas similares corren en el navegador y producen audio del sistema como cualquier otra pestaña. El traductor funciona con todas ellas.
- ¿Y para las rondas de práctica, no solo la entrevista real? La misma app de escritorio funciona para practicar. Para una práctica deliberada y puntuada en su lengua materna con feedback de IA, vea las mock interviews con IA.
- ¿Hay un plan gratuito? Sí. El plan gratuito incluye un presupuesto inicial de minutos de traducción al mes para que pueda probarlo en una llamada real antes de decidirse por Plus o Pro.
Preguntas frecuentes
¿Por qué no bastan los subtítulos integrados de Zoom?
Son solo en inglés en la mayoría de los planes, no traducen a su lengua materna y se degradan rápido con el habla acentuada. Además solo se muestran en la ventana de Zoom — no puede reposicionarlos ni guardarlos.
¿Necesito instalar un plugin de Zoom u obtener la aprobación de un administrador?
No. Quest2Offer captura el audio del sistema a nivel del sistema operativo, así que no necesita un plugin del marketplace de Zoom ni ningún permiso dentro del cliente de Zoom o Meet.
¿Qué idiomas están soportados?
Quest2Offer traduce entre inglés, ruso, alemán, francés y español en tiempo real. El mismo modelo maneja bien el inglés acentuado, incluidos los acentos indio, español, eslavo, chino y francés.
¿Funciona con Google Meet en el navegador?
Sí. Google Meet corre en el navegador, pero la captura del audio del sistema ve el audio igualmente. El traductor funciona con Meet en Chrome, Edge, Brave, Arc y cualquier otro navegador basado en Chromium.
¿Interfiere con la llamada o con la calidad del audio?
No. El traductor es un oyente pasivo sobre el loopback del audio del sistema. La llamada de Zoom o Meet no se ve afectada y no hay impacto en la calidad del audio en ninguno de los dos lados de la conversación.
Para el contexto más amplio sobre qué es realmente un traductor de entrevistas en tiempo real y quién lo necesita, vea la guía principal del clúster. Si su preocupación tiene más que ver con entender el inglés rápido y acentuado que con la traducción en sí, vea la ayuda para entrevistas en inglés para hablantes no nativos.
macOS y Windows · funciona en Zoom, Meet, Teams, Webex, HireVue · sin plugin, sin aprobación de TI