Asistentes de voz pueden ser manipulados con sonidos invisibles

Especialistas en ciberseguridad descubrieron una técnica capaz de manipular asistentes de voz y chatbots mediante sonidos imperceptibles para humanos ocultos en audios cotidianos.
Un grupo de investigadores reveló que asistentes virtuales y plataformas de inteligencia artificial pueden ser controlados mediante señales de audio invisibles para el oído humano. La técnica, llamada AudioHijack, logró altas tasas de éxito en pruebas realizadas sobre modelos de IA de audio utilizados en sistemas comerciales y plataformas conversacionales.
Palabras clave: inteligencia artificial, ciberseguridad, asistentes de voz, chatbots, AudioHijack
AudioHijack expone nuevas fallas en asistentes de voz
Especialistas de la Universidad de Zhejiang, la Universidad Nacional de Singapur y la Universidad Tecnológica de Nanyang desarrollaron una técnica denominada AudioHijack, capaz de insertar órdenes ocultas en archivos de audio comunes como pódcast, videos de YouTube o llamadas de voz.
Según los investigadores, estas señales sonoras son imperceptibles para el oído humano, pero pueden ser interpretadas por modelos de inteligencia artificial basados en audio, provocando acciones no autorizadas dentro de asistentes virtuales y chatbots.
El hallazgo fue presentado durante el Simposio de Seguridad y Privacidad del IEEE en San Francisco, donde se explicó que el método requiere apenas 30 minutos de entrenamiento para generar señales reutilizables en distintos contextos y plataformas.
Modelos de IA muestran altas tasas de vulnerabilidad
Durante las pruebas, el equipo evaluó la técnica sobre 13 modelos abiertos de inteligencia artificial, entre ellos Qwen2-Audio, GLM-4-Voice, Phi-4-Multimodal y Kimi-Audio.
Los resultados mostraron tasas de éxito de entre 79% y 96%, evidenciando que gran parte de los sistemas actuales no cuenta con mecanismos suficientes para detectar este tipo de manipulación.
Los expertos señalaron que el problema también afecta a plataformas comerciales que utilizan arquitecturas similares, incluyendo servicios empresariales respaldados por tecnologías de código abierto.
El riesgo aumenta con asistentes más autónomos
A diferencia de ataques anteriores enfocados únicamente en reconocimiento de voz, AudioHijack aprovecha capacidades avanzadas de razonamiento presentes en modelos modernos de IA.
Esto significa que un asistente comprometido podría ejecutar tareas complejas como enviar mensajes, descargar archivos, navegar por internet o acceder a información sensible sin autorización del usuario.
Los investigadores advirtieron que el crecimiento de asistentes virtuales con mayor autonomía incrementa el riesgo para usuarios particulares y empresas, especialmente en entornos donde la IA tiene acceso a datos corporativos o funciones críticas.
Defensas actuales todavía son insuficientes
El estudio también concluyó que las estrategias de seguridad actuales tienen una eficacia limitada frente a este tipo de amenazas.
De acuerdo con los especialistas, medidas como la verificación de instrucciones o el filtrado de comandos apenas reducen la efectividad del ataque en un 7%, debido a que los modelos tienen dificultades para distinguir entre órdenes legítimas y señales maliciosas ocultas.
La investigación plantea nuevos desafíos para la industria tecnológica y reabre el debate sobre la seguridad de los asistentes de voz impulsados por inteligencia artificial.
TECNOLOGÍA: Atlas, el robot humanoide que ya practica fútbol rumbo al Mundial 2026
Atlas, el robot humanoide de Boston Dynamics, entrena fútbol, realiza amagues y celebra goles mientras la tecnología también transforma el Mundial FIFA 2026. El robot humanoide Atlas, desarrollado por Boston Dynamics y Hyundai, volvió a captar la atención mundial tras -- leer más
Noticias del tema