Deepfake
¿Qué es Deepfake?
DeepfakeAudio, imagen o vídeo sintético generado por IA que representa de forma convincente a una persona real diciendo o haciendo algo que nunca ocurrió.
Los deepfakes usan modelos generativos —GAN, modelos de difusión y sistemas neuronales de clonación de voz— para intercambiar rostros, clonar voces o fabricar escenas completas. El término data de 2017, cuando un usuario de Reddit publicó vídeos con caras intercambiadas; la técnica de autoencoder/GAN empareja un codificador que comprime un rostro con decodificadores entrenados para reconstruir un objetivo, mientras que los clones de voz modernos solo necesitan unos segundos de audio de referencia. La calidad ha mejorado tan rápido que deepfakes de vídeo en tiempo real impulsaron el fraude de Arup en Hong Kong en enero de 2024, donde los atacantes poblaron una videollamada con colegas falsificados, incluido un CFO falso, y convencieron a un empleado de autorizar 15 transferencias por unos 200 millones de HK$ (≈25 M USD).
Los deepfakes también alimentan el vishing, la sextorsión, la desinformación electoral, las imágenes íntimas no consensuadas y la elusión de la verificación de identidad (KYC) mediante vídeo sintético inyectado. Las defensas son por capas: detección técnica (comprobaciones de liveness/anti-spoofing, clasificadores, y firma de procedencia con el estándar C2PA Content Credentials de la Coalition for Content Provenance and Authenticity); controles de proceso (devoluciones de llamada out-of-band a un número conocido, doble aprobación y palabras clave para transferencias grandes); y marcos legales como el Reglamento europeo de IA, cuyo artículo 50 obliga a etiquetar el contenido generado por IA. La detección por sí sola es frágil y se degrada a medida que mejoran los generadores, por lo que los controles de proceso siguen siendo la salvaguarda más fiable.
flowchart LR
A[Fotos/audio de referencia<br/>del objetivo] --> B[Entrenar GAN /<br/>difusion / clon de voz]
B --> C[Video o voz sintetica]
C --> D[Videollamada fraudulenta<br/>o buzon de voz]
D --> E{La victima verifica<br/>out-of-band?}
E -->|Sin devolucion de llamada| F[Fondos transferidos - fraude exitoso]
E -->|Palabra clave + numero conocido| G[Solicitud rechazada]
C -.procedencia C2PA.-> H[Content Credentials<br/>marca el medio sintetico]● Ejemplos
- 01
Un deepfake en videollamada del directivo que ordena a finanzas transferir fondos a una cuenta fraudulenta.
- 02
Una voz clonada del CEO en un buzón pidiendo a un empleado saltarse los flujos de aprobación.
● Preguntas frecuentes
¿Qué es Deepfake?
Audio, imagen o vídeo sintético generado por IA que representa de forma convincente a una persona real diciendo o haciendo algo que nunca ocurrió. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Deepfake?
Audio, imagen o vídeo sintético generado por IA que representa de forma convincente a una persona real diciendo o haciendo algo que nunca ocurrió.
¿Cómo defenderse de Deepfake?
Las defensas contra Deepfake combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Deepfake?
Nombres alternativos comunes: Suplantación generada por IA, Suplantación con medios sintéticos.