La Voz que te Identifica: Descubre el Poder de la Autenticación Biométrica
Con la presencialidad los trámites y la validación de identidad era más sencilla, pues claramente se podía ver la persona con la que se estaba interactuando (aunque también se podían presentar fraudes o suplantaciones), pero en entornos electrónicos en muchas ocasiones no hay certeza de la persona con la cual se interactúa –e incluso, no se sabe si se trata de una persona real o de un bot-.
Estos entornos electrónicos trajeron consigo la noción de identidad digital, mediante la cual se busca la identificación de las personas en un mundo virtual a través de
redes sociales, correos electrónicos, videoconferencias, aplicaciones móviles, mensajería instantánea, perfiles para compras por internet, la realización de trámites en línea, entre otros.
A partir de ese momento se incorporaron en la vida de los seres humanos las contraseñas, los tokens, los OTP, las firmas digitales y la biometría, como instrumentos para vincular una identidad digital con una persona física o real y brindar seguridad en las transacciones electrónicas.
Dentro de los mecanismos para validar la identidad digital, la biometría ha sido uno de los más utilizados en el último tiempo, pues se basa en características físicas únicas del ser humano, como el rostro, las huellas dactilares, la voz o el comportamiento. El pilar básico de la biometría es que nadie puede tener mi rostro, mi voz o mis huellas dactilares y, por ende, es mucho más segura que otros mecanismos, como las contraseñas.
A partir de este razonamiento, la ciudadanía en general empezó a relacionar la biometría con la seguridad: por ejemplo, según Kaspersky, cerca del 75% de los latinoamericanos considera segura la biometría facial y, además, dicha tecnología ha sido implementada por múltiples países como mecanismo de validación de identidad, incluyendo a Colombia con la cédula de ciudadanía digital. Esta confianza ha generado que la biometría se incorpore en aspectos tan cotidianos de la vida como el desbloqueo del teléfono celular.
¿Qué sucede con la biometría de voz?
Dentro de los mecanismos para garantizar la seguridad en línea se encuentra la biometría de voz. La también denominada biometría vocal, captura los atributos de los datos sonoros de la voz emitidos gracias a las cuerdas vocales; la seguridad de esta biometría radica en que la voz de cada ser humano es única.
Respecto de los deepfakes, se subraya que aunque algunos utilicen la tecnología de manera fraudulenta no implica que la biometría de voz deba desaparecer. Así como los delincuentes avanzan en mecanismos de engaño, los softwares de biometría de voz también se optimizan para evitar que existan suplantaciones.
De hecho, muchos de estos software se encuentran certificados, en virtud del cumplimiento de normas técnicas internacionales, como las emitidas por el National Institute of Standards and Technology (NIST). Estos estándares son un primer paso para garantizar la seguridad de mecanismos biométricos.
Además, una de las medidas que se han utilizado es el análisis de la voz a través de un espectrograma, el cual permite ver la representación virtual del audio que se está escuchando. El software de biometría de voz comparará el espectrograma original de la persona con el audio que esté oyendo y a partir de ello podrá identificar si se trata de un engaño o no.
Estas medidas generalmente se acompañan de sistemas de inteligencia artificial especializados en buscar las imprecisiones de las deepfakes, que muchas veces son imperceptibles para el ser humano, pero no para un sistema tecnológico. Así mismo, la Universidad de Granada ha propuesto la técnica de Gated Recurrent Convolutional Neural Network (GRCNN) para que a través de redes neuronales profundas se puedan detectar suplantaciones a través de la voz y en el mismo sentido compañías como mobbeel, a través del deep learning, entrenan algoritmos para detectar deepfakes.
Además de ello se destaca que existen escenarios específicos para generar nuevas soluciones que permitan combatir los deepfakes. Uno de ellos es el “Challenge AVSpoof”, donde las empresas convocadas debían presentar soluciones a distintos retos, incluyendo la suplantación de identidad a través de inteligencia artificial.
En España, Gradiant y Councilbox crearon una solución para garantizar la identidad de las personas en videoconferencias y trámites online, la cual tiene la posibilidad de detectar deepfakes de video, imagen y voz, lo cual además es útil para evitar fraudes en escenarios como votaciones de juntas y asambleas corporativas.
Los bancos también han implementado medidas al respecto. El New York Times ha reseñado que empresas como Pindrop monitorean los audios para detectar fraudes de voz, aunque también se subraya que cada vez se utilizan de manera más recurrente y sofisticada los deepfakes de voz, llegándose a presentar hasta veinte intentos de fraude por este medio a la semana. También llama la atención que Nuance, un proveedor de autenticación de voz, indicó que sus sistemas ya fueron engañados una vez gracias al deepfake.