EEUU, 19 diciembre 2021.- Los estudiantes de Stanford escucharon la tristeza en la voz de su amigo cuando compartió la noticia:
"Chicos, tuve que dejar mi trabajo". Para ellos, no tenía sentido. Hablaba inglés y español con fluidez, era extremadamente amable y experto en ingeniería de sistemas. ¿Por qué no había sido capaz de mantener un trabajo en un centro de atención telefónica?
Su acento, decía el amigo, hacía que muchos clientes no le entendieran; algunos incluso le insultaban por su forma de hablar.
Los tres estudiantes se dieron cuenta de que el problema era aún mayor que la experiencia de su amigo. Así que fundaron una startup para solucionarlo.
Ahora su empresa, Sanas, está probando un software con base en inteligencia artificial que pretende eliminar los problemas de comunicación cambiando el acento de las personas en tiempo real. Un trabajador de un centro de atención telefónica en Filipinas, por ejemplo, podría hablar normalmente por el micrófono y acabar sonando más como alguien de Kansas para un cliente al otro lado.
Los centros de atención telefónica, dicen los fundadores de la startup, son solo el principio. El sitio web de la empresa anuncia sus planes como "Speech, Reimagined".
Con el tiempo, esperan que la aplicación que están desarrollando sea utilizada por diversos sectores y personas. Podrían ayudar a los médicos a entender mejor a los pacientes, dicen, o a los nietos a entender mejor a sus abuelos.
"Tenemos una visión muy grande para Sanas", dice el director general, Maxim Serebryakov.
Y para Serebryakov y sus cofundadores, el proyecto es personal.
"Las voces de la gente no reciben tanta atención como sus acentos"
Los tres fundadores de Sanas se conocieron en la Universidad de Stanford, pero todos son originarios de distintos países: Serebryakov, actual director general, es de Rusia; Andrés Pérez Soderi, actual director financiero, es de Venezuela; y Shawn Zhang, actual director de tecnología, es de China.
Ya no son estudiantes de Stanford. Serebryakov y Pérez se graduaron; Zhang lo dejó para centrarse en dar vida a Sanas.
Pusieron en marcha la empresa el año pasado y le dieron un nombre que se puede pronunciar fácilmente en varios idiomas "para destacar nuestra misión global y nuestro deseo de acercar a la gente", dice Pérez.
A lo largo de los años, los tres dicen haber experimentado cómo los acentos pueden entorpecer el camino.
"Todos venimos de entornos internacionales. Hemos visto de primera mano cómo la gente te trata de forma diferente únicamente por tu forma de hablar", dice Serebryakov. "A veces es doloroso".
Zhang cuenta que su madre, que llegó a Estados Unidos hace más de 20 años procedente de China, todavía le hace hablar con la cajera cuando van juntos a comprar al supermercado porque le da vergüenza.
"Esa es una de las razones por las que me uní a Max y Andrés para crear esta empresa, para intentar ayudar a esas personas que creen que sus voces no reciben tanta atención como sus acentos", dice.
Serebryakov dice que ha visto cómo tratan a sus padres en los hoteles cuando vienen a visitarle a Estados Unidos, cómo la gente hace suposiciones cuando oye sus acentos.
"Hablan un poco más alto. Cambian su comportamiento", comenta.
Pérez cuenta que, tras asistir a una escuela británica, al principio le costó entender los acentos americanos cuando llegó a Estados Unidos.
Y no le hagas hablar de lo que ocurre cuando su padre intenta usar el Amazon Alexa que su familia le regaló por Navidad.
"Rápidamente descubrimos, cuando Alexa encendía las luces en lugares aleatorios de la casa y las ponía de color rosa, que Alexa no entiende para nada el acento de mi padre", cuenta Pérez.
Los centros de atención telefónica están probando la tecnología
El inglés es el idioma más utilizado del mundo. Se calcula que 1.500 millones de personas lo hablan, y la mayoría no son hablantes nativos. Solo en Estados Unidos, millones de personas hablan inglés como segunda lengua.
Esto creó un mercado creciente de aplicaciones que ayudan a los usuarios a practicar su pronunciación en inglés. Pero Sanas utiliza la inteligencia artificial para adoptar un enfoque diferente.
La premisa: en lugar de aprender a pronunciar las palabras de forma diferente, la tecnología podría hacerlo por ti. Ya no sería necesario un costoso y largo entrenamiento para atenuar el acento. Y la comprensión sería casi instantánea.
Serebryakov es consciente de que el acento y la identidad de las personas pueden estar estrechamente ligados, y subraya que la empresa no pretende borrar los acentos ni dar a entender que una forma de hablar es mejor que otra.
"Permitimos que la gente no tenga que cambiar su forma de hablar para ocupar un puesto, para mantener un trabajo. La identidad y los acentos son fundamentales. Están entrelazados", dice. "Nunca quieres que alguien cambie su acento solo para satisfacer a alguien".
En la actualidad, el algoritmo de Sanas puede convertir el inglés en acentos americanos, australianos, británicos, filipinos, indios y españoles, y el equipo tiene previsto añadir más. Pueden añadir un nuevo acento al sistema entrenando una red neuronal con grabaciones de audio de actores profesionales y otros datos, un proceso que lleva varias semanas.
El equipo de Sanas hizo dos demostraciones para CNN. En una, se escucha a un hombre con acento indio leer una serie de frases literarias. Luego, esas mismas frases se convierten en un acento americano:
Otro ejemplo presenta frases que podrían ser más comunes en un entorno de centro de atención telefónica, como "si me da su nombre completo y su número de pedido, podemos seguir adelante y empezar a hacer la corrección por usted".
Los resultados con acento americano suenan algo artificiales y rebuscados, como las voces de asistentes virtuales como Siri y Alexa, pero Pérez dice que el equipo está trabajando en mejorar la tecnología.
"El acento cambia, pero la entonación se mantiene", dice. "Seguimos trabajando para que el resultado sea lo más natural, emotivo y emocionante posible".
Los primeros comentarios de los centros de atención telefónica que han estado probando la tecnología son positivos, dice Pérez. También lo han sido los comentarios enviados a su sitio web a medida que se va corriendo la voz sobre su empresa.
Y dicen que sus planes para la empresa les han permitido obtener US$ 5,5 millones de financiación inicial de los inversores a principios de este año.
Cómo ven su futuro los fundadores de la startup
Esto ha permitido a Sanas ampliar su plantilla. La mayoría de los empleados de esta empresa con sede en Palo Alto (California) proceden de entornos internacionales. Y eso no es casualidad, dice Serebryakov.
"Lo que estamos construyendo ha calado en mucha gente, incluso en las personas que contratamos. ... Es realmente emocionante verlo", afirma.
Aunque la empresa está creciendo, todavía podría pasar un tiempo antes de que Sanas aparezca en una tienda de aplicaciones o en un teléfono móvil cerca de ti.
El equipo dice que, por ahora, están trabajando con grandes empresas de subcontratación de centros de atención telefónica y optando por un despliegue más lento a los usuarios individuales para poder perfeccionar la tecnología y garantizar la seguridad.
Pero, con el tiempo, esperan que Sanas sea utilizado por cualquiera que lo necesite, también en otros campos.
Pérez prevé que desempeñe un papel importante para ayudar a las personas a comunicarse con sus médicos.
"Cualquier segundo que se pierda en un malentendido por la pérdida de tiempo o por un mensaje erróneo es potencialmente muy, muy impactante", dice. "Queremos asegurarnos de que no se pierda nada en la traducción".
Algún día, dice, también podría ayudar a la gente a aprender idiomas, mejorar el doblaje en las películas y ayudar a los altavoces inteligentes en los hogares y a los asistentes de voz en los coches a entender diferentes acentos.
Y no solo en inglés: el equipo de Sanas también espera añadir otros idiomas al algoritmo.
Los tres cofundadores aún están trabajando en los detalles. Pero dicen que esta tecnología podría mejorar la comunicación en el futuro.