Perspectivas

Parte 3: Aplicaciones de la Inteligencia Artificial

Acercamiento a cinco aplicaciones emocionantes 

Juri van de Gevel, Sjors Broersen en Carmen Wolvius - Mayo 2017 - Deloitte

Habiendo revisado ahora el significado de la IA y las principales técnicas que implica en:

Parte 1: Inteligencia Artificial Definida, la terminología más utilizada en torno a la IA

Parte 2: Técnicas de Inteligencia Artificial Explicadas

Vamos a dar el siguiente paso y discutir cinco aplicaciones emocionantes en las que veremos un gran desarrollo en los próximos años:

  • Reconocimiento de imágenes
  • Reconocimiento de voz
  • Traducción
  • Preguntas y respuestas / chatbots
  • Juegos

Estos desarrollos harán que las aplicaciones sean más baratas y precisas, abriendo la puerta para que las empresas las usen.

1. Reconocimiento de Imágenes

Reconocer imágenes es una tarea fácil para la mayoría de nosotros. No tenemos ningún problema para diferenciar un auto de un tigre o reconocer que un auto sigue siendo un auto cuando se observa desde la parte delantera en lugar de desde el lado. Esta tarea ha sido considerablemente más difícil para los ordenadores, pero los recientes avances en la precisión del reconocimiento de imágenes han dado lugar a aplicaciones interesantes. Debido a que diferentes proveedores como Google e IBM están ofreciendo sus algoritmos pre programados de código abierto y bibliotecas de software como Tensorflow lo cual hace posible construir sus propios algoritmos, el reconocimiento visual es cada vez más accesible para el público.

Las aplicaciones conocidas de reconocimiento de imágenes son las aplicaciones de compras de Google o el reconocimiento facial de las cámaras de seguridad. Estas aplicaciones ya están utilizando el reconocimiento de imágenes a diario, sin embargo, ha habido mucho desarrollo en otras áreas en los últimos años. IBM Watson, ha desarrollado sus habilidades de reconocimiento de imágenes en el campo de la medicina. IBM Research ha estado trabajando en técnicas de aprendizaje profundo para la visión por computadora que podrían usarse para reconocer si las irregularidades en la piel podrían ser Melanoma. Crearon un conjunto de métodos que pueden segmentar las lesiones cutáneas y métodos que pueden detectar el área y tejido circundante para detectar Melanoma. Dichos métodos fueron probados en un gran conjunto de datos disponibles públicamente, que describen en una preimpresión del artículo.

La visión de IBM es que en cierto momento el personal médico puede enviar una imagen de las irregularidades de la piel a Watson, de la misma manera que envían muestras de sangre al laboratorio.

El reconocimiento facial, que conocemos principalmente de las cámaras de seguridad, también se ha desarrollado en otras áreas. Una encuesta realizada a 150 ejecutivos minoristas por Computer Services Corporation, que se llevó a cabo en el Reino Unido en 2015, sugirió que una cuarta parte de todas las tiendas británicas utilizan software de reconocimiento facial. El software se utiliza para la seguridad, como se puede esperar, pero también para realizar un seguimiento de los clientes para observar su comportamiento como un efecto de las exhibiciones de productos, o el flujo de tráfico en la tienda. Este es un concepto familiar en las tiendas web, donde las pruebas A/B se pueden utilizar para ver qué pantalla del sitio web produce los mejores beneficios, sin embargo, esto sugiere que las herramientas de reconocimiento facial se pueden utilizar para orquestar estas pruebas en vivo en una tienda.

Diferentes empresas de desarrollo de software están ofreciendo reconocimiento facial a los minoristas (por ejemplo, aquí o aquí) Ellos aplican algoritmos específicos que utilizan puntos de referencia faciales para reconocer y distinguir entre caras, que se pueden guardar y combinar más adelante para mejorar la experiencia del cliente y personalizar el servicio.

2. Reconocimiento de Voz

El reconocimiento de voz es una aplicación de la IA que reconoce el habla y puede convertir las palabras habladas en palabras escritas. Apenas se utiliza por sí solo, pero se utiliza en gran medida como una adición a Chatbots, agentes virtuales y aplicaciones móviles. Ejemplos bien conocidos son Siri de Apple, Google Home y Alexa de Amazon. El reconocimiento de voz comenzó ya en 1952 con 'Audrey'. Audrey fue capaz de reconocer los dígitos hablados en una sola voz, lo que es bastante impresionante dadas las computadoras en ese entonces. Hoy tenemos aplicaciones en nuestro teléfono y en nuestro auto que pueden responder a nuestra voz. No sólo la cantidad de aplicaciones con capacidad de reconocimiento de voz ha aumentado, también la precisión de la voz a las palabras ha mejorado dramáticamente en los últimos años según KPCB.

3. Traducción

Un tema diferente con grandes implicaciones empresariales es la traducción automática. Este tema se puede definir como el proceso de traducir texto de un idioma a otro mediante el uso de software. Tradicionalmente, la traducción se realizaba sustituyendo cada palabra por su homólogo más cercano en el otro idioma. Si bien esto funciona razonablemente de forma correcta para las palabras individuales, un par de palabras u oraciones son generalmente más difíciles de procesar correctamente debido al hecho de que las relaciones entre las palabras son importantes para el significado de una oración, pero tales matices no se pueden capturar cuando cada palabra se analiza por separado.

El uso del aprendizaje profundo ha tenido un impacto significativo en la calidad de las traducciones automáticas al cambiar completamente el paradigma. En lugar de trabajar de una manera basada en reglas, impulsada por la toma de decisiones humanas, la traducción usando una red neuronal se basa completamente en las matemáticas. En textos relativamente básicos, las traducciones del sistema neuronal se acercan a la calidad de los traductores humanos. Un experimento incluso mostró que cuando traduces del inglés al coreano, y posteriormente traduces de inglés al japonés, el modelo es capaz de traducir coreano al japonés razonablemente bien, sin ninguna capacitación previa centrada en el vínculo formal entre los dos idiomas. Un artículo incluso se hizo la pregunta: "¿Han inventado las computadoras su propia idioma?".

El impacto de las traducciones de calidad en una economía global es enorme. Con traducciones de negocios originalmente dominadas por conversiones entre idiomas europeos, la necesidad de traducciones al chino, japonés y coreano está aumentando. Un ejemplo simple es uno que Uber estaba investigando, donde la traducción automática tiene lugar entre usted y su conductor local de Uber, que sólo puede comunicarse en chino.

4. Respuesta de preguntas / Chatbots

Los agentes de Preguntas y Respuestas o Chatbots son otro ejemplo de aplicación de IA al idioma. Cuando se habla de la capacidad de tener conversaciones, se hacen distinciones en el dominio y la forma de generar una respuesta del agente. Un chatbot puede centrarse en responder preguntas en un dominio abierto o cerrado. Cuando opera en un dominio abierto, debe ser capaz de responder a preguntas generales que pueden referirse a cualquier tema (por ejemplo, el robot-chat cleverbot). Esto es generalmente más difícil que un dominio cerrado, que se refiere sólo a una cantidad limitada de temas. Los dominios cerrados, sin embargo, tienen muy buena aplicación empresarial, como responder preguntas en los servicios de asistencia. Hace un par de años, hubo un gran avance en torno a la funcionalidad de respuesta automática de preguntas, cuando IBM Watson venció a los humanos en un juego de Jeopardy, un conocido concurso estadounidense. Más recientemente, Google, que ahora puede dar a los chatbots la capacidad de tener una memoria a corto plazo, lo que le da al chatbot la capacidad de imitar las conversaciones de la vida real de forma más realista.

La capacidad de las máquinas para reconocer la intención (o el propósito) de una pregunta y responderla de varias maneras, es de nuevo algo que se puede ver en muchas aplicaciones empresariales. Después de destilar una intención del comando de un usuario, se puede vincular a una acción de seguimiento específica. Esta acción puede ir desde hacer una pregunta de retorno hasta la recuperación de información de Internet. En el área de servicio al cliente, los Chatbots se están convirtiendo rápidamente en la norma, un ejemplo es Amelia de IPsoft. Las consultas estándares ya se manejan automáticamente, y sólo las difíciles se reenvían a los responsables de la toma de decisiones humanas. La respuesta a preguntas también ha hecho una introducción en el campo del Derecho, donde los abogados pueden plantear preguntas en lenguaje natural a un asistente sobre casos legales. El asistente puede responder a la consulta con el pasaje pertinente, extraído de documentación legal de alta calidad.

5. Juego / Solucionador

Una de las aplicaciones más emocionantes de la IA reside en jugar juegos. Jugar bien un juego requiere no sólo conocer las reglas, sino calcular los próximos movimientos posibles dentro de estas reglas, y finalmente hacer un juicio cuidadoso sobre qué movimiento daría la mejor oportunidad de ganar. Si las computadoras pueden jugar tanto como los jugadores humanos, no hay razones por las que no puedan aprender alguna otra tarea que las personas hacen en su trabajo diario (aunque la supervisión humana probablemente siga siendo necesaria).

Recientemente, se dio un gran paso en el campo de los juegos cuando el campeón del mundo de Go fue derrotado por una computadora por primera vez. Go es un juego que no puede ser calculado con fuerza bruta, ya que el número de movimientos posibles es mayor que el número de estrellas en el universo. Los mejores jugadores de Go del mundo confían en gran parte en su intuición para llegar a los mejores movimientos. AlphaGo de Google (un motor de red basado en redes neuronales), sin embargo, aprendió a jugar como un jugador humano de primera línea mediante el estudio de millones de juegos humanos. Luego se hizo aún más fuerte jugando contra otra versión de sí misma millones de veces, lo que finalmente le permitió vencer al campeón del mundo. Si las computadoras pueden vencer a los jugadores humanos en uno de los juegos más complicados que existe actualmente, entonces ¿dónde se detienen las posibilidades de la IA?

Una gran ventaja que las personas todavía tienen sobre las computadoras, es que podemos tomar nuestro conocimiento y capacitación en un área, y aplicarlo a una nueva tarea o área. Por ejemplo, los buenos jugadores pueden aplicar su forma de pensar para resolver sus problemas diarios en sus trabajos. AlphaGo no puede hacer esto: sólo es bueno para jugar Go y nada más. Cuando lo haces aprender algo más, como el ajedrez, perderá su capacidad de jugar. Recientemente, sin embargo, se tomó un primer paso en la superación de este problema: las redes neuronales ahora son capaces de recordar el conocimiento más importante de un juego, y al mismo tiempo aprender un nuevo juego (enlace). Google Deepmind escribió un nuevo algoritmo que permitió a una red neuronal aprender 10 juegos Atari al mismo tiempo, y jugarlos con el rendimiento humano.

Una vez que este campo esté más desarrollado, los ordenadores podrán realizar una serie de tareas difíciles que en este momento sólo las personas pueden realizar. El propio Google lo usa para bajar las facturas de energía de sus grandes centros de datos. La IA controla más de 120 variables en los centros de datos de Google, como las ventanas, los ventiladores y los sistemas de refrigeración, optimizando el uso de energía mientras se mantiene el rendimiento informático. La optimización potencialmente reduce la factura de energía de Google por cientos de millones durante varios años. Otra aplicación en el campo de la salud es la de Deepmind que ahorra a las enfermeras más de dos horas de tiempo por día al advertir sobre la próxima insuficiencia renal aguda. Estas son apenas 2 aplicaciones, pero como se trata de un campo recientemente desarrollado, existe un enorme potencial para más.

Piense en predecir los precios de las acciones, optimizando el diseño de los centros de distribución. La imaginación y los datos disponibles son el límite.

Did you find this useful?