servicios cognitivos Azure

Artículo

Introducción a los servicios cognitivos de Azure

Los servicios cognitivos de Azure conocidos por “Cognitive Services” ponen la inteligencia artificial al alcance de todos los desarrolladores, sin que para utilizarla sea necesario contar con experiencia en el aprendizaje automático. Basta con una llamada API para incorporar la capacidad de ver, escuchar, hablar, buscar, comprender y acelerar la toma de decisiones en las aplicaciones. Con esta premisa democratizan el uso de los servicios cognitivos haciendo innecesarios en la mayoría de los casos gran parte de los 7 pasos de entrenamiento de una inteligencia artificial.

Servicios Cognitivos Azure 1

¿Qué es Azure Cognitive Services?

Son las API, SDK y servicios disponibles que tienen como objetivo ayudar a los desarrolladores a crear aplicaciones inteligentes sin la utilización de “inteligencia artificial directa” y sin la necesidad de aptitudes ni conocimientos sobre ciencia de datos. Azure Cognitive Services permiten a los desarrolladores agregar fácilmente características cognitivas en sus aplicaciones.

Azure Cognitive Services permite a los desarrolladores crear aplicaciones que puedan ver, oír, hablar, comprender e incluso empezar a razonar. El catálogo de servicios de Azure Cognitive Services se puede dividir en cinco pilares principales: Vision, Voz, Lenguaje, Web Search y Decision.

Visión

Conjunto de servicios que permiten la incorporación capacidades de visión en las aplicaciones. Los servicios utilizan el procesamiento de datos visuales para etiquetar el contenido (desde objetos hasta conceptos), extraer texto impreso y manuscrito, reconocer elementos conocidos como marcas y puntos de referencia, y moderar el contenido.

Computer Vision

El servicio utiliza el procesamiento de datos visuales para etiquetar el contenido (desde objetos hasta conceptos), extraer texto impreso y manuscrito, reconocer elementos conocidos como marcas y puntos de referencia, y moderar el contenido.

Servicios Cognitivos Azure 2

Face

Servicio de reconocimiento facial cuyas características incluyen: detección de caras, rostros y atributos en una imagen; identificación de la persona, reconocimiento de emociones percibidas y el reconocimiento y agrupación de caras similares en imágenes.

Form Recognizer

Extraer con precisión texto, pares clave-valor y tablas de los documentos, tiene la facilidad para adaptar su capacidad de reconocimiento a documentos, tanto en el entorno local como en la nube. Permite convertir formularios en datos.

Servicios Cognitivos Azure 3

Video Indexer

Extracción de metadatos de forma automática de los archivos de vídeo y audio. Se puede extraer palabras pronunciadas, texto escrito, caras, hablantes, famosos, emoticonos, temas, marcas y escenas.

Ink Recognicer

Servicio que reconoce contenido de lápiz digital, como escritura manual, formas y el diseño de documentos con entradas de lápiz digital.

Servicios Cognitivos Azure 4

Custom Vision

Personalización del reconocimiento de imágenes para adaptarlo a las necesidades de cada proyecto o servicio. Entrenamiento del modelo de visión artificial simplemente cargando y etiquetando algunas imágenes.

Voz

Conjunto de servicios Convierta voz en texto y texto en voz que suene natural. Traducción entre idiomas y posibilidad de habilitar el reconocimiento y la verificación del usuario hablante.

Speech to text

Servicio utilizado para convertir audio de una gran variedad de orígenes en texto de forma fluida. Permite la personalización de los modelos para eliminar barreras habituales en el reconocimiento de voz, como el vocabulario específico, los estilos de habla o el ruido de fondo.

Text to Speech

Permite que las aplicaciones y servicios se expresen de una forma natural, Ofreciendo gran variedad de voces en una amplia gama de idiomas. Voces reales con la funcionalidad Texto a voz neuronal integrada en la investigación avanzada en tecnología de síntesis de voz.

Speech Translation

Traducción de voz en tiempo real, integrable fácilmente mediante servicio. Servicio Integre fácilmente traducción de voz en tiempo real en sus aplicaciones. Con posibilidad de personalización incorporando traducciones propias.

Speaker Recognition

API cuyo uso es determinar la identidad de un hablante desconocido. El audio de entrada del hablante desconocido se empareja contra un grupo de hablantes seleccionados y, en caso de que se encuentre una coincidencia, se devuelve la identidad del hablante.

Lenguaje

Conjunto de APIs que permiten que las aplicaciones procesen lenguaje natural con scripts precompilados, evalúen sentimientos y aprendan a reconocer lo que los usuarios quieren.

Servicios Cognitivos Azure 5

Immersive Reader

Servicio que permite utilizar características de lectura y comprensión de textos en las aplicaciones, aportando capacidad de lectura con características como la lectura en voz alta, la traducción a otros idiomas y la captación de la atención mediante resaltado y otros elementos de diseño.

Language Understanding Intelligent Service (LUIS)

Basado en Machine Learning su objetivo es dotar a la aplicación de una comprensión lingüística natural en aplicaciones, bots y dispositivos IoT.

QnA Maker

API cuyo objetivo crear una capa de conversación de preguntas y respuestas con los datos que ya se tienen, creando una base de conocimiento extrayendo preguntas y respuestas de contenido semiestructurado, como preguntas más frecuentes, manuales y documentos. La base de conocimiento se va haciendo más inteligente porque aprende continuamente del comportamiento de los usuarios.

Text Analysis

Servicio que al pasarle un texto detecta el idioma en el que está escrito, el sentimiento del mismo, frases clave y entidades con nombre.

Servicios Cognitivos Azure 6

Translator Text

Servicio neural de traducción automática. Se puede integrar fácilmente en las aplicaciones, sitios web, herramientas o cualquier solución que necesite soporte en diversos idiomas, así como la localización de sitios web.

Decision

Servicios de soporte para tomar decisiones más inteligentes en el menor de los tiempos analizando los datos, obteniendo estadísticas y detectando anomalías en los mismos.

Anomaly Detector

Funcionalidades de detección de anomalías en las aplicaciones, con el fin de poder identificar rápidamente los problemas. A través de una API, la versión preliminar de Anomaly Detector recibe datos de serie temporal de todos los tipos y selecciona el modelo de detección de anomalías que mejor se ajusta a los datos.

Content Moderator

API de moderación de contenido asistidas por máquina y herramienta de revisión humana de imágenes, texto y vídeos. Detección de imagines potencialmente ofensivas o no deseadas, filtrado de texto no deseado, moderación de contenido para adultos en vídeos, con herramientas de revisión para mejorar los resultados.

Servicios Cognitivos Azure 7

Personalizer

Servicio de inteligencia artificial que ofrece una experiencia personalizada para cada usuario, dando prioridad a los contenidos, diseños y conversaciones relevantes para el usuario.

Servicios Cognitivos Azure 8

Search

Posibilidad de incluir los servicios de búsqueda de Bing, en las aplicaciones desarrolladas.

En los siguientes artículos de esta serie se detallarán cada uno de los conjuntos de servicios, añadiendo ejemplos de configuración y demostraciones.

Conoce a nuestro experto

Juan Antonio Morales García
Specialist Lead en Consultoría Tecnológica

Juan Antonio es actualmente Specialist Lead en el equipo de Consultoría Tecnológica de Deloitte y cuenta con 10 años de experiencia en el desarrollo de tecnologías Microsoft. Está especializado en desarrollo para Azure.