Curso
Amazon Rekognition es un servicio basado en inteligencia artificial de Amazon Web Services (AWS) que ayuda a las empresas a analizar imágenes y vídeos fácilmente. Tanto si necesitas detectar objetos, reconocer rostros o moderar contenido, Rekognition lo hace posible sin necesidad de tener un profundo conocimiento en machine learning.
Este tutorial te guiará a través de lo que es Amazon Rekognition, sus características principales, cómo funciona y cómo puedes empezar a utilizarlo. También analizaremos sus ventajas, precios y algunas de las preocupaciones que suscita su uso.
¿Qué es Amazon Rekognition?
En pocas palabras, Amazon Rekognition es un servicio basado en la nube de Amazon Web Services (AWS) que utiliza el aprendizaje profundo para analizar imágenes y vídeos. Ayuda a identificar automáticamente objetos, escenas, rostros, texto e incluso contenido inseguro, todo ello sin necesidad de conocimientos profundos de machine learning.
Este servicio de reconocimiento de imágenes totalmente gestionado y basado en el aprendizaje profundo se diseñó desde el principio para funcionar a gran escala. Lo que distingue a Rekognition son sus modelos preentrenados, que están listos para usar desde el primer momento. Pero si tienes necesidades específicas, también puedes entrenar modelos personalizados para reconocer objetos o patrones únicos.
Los tres componentes básicos de cualquier aplicación de machine learning o deep learning son el entrenamiento, los modelos y la inferencia.

Componentes básicos de una aplicación de aprendizaje profundo y aprendizaje automático. Fuente: Servilleta AI
De estos tres componentes, la gran ventaja es que la formación ya está hecha gracias a las API de Rekognition. Esta formación ha creado modelos que se están utilizando dentro del servicio. Solo tienes que acceder a estas API para crear inferencias para tus aplicaciones.
Además, este sencillo enfoque basado en API permite a los programadores, independientemente de su experiencia en ML, añadir rápidamente potentes capacidades de IA a sus productos.
Características principales de Amazon Rekognition
Exploremos algunas de las funciones más impactantes de Rekognition, ilustradas con ejemplos reales.

Descripción general de las funciones de Amazon Rekognition. Fuente: Servilleta AI
Detección de objetos y escenas
Amazon Rekognition puede identificar y etiquetar con precisión miles de objetos, escenas y acciones en imágenes y vídeos. Por ejemplo, puede ayudar a automatizar la gestión de inventarios mediante la identificación de productos en las estanterías de las tiendas. Asimismo, puede reconocer coches y peatones en tareas de vigilancia del tráfico.
Pinterest utiliza Rekognition para etiquetar el contenido subido por los usuarios e identificar objetos, escenas y actividades. Esto ayuda a etiquetar las imágenes con palabras clave relevantes, mejorando la capacidad de la plataforma para recomendar contenido visualmente similar.
Análisis y reconocimiento facial
Las sofisticadas capacidades de análisis y reconocimiento facial de Rekognition le permiten identificar características como el rango de edad, el sexo y las emociones. Además, proporciona reconocimiento facial para la verificación de la identificación, como en los sistemas de entrada a edificios o las puertas de seguridad de los aeropuertos. Rekognition es utilizado por empresas para confirmar de forma segura la identidad de los usuarios en aplicaciones bancarias o sistemas de asistencia.
Con Amazon Rekognition, PBS creóun gráfico de conocimiento empresarial para recopilar metadatos de contenido a nivel de segmento, clip o incluso fotograma, y atribuir fácilmente información de reconocimiento facial, de objetos y de estado de ánimo a más de 60 000 títulos de la biblioteca digital de PBS.
Detección y extracción de texto
¿Alguna vez te has preguntado cómo reconocen las redes sociales los memes o las imágenes con texto superpuesto? Rekognition detecta y reconoce de forma eficaz el texto de fotografías o fotogramas de vídeo, incluso cuando el texto no está totalmente claro o alineado. Esto puede utilizarse en el procesamiento automatizado mejorado de documentos por parte de las empresas o incluso para realizar análisis de opiniones basados en datos visuales.
Etiquetas personalizadas
Una característica diferenciadora clara de Amazon Rekognition son las etiquetas personalizadas, que permiten a las empresas entrenar a Rekognition con vuestros propios datos. Si eres un profesional del marketing y quieres ver el logotipo de tu marca en las redes sociales, Rekognition puede identificarlo entre millones de imágenes sin que tengas que dedicar cientos de horas a revisarlas manualmente, lo que te permite obtener información útil para tus campañas de marketing.
San Diego Gas & Electric ( SDG&E) utilizalas etiquetas personalizadas de Rekognitionpara identificar automáticamente los daños en los activos a partir de imágenes tomadas por drones y los riesgos relacionados con la vegetación a partir de imágenes satelitales.
Moderación de contenidos
Gracias a su función de moderación de contenidos, las empresas de redes sociales y las plataformas de streaming de vídeo utilizan Rekognition para filtrar automáticamente los contenidos inapropiados, como material sexualmente explícito y violencia gráfica, de las publicaciones de los usuarios. Garantiza que el manejo de grandes cantidades de contenido generado por los usuarios sea muy sencillo y absolutamente fiable.
Reconocimiento de celebridades
La función de reconocimiento de famosos de Amazon Rekognition es muy utilizada por las empresas de comunicación que cubren eventos de entretenimiento. La rápida identificación de famosos permite a los proveedores de contenido etiquetar automáticamente fotos o vídeos de eventos de alfombra roja o noticias, lo que supone una mejora espectacular del flujo de trabajo.
Cómo funciona Amazon Rekognition
Amazon Rekognition utiliza modelos avanzados de aprendizaje profundo alojados en una infraestructura de computación en la nube AWS escalable. Este es el flujo de trabajo simplificado:
- Datos de entrada: Tú proporcionas imágenes o vídeos a través de la API de Rekognition.
- Procesamiento de IA: Los modelos de aprendizaje profundo de Rekognition analizan los datos y detectan rostros, objetos, texto o tipos de contenido.
- Resultados: Los resultados se devuelven rápidamente a través de llamadas API en formato JSON, listos para integrarse en tus aplicaciones o bases de datos.
Este servicio puede funcionar junto con otras soluciones de AWS, como AWS Lambda y Amazon Kinesis, para permitir escenarios de análisis en tiempo real, como la supervisión de vídeo en directo para fines de seguridad.
Arquitectura de alto nivel
- Imágenes o secuencias de vídeo subidas a Amazon S3.
- Las llamadas a la API de AWS Rekognition activan la inferencia de IA.
- Los resultados se envían a través de la API a tu aplicación o servicios.
Proceso de imágenes
A continuación se describe el proceso general de alto nivel:
- Se envía un mensaje a una cola de Amazon SQS, lo que inicia el proceso de procesamiento de imágenes.
- Esto activa una función Lambda, que se ejecuta de forma sincrónica.
- La función Lambda llama a Amazon Rekognition para analizar la imagen.
- Los resultados del análisis se almacenan en DynamoDB, S3 o Elasticsearch, dependiendo del caso de uso.
- El rendimiento del canal se controla ajustando el tamaño del lote y la concurrencia Lambda, lo que garantiza un procesamiento eficiente.
Canal de vídeos
A continuación se describe el proceso general de alto nivel:
- El canal de procesamiento de vídeo envía mensajes a una cola de Amazon SQS, que inicia el análisis del vídeo.
- Una función Lambda de programador de tareas se ejecuta a intervalos regulares y envía solicitudes de procesamiento de vídeo a Amazon Rekognition hasta que se alcanza el número máximo de tareas simultáneas.
- Cuando se completa un trabajo de análisis de vídeo, Amazon Rekognition envía una notificación a través de Amazon SNS, lo que activa el envío del siguiente lote de trabajos.
- Los resultados del análisis se almacenan en los almacenes de datos adecuados para su uso posterior.
- La canalización ajusta automáticamente su velocidad de procesamiento en función de los límites de la cuenta de AWS, lo que garantiza un rendimiento óptimo.
Esta arquitectura de referencia puede proporcionarte información más técnica y detallada si lo necesitas.
Cómo utilizar Amazon Rekognition
Así de fácil pueden las empresas integrar Amazon Rekognition en su flujo de trabajo:
Flujo de trabajo de Amazon Rekognition

Flujo de trabajo de Amazon Rekognition. Fuente: Imagen de Napkin AI
- Paso 1: Almacena tus datos de imágenes/vídeos en Amazon S3.
- Paso 2: Realiza una llamada API a Rekognition utilizando los SDK de AWS (disponibles para Python, Java, Node.js, etc.).
- Paso 3: Recibe y procesa la respuesta JSON de Rekognition con información detallada.
- Paso 4: Integra esta información en la lógica de tu aplicación para activar acciones como alertas o filtrado de contenido.
Introducción a Amazon Rekognition
A continuación se describen los pasos principales para empezar a utilizar Rekognition.
- Regístrate: Crea tu cuenta de AWS en aws.amazon.com.
- Configuración a través de la consola de AWS: Accede a Rekognition a través de la consola de administración de AWS. Para ello, escribe« Rekognition» en la barra de búsqueda y selecciona «rekognition» para abrir la consola de servicio.

Configuración de Amazon Rekognition a través de la consola de AWS. Fuente: AWS
- Integración de AWS CLI y SDK: Instala AWS CLI o el SDK que prefieras para obtener acceso programático.
- Implementa un análisis de muestra: Intenta realizar un análisis de imagen sencillo para familiarizarte con el proceso. Por ejemplo, puedesseleccionar « » (Análisis facial) en el panel de navegación de la izquierda, como se muestra a continuación. Esta función te permite analizar rostros en una imagen y recibir una respuesta JSON.

Selecciona el servicio correspondiente. Fuente de la imagen: AWS
Como has visto, ¡es sorprendentemente sencillo!
Ventajas de Amazon Rekognition
Algunas de las razones por las que a empresas como Rekognition les gusta este servicio son:
Escalabilidad y rendimiento
Dado que Rekognition se ejecuta en la infraestructura de AWS, puede escalarse automáticamente y gestionar millones de imágenes y vídeos sin retrasos. Las empresas no tienen que preocuparse por las caídas de rendimiento, independientemente del volumen de trabajo que tengan. También es posible complementar las tareas de revisión humana con IA.
Rentabilidad
Con su modelo de precios de pago por uso, las empresas solo pagan por lo que utilizan, lo que lo convierte en una solución económica sin necesidad de realizar una gran inversión inicial.
Facilidad de integración
Las API fáciles de usar simplifican la implementación, incluso para equipos con poca o ninguna experiencia en machine learning. No es necesario crear modelos complejos desde cero: solo tienes que conectarlo y empezar a analizar imágenes o vídeos.
Precisión y fiabilidad
Amazon forma y mejora continuamente sus modelos de IA, lo que se traduce en una mayor precisión y menos esfuerzo manual para las empresas. Esto ayuda a reducir los errores humanos en tareas como la verificación de identidad, la detección de objetos y la moderación de contenidos.
Preocupaciones y controversias en torno a Amazon Rekognition
Como cualquier tecnología potente, Rekognition ha suscitado algunas preocupaciones válidas:
Preocupaciones sobre la privacidad y la vigilancia
El uso de Rekognition en la aplicación de la ley y la vigilancia ha desatado acalorados debates. Los críticos argumentan que el reconocimiento facial basado en IA podría utilizarse indebidamente para la vigilancia masiva, lo que podría infringir los derechos de privacidad y las libertades civiles. Amazon ha sido objeto de críticas por vender esta tecnología a organismos gubernamentales, lo que ha suscitado inquietudes sobre cómo se está utilizando y si cuenta con la supervisión adecuada.
Sesgo en el reconocimiento facial
El sesgo de la IA es un problema real, y diversos estudios, entreellos los del MIT, han demostrado que los sistemas de reconocimiento facial pueden tener dificultades para garantizar la precisión, especialmente a la hora de identificar a personas de diferentes grupos raciales o de género. Las identificaciones erróneas pueden tener graves consecuencias, especialmente en el ámbito policial, donde las identificaciones falsas pueden dar lugar a detenciones injustificadas. Esta controversia subraya la urgente necesidad de mejorar la equidad de la IA y garantizar que los modelos de reconocimiento facial funcionen igual de bien en poblaciones diversas.
Uso ético y regulación
En medio de crecientes críticas, Amazon decidió suspender temporalmente la venta de Rekognition a las fuerzas del orden, reconociendo las preocupaciones éticas que suscita su uso. El debate sobre la ética de la IA continúa, con organizaciones como la ACLU presionando para que se impongauna supervisión y una rendición de cuentas más estrictas.
Precios de Amazon Rekognition
Amazon Rekognition sigue un modelo de preciosde pago por uso basado en la nube ( ), lo que significa que solo pagas por lo que usas. El precio se basa en el tipo de análisis que realices y no hay inversiones iniciales. Entendámoslo mejor:
Precio de las imágenes
Rekognition Image te permite analizar imágenes mediante tecnología de aprendizaje profundo. Los precios se dividen en dos partes:
- Análisis de imágenes: Se te cobrará por cada imagen analizada. Si realizas varios análisis en la misma imagen, se te cobrará por cada solicitud por separado. Así, por ejemplo, si analizas 2,5 millones de imágenes para la detección de etiquetas, la estructura de costes sería la siguiente:
Primer millón de imágenes: 0,0010 $ por imagen, el coste será de 1000 $.
Próximos 1,5 millones de imágenes: 0,0008 $ por imagen, el coste será de 1200 $.
Coste total: 2200 $.
- Almacenamiento de metadatos faciales: Si utilizas la comparación de rostros o la búsqueda de rostros, Rekognition almacena metadatos faciales y se te cobrará una pequeña cuota mensual por este almacenamiento. Los cargos son de 0,00001 $ por metadatos de cara al mes, donde los cargos por almacenamiento se aplican mensualmente y se prorratean por meses parciales.
Precios de los vídeos
Si analizas vídeos en lugar de imágenes, se te cobrará por minuto de metraje procesado.
- Detección de etiquetas (detección de objetos, escenas y actividades): Desde 0,10 $ por minuto
- Búsqueda facial (comparar caras con una base de datos): Desde 0,10 $ por minuto
Por lo tanto, procesar 1000 minutos de vídeo para la detección de etiquetas costaría 100 dólares a 0,10 dólares por minuto.
Precios de etiquetas personalizadas
Rekognition permite a las empresas entrenarlo para reconocer objetos específicos únicos para sus necesidades. Esta función tiene dos costes:
- Entrenamiento de un modelo: 1,00 $ por hora
- Predicciones de ejecución (inferencia): 4,00 $ por cada 1000 imágenes
Cabe destacar que el uso de Entrenamiento e Inferencia se factura por incrementos de minutos, con un mínimo de 1 minuto.
Los precios detallados de otros servicios se actualizan continuamente y pueden consultarse en la página de precios de Amazon Rekognition.
Conclusión
Amazon Rekognition es un potente producto de AWS para el análisis de imágenes y vídeos que ofrece funciones como reconocimiento facial, detección de objetos, extracción de texto y moderación de contenidos. Su escalabilidad, facilidad de integración y rentabilidad lo convierten en una herramienta valiosa para empresas de todos los sectores.
Si estás explorando nuevas formas de utilizar la visión artificial avanzada para tu negocio, Amazon Rekognition es sin duda un punto de partida valioso y accesible.
Y si deseas explorar y obtener más información sobre los servicios y productos relacionados de AWS, disponemos de excelentes recursos que pueden resultarte útiles:
- Curso sobre conceptos de AWS: Descubre el mundo de Amazon Web Services (AWS) y comprende por qué está a la vanguardia de la computación en la nube.
- Curso sobre conceptos de tecnología y servicios en la nube de AWS: Domina la tecnología de la nube de AWS con aprendizaje práctico y aplicaciones prácticas en el ecosistema de AWS.
- Certificación AWS Cloud Practitioner (CLF-C02): Demuestra tus conocimientos básicos sobre los servicios en la nube de AWS y accede a todo lo que necesitas para prepararte para la certificación AWS Cloud Practitioner.
- Ética de la IA: Por qué es importante hacerlo bien (podcast y blog)
- Regulación de la IA: Blog sobre políticas globales
- Curso sobre ética de la IA: Explora la ética de la IA centrándote en los principios, la equidad, la reducción de sesgos y la confianza en el diseño de la IA.
Trabajo en sistemas de IA acelerados que permiten la inteligencia de vanguardia con canalizaciones de ML federadas en datos descentralizados y cargas de trabajo distribuidas. Mywork se centra en Grandes Modelos, Procesamiento del Habla, Visión por Ordenador, Aprendizaje por Refuerzo y Topologías ML avanzadas.
Preguntas frecuentes
¿Qué es Amazon Rekognition?
Amazon Rekognition es un servicio de AWS que analiza imágenes y vídeos para detectar objetos, rostros, texto y mucho más mediante inteligencia artificial.
¿Necesito experiencia en machine learning para utilizar Amazon Rekognition?
No, Rekognition está diseñado para integrarse fácilmente con API, por lo que no necesitas conocimientos especializados en aprendizaje automático para utilizarlo.
¿Cuánto cuesta Amazon Rekognition?
El precio se basa en el uso. Pagas por imagen o minuto de vídeo analizado.
¿Cómo puedo empezar a utilizar Amazon Rekognition?
Regístrate en AWS, habilita Rekognition y empieza a analizar imágenes o vídeos.
¿Cuáles son las preocupaciones en torno a Amazon Rekognition?
La privacidad, los sesgos y el posible uso indebido de la vigilancia son cuestiones fundamentales. Amazon ha impuesto límites al uso por parte de las fuerzas del orden y sigue mejorando la equidad.


