Saltar al contenido principal

La IA Jarvis de Google es casi con toda seguridad un agente de IA basado en la web

Lo más probable es que Jarvis AI sea un agente de IA basado en la web -Google lo lanzó involuntariamente como extensión del navegador y también lo mencionó en la I/O 2024 de Google-.
Actualizado 18 nov 2024  · 6 min de lectura

El 6 de noviembre de 2024, Google reveló aparentemente sin querer la IA Jarvis al publicar accidentalmente una versión temprana de este agente de IA como extensión en la tienda web Google Chrome. En este artículo, exploraré lo que podría ser la IA de Jarvis y cómo podría cambiar fundamentalmente la forma en que navegamos por la web.

¿Qué es Jarvis AI?

Lo único que sabemos sobre Jarvis AI es que a principios de noviembre se lanzó durante un breve periodo una extensión de Google Chrome llamada Jarvis. A pesar de su breve aparición, la descripción de la extensión en la página de la tienda se refería a ella como "un útil compañero que navega por la web por ti". Esta descripción se ajusta a la funcionalidad prevista de Jarvis como agente de agente de IA diseñado para automatizar tareas basadas en la web.

En su discurso inaugural de principios de añoGoogle mostró agentes de IA inéditos con la capacidad de controlar el navegador para realizar una amplia variedad de tareas. Especulo que Jarvis AI podría ser el producto real detrás de esta presentación.

Sundar Pichai, SEO de Google, hablando en la keynote de Google 2024 sobre el desarrollo de agentes de IA

En su presentación, dan un ejemplo de devolución de zapatos. Utilizando agentes de IA, todo lo que tendríamos que hacer es indicar que queremos devolver los zapatos, y el agente realizaría de forma autónoma todos los pasos.

Ejemplo de caso de uso para devoluciones automatizadas utilizando agentes de IA de la keynote de Google 2024

Integrado con el navegador y otros productos de Google, como Gmail, el agente puede completar el proceso de devolución siguiendo estos pasos:

  1. Busca el recibo en la bandeja de entrada.
  2. Localiza el número de pedido en el correo electrónico.
  3. Rellena el formulario de devolución.
  4. Programa una recogida.

Ejemplo de exeucción de devoluciones automatizadas mediante agentes de IA de la keynote de Google 2024

¿Cómo funciona Jarvis AI?

Jarvis AI puede automatizar las tareas cotidianas de los usuarios basadas en la web, como realizar búsquedas, compras en línea y reservas de vuelos.

Jarvis probablemente utiliza una versión especializada de la familia Gemini de Google de grandes modelos lingüísticos. Esto sugiere que Jarvis utiliza un modelo de "pensamiento" o razonamiento, lo que contribuye a su capacidad para manejar tareas complejas y dar respuestas más personalizadas. Además, se espera que se integre profundamente con los servicios actuales de Google, como Gmail, Mapas y Búsqueda.

Esta integración podría mejorar las capacidades de Jarvis proporcionando acceso a los datos de los usuarios y agilizando diversos procesos, como la recuperación de recibos de Gmail para devoluciones en línea o el uso de datos de localización de Maps para planificar viajes.

Sundar Pichai, SEO de Google, hablando en la keynote de Google 2024 sobre la integración de Gemini en todos los productos de Google.

Los modelos Gemini son multimodales y pueden procesar varios tipos de datos (texto, imágenes, vídeo, audio, etc.), encontrando conexiones entre ellos. Es probable que el agente tenga acceso al contenido del navegador, lo que le permitirá ver, interpretar e interactuar con los elementos que aparecen en la pantalla.

Sundar Pichai, SEO de Google, hablando en la keynote de Google 2024 sobre la multimodalidad de Gemini y su capacidad para encontrar conexiones entre los distintos tipos de datos.

Es importante señalar que la información sobre el funcionamiento interno y la dependencia de tecnologías específicas se basa en especulaciones.

Jarvis AI vs. Otros agentes de IA

Como ya he mencionado, creo que Jarvis está diseñado para automatizar las tareas cotidianas basadas en la web. Jarvis se distingue por su estrecha integración con el navegador web Google Chrome. Sin embargo, Jarvis no está solo en este terreno.

Uso informático de Anthropic

Anthropic, la empresa detrás de Claudetambién ha avanzado con su propio agente de IA, conocido como uso informático. Este agente es capaz de interactuar con varias aplicaciones más allá de los navegadores web. El agente de Anthropic entró en su fase beta pública en octubre de 2024, mostrando su capacidad para mover el cursor, pulsar botones y escribir texto, de forma muy parecida a un usuario humano.

A pesar de sus diferencias en cuanto a fase de desarrollo y ámbito de funcionamiento, tanto Jarvis como Anthropic comparten un objetivo común: automatizar tareas imitando la interacción humana con los ordenadores. Es probable que ambos agentes se basen en sofisticados mecanismos de captura e interpretación de pantallas para comprender el contexto de las peticiones de los usuarios y ejecutar las acciones adecuadas.

Operador de OpenAI

OpenAI va a presentar "Operator", un agente autónomo de IA diseñado para realizar tareas en nombre de los usuarios, como escribir código y reservar viajes. Según Bloombergestá previsto que Operator salga a la venta en enero de 2025.

Sam Altman sobre los agentes de IA

Sam Altman respondiendo un AMA de Reddit

Toolformer de Meta

Meta AI Research presentó Toolformer, un modelo lingüístico capaz de utilizar de forma autónoma herramientas externas para mejorar su rendimiento en diversas tareas. Detallado en el documento "Toolformer: Los Modelos Lingüísticos Pueden Enseñarse a Sí Mismos a Utilizar Herramientas," el modelo se entrena para determinar qué APIs llamar, cuándo llamarlas, qué argumentos pasar y cómo incorporar los resultados en futuras predicciones de tokens.

Este enfoque autosupervisado sólo requiere un puñado de demostraciones para cada API, lo que permite al modelo utilizar eficazmente herramientas como calculadoras, sistemas de respuesta a preguntas, motores de búsqueda, sistemas de traducción y calendarios.

Retos de los agentes de IA

En general, los agentes de IA introducen una serie de retos y consideraciones, en particular en relación con privacidadla precisión y las implicaciones éticas.

Cuestiones de privacidad

Aunque parezca atractivo automatizar tareas aburridas y que llevan mucho tiempo, esta comodidad conlleva una sensación de incomodidad. ¿Quiero que Google o cualquier otra empresa tenga acceso total a mi ordenador? Hay algo en esa idea que me inquieta profundamente.

La preocupación por la privacidad es de gran importancia. Google debe garantizar a los usuarios que sus datos se tratarán de forma segura y responsable. Tendrán que aplicar medidas de seguridad sólidas y prácticas transparentes de tratamiento de datos para mitigar los posibles riesgos de violación o uso indebido de los datos. Establecer directrices claras sobre el acceso, almacenamiento y uso de los datos y proporcionar a los usuarios un control granular sobre sus preferencias de intercambio de datos será crucial para generar confianza y garantizar la adopción por parte de los usuarios.

Precisión y fiabilidad

¿Qué ocurre cuando mi agente de IA comete un error? Cuando un chatbot de IA comete un error, puede proporcionar información incorrecta, pero no se toma ninguna medida directamente. Si le pido a un chatbot de IA que me ayude a planificar un viaje, me ofrece un plan basado en texto, pero yo sigo siendo responsable de hacer las reservas, gestionar los pagos, etc. Hay una capa humana para evitar resultados no deseados. Sin embargo, cuando los agentes de IA realizan acciones en el mundo real, estas acciones pueden tener consecuencias reales no deseadas.

¿Quién es responsable cuando el agente de IA reserva vuelos equivocados o devuelve zapatos equivocados? Imagino que estos agentes preguntarán al usuario antes de realizar cada acción, pero no estoy seguro de que eso baste por sí solo para evitar errores en situaciones más complejas.

Las empresas como Google deben dar prioridad a procesos rigurosos de prueba y validación para minimizar estas imprecisiones. Será esencial poner en marcha mecanismos para comprobar los hechos, contrastar la información y proporcionar a los usuarios advertencias claras sobre la posibilidad de errores.

Implicaciones éticas

Las implicaciones éticas de Jarvis y de los agentes de IA, en general, van más allá de la privacidad y la precisión. Las empresas también deben considerar el impacto social más amplio de estos agentes, incluido el posible desplazamiento de puestos de trabajo y la creación de nuevas dependencias de los sistemas de IA.

Conclusión

Todo lo que hemos dicho sobre la IA Jarvis es especulativo. Hasta su lanzamiento, no sabremos con seguridad lo que hace. Sin embargo, una cosa es cierta: Los agentes de IA están llegando, y representan el siguiente paso en la revolución de la IA. 

Aunque reconozco que automatizar tareas es increíblemente útil y tiene el potencial de ahorrar cantidades significativas de tiempo, me incomoda la idea de dar el control de mi ordenador a una IA (o a cualquiera, para el caso).

En los últimos años, se ha debatido mucho sobre los peligros potenciales de la IA. Creo que mientras las IA se limiten a chatbots y no puedan realizar acciones en el mundo real, los riesgos son mínimos. Sí, una IA puede instruir a alguien sobre cómo hacer algo dañino, pero esa persona sigue teniendo que actuar en consecuencia. Si alguien realmente quiere aprender eso, podría adquirir los conocimientos de todos modos, si se le da el tiempo suficiente. Con los agentes de IA, perdemos esa capa de protección y eso suena realmente peligroso a medida que dotamos a estos agentes de más y más capacidades.

Creo que el avance hacia los agentes de IA es inevitable, pero debe abordarse con mucha cautela.


Photo of François Aubry
Author
François Aubry
LinkedIn
Enseñar siempre ha sido mi pasión. Desde mis primeros días como estudiante, busqué con entusiasmo oportunidades para dar clases particulares y ayudar a otros estudiantes. Esta pasión me llevó a realizar un doctorado, en el que también trabajé como ayudante de profesor para apoyar mis esfuerzos académicos. Durante esos años, encontré una inmensa satisfacción en el entorno tradicional del aula, fomentando las conexiones y facilitando el aprendizaje. Sin embargo, con la llegada de las plataformas de aprendizaje en línea, reconocí el potencial transformador de la educación digital. De hecho, participé activamente en el desarrollo de una plataforma de este tipo en nuestra universidad. Estoy profundamente comprometida con la integración de los principios de la enseñanza tradicional con metodologías digitales innovadoras. Mi pasión es crear cursos que no sólo sean atractivos e informativos, sino también accesibles para los alumnos en esta era digital.
Temas

Aprende IA con estos cursos

programa

Developing AI Applications

23hrs hr
Learn to create AI-powered applications with the latest AI developer tools, including the OpenAI API, Hugging Face, and LangChain.
Ver detallesRight Arrow
Comienza El Curso
Ver másRight Arrow
Relacionado

blog

Todo lo que sabemos sobre GPT-5

Predecir cómo podría ser la próxima evolución de la tecnología de IA de OpenAI y qué avances podría tener el modelo GPT-5.
Josep Ferrer's photo

Josep Ferrer

10 min

blog

Cómo aprender IA desde cero en 2024: Guía completa de los expertos

Descubre todo lo que necesitas saber sobre el aprendizaje de la IA en 2024, desde consejos para empezar, recursos útiles y opiniones de expertos del sector.
Adel Nehme's photo

Adel Nehme

20 min

An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.
Abid Ali Awan's photo

Abid Ali Awan

10 min

blog

Los 7 mejores generadores de vídeo de IA para 2024 con vídeos de ejemplo

Descubre los mejores generadores de vídeo de IA disponibles en la actualidad, como RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo y el esperadísimo Sora y Veo de DeepMind.
Dr Ana Rojo-Echeburúa's photo

Dr Ana Rojo-Echeburúa

9 min

tutorial

IA explicable - Comprender y confiar en los modelos de aprendizaje automático

Sumérjase en la IA explicable (XAI) y aprenda a generar confianza en los sistemas de IA con LIME y SHAP para la interpretabilidad de modelos. Comprender la importancia de la transparencia y la equidad en las decisiones basadas en la IA.
Zoumana Keita 's photo

Zoumana Keita

12 min

tutorial

Tutorial de la API de OpenAI Assistants

Una visión completa de la API Assistants con nuestro artículo, que ofrece una mirada en profundidad a sus características, usos en la industria, guía de configuración y las mejores prácticas para maximizar su potencial en diversas aplicaciones empresariales.
Zoumana Keita 's photo

Zoumana Keita

14 min

See MoreSee More