Saltar al contenido principal
InicioTutorialesInteligencia Artificial (IA)

Guía para principiantes de la API de OpenAI: Tutorial práctico y prácticas recomendadas

Este tutorial te presenta la API de OpenAI, sus casos de uso, un enfoque práctico para utilizar la API y todas las prácticas recomendadas que debes seguir.
abr 2024  · 13 min leer

Con el lanzamiento de ChatGPT, se habla mucho de la inteligencia artificial y sus aplicaciones en todo el mundo, especialmente entre partes interesadas de empresas con responsabilidades y perfiles no técnicos. Todas las empresas quieren utilizar la tecnología con la que han experimentado en ChatGPT, adaptada a su sector y a su crecimiento.

Pero ¿cómo podemos conseguirlo?

La respuesta es sencilla: las empresas pueden utilizar la API de OpenAI, en rápida evolución, creada y facilitada por los creadores de ChatGPT, para construir soluciones adaptadas a las necesidades de la empresa.

Como científicos de datos y profesionales del machine learning principiantes, sabemos que OpenAI existe desde hace tiempo, incluso antes de la explosión de ChatGPT, pero la mayoría de nosotros no lo utilizábamos para resolver problemas empresariales del sector. Con todos los avances de los últimos tiempos, es más importante que nunca comprender totalmente la API.

En este tutorial, haremos precisamente eso: presentaremos OpenAI y su API, practicaremos creando una cuenta de OpenAI y utilizando la API para obtener respuestas y hablaremos de las prácticas recomendadas a la hora de utilizar la API para proporcionar una visión completa de la API de OpenAI.

¿Te interesa ver OpenAPI en acción? Echa un vistazo a nuestro code-along sobre Creación de chatbots con la API de OpenAI y Pinecone:

Una visión general de OpenAI y su API

OpenAI es una empresa de investigación e implementación de IA que trabaja con la misión de garantizar que la inteligencia general artificial beneficie a toda la humanidad.

La empresa se fundó como organización sin ánimo de lucro en 2015, y en su equipo fundador había gente como Elon Musk y Sam Altman. A lo largo de los años, OpenAI ha pasado de ser una organización sin ánimo de lucro a convertirse en un modelo más diversificado para cumplir su misión, con asociaciones con gigantes tecnológicos como Microsoft.

¿Qué es la API de OpenAI?

La interfaz de programación de aplicaciones (API) de OpenAI sirve de puente hacia los potentes modelos de machine learning de OpenAI, permitiéndote integrar capacidades de IA de vanguardia en tus proyectos con relativa facilidad.

En términos más sencillos, la API es como un ayudante que te permite utilizar los programas inteligentes de OpenAI en tus proyectos. Por ejemplo, puedes añadir funciones interesantes como comprender y crear texto sin tener que conocer todos los detalles de los modelos subyacentes.

Características de la API de OpenAI

Estas son algunas de las características clave que hacen de la API de OpenAI una herramienta valiosa para cualquiera que desee incorporar la IA en su empresa:

1. Modelos de IA preentrenados

Los modelos preentrenados son modelos de machine learning que ya han sido entrenados con un gran conjunto de datos, a menudo en una tarea general, antes de utilizarse para una tarea específica. El equipo de OpenAI ha entrenado y publicado estos modelos en forma de API, lo que significa que "ellos los entrenan una vez, nosotros los utilizamos muchas veces", lo que puede suponer un enorme ahorro de tiempo y recursos.

Algunos de los modelos publicados son:

  • GPT-4: Versiones mejoradas de los modelos GPT-3.5, capaces de comprender y crear tanto texto como código.
  • GPT-3.5: Versiones mejoradas de los modelos GPT-3, capaces de comprender y generar texto o código.
  • GPT Base: Modelos que pueden procesar y generar texto o código, pero carecen de la capacidad de seguir instrucciones.
  • DALL-E: Un modelo que crea y modifica imágenes basándose en prompts de texto.
  • Whisper: Transforma entrada de audio en texto escrito.
  • Embeddings: Modelos que convierten texto en valores numéricos.
  • Moderation: Un modelo ajustado que identifica texto potencialmente confidencial o inseguro.

Estos modelos se han entrenado con enormes cantidades de datos y han utilizado una potencia informática significativamente alta, a menudo no disponible o asequible para particulares o incluso para muchas organizaciones. Ahora, los científicos de datos y las empresas pueden utilizar fácilmente los modelos preentrenados en forma de API.

2. Modelos de IA personalizables

La personalización de modelos en la API de OpenAI implica principalmente un proceso conocido como ajuste fino, que permite a los usuarios adaptar los modelos preentrenados para que se ajusten mejor a sus casos de uso específicos.

La API de OpenAI nos permite tomar los modelos preentrenados y utilizar nuestros datos de entrenamiento, seguir entrenando los modelos y utilizar los modelos ajustados para nuestros casos de uso. Puedes leer más sobre el proceso de ajuste fino de un modelo GPT-3 aquí. El ajuste fino ahorra costes y permite peticiones de menor latencia para las aplicaciones posteriores.

3. Interfaz de API sencilla

La plataforma de la API de OpenAI es intuitiva y fácil de usar para un principiante. Con unas cuantas líneas de código, gracias a la completa documentación y a los ejemplos de inicio rápido, es sencillo empezar a utilizar la API en tus casos de uso sin tener que superar una pronunciada curva de aprendizaje.

Esta sencillez es útil para las personas que están al principio de su carrera en el campo de los datos, ya que hace que el paso a la IA sea menos intimidatorio y más atractivo.

4. Infraestructura escalable

OpenAI ha escalado los clústeres Kubernetes hasta 7500 nodos para proporcionar una infraestructura escalable para grandes modelos como GPT-3, CLIP y DALL-E, así como para la investigación iterativa rápida a pequeña escala. Azure OpenAI Service se ejecuta en la infraestructura global Azure para satisfacer necesidades de producción como la seguridad empresarial crítica, el cumplimiento y la disponibilidad regional, lo que indica una infraestructura escalable para permitir el uso de la API de OpenAI.

A medida que tus proyectos se hacen mayores y más complejos, necesitas una infraestructura que pueda crecer con ellos. La capacidad de la API OpenAI para escalar cuando aumenta el uso es especialmente útil cuando pasas de proyectos pequeños a otros mayores y más exigentes, lo que hace de la API de OpenAI una herramienta fiable para tus proyectos.

Casos de uso sectoriales de la API de OpenAI

Más de 300 aplicaciones utilizan ya GPT-3 mediante la API de OpenAI, lo que indica que se está desarrollando una amplia gama de aplicaciones creativas y únicas en todo el mundo. Estas son algunas de las aplicaciones sectoriales habituales de la API de OpenAI:

1. Chatbots y asistentes virtuales

La capacidad de la API de OpenAI para comprender y generar texto similar al humano la convierte en una candidata ideal para crear chatbots y asistentes virtuales inteligentes. Los modelos preentrenados como GPT-4 o ChatGPT pueden emplearse para potenciar agentes conversacionales que puedan interactuar con los usuarios de forma natural e intuitiva. Estos agentes pueden implementarse en sitios web, aplicaciones o plataformas de atención al cliente para mejorar la participación de los usuarios y proporcionar asistencia automatizada.

2. Análisis del sentimiento

El análisis del sentimiento consiste en comprender el sentimiento que hay detrás de los datos textuales. Con la API de OpenAI, puedes analizar las opiniones de los clientes, los comentarios de las redes sociales o cualquier dato textual para medir la opinión pública o la satisfacción de los clientes. Utilizando modelos como GPT-4 o 3.5, puedes automatizar el proceso del análisis del sentimiento, obteniendo información que puede ser fundamental para las estrategias empresariales.

3. Reconocimiento de imágenes

Aunque OpenAI suele asociarse al procesamiento de textos, también se aventura en el dominio del reconocimiento de imágenes con modelos como CLIP. CLIP es un modelo que aprende conceptos visuales a partir de descripciones en lenguaje natural y puede emplearse mediante la API de OpenAI para tareas como detección de objetos, clasificación de imágenes, etc. Esto abre posibilidades en diversos campos, incluida la sanidad, donde el reconocimiento de imágenes puede utilizarse para identificar enfermedades a partir de datos de imagen.

4. Juegos y aprendizaje por refuerzo

La API de OpenAI también tiene aplicación en el sector del juego y en entornos de aprendizaje por refuerzo. Los modelos pueden entrenarse o ajustarse para interactuar con entornos de juego, tomando decisiones para jugar de forma autónoma o ayudar a los jugadores.

OpenAI lo ha demostrado con modelos como Dactyl, que aprendió a resolver un cubo de Rubik utilizando el aprendizaje por refuerzo, y OpenAI Five, que compitió contra jugadores humanos en el juego Dota 2.

Ahora que ya hemos entendido la API de OpenAI y sus casos de uso, vamos a empezar a utilizarla.

Práctica: Primeros pasos con la API de OpenAI

Supongamos que eres un principiante absoluto en la API de OpenAI y realicemos tu primera llamada a la API paso a paso.

Paso 1: Crear una cuenta en la plataforma OpenAI

Antes de nada, necesitarás una cuenta en la plataforma OpenAI.

Ve a la plataforma de OpenAI y sigue las instrucciones para crear una cuenta. Tras registrarte, deberías ver algo así:

Página de inicio de la plataforma OpenAI

Paso 2: Conseguir tu clave de API

Una vez configurada tu cuenta, tendrás que recuperar tu clave de API, que es esencial para interactuar con la API.

Ve a la página de claves de API de tu cuenta de OpenAI, como se muestra en el diagrama siguiente.

Submenú de claves de API

Ahora puedes crear una clave de API, que tienes que copiar y guardar a buen recaudo, ya que no podrás volver a verla. Sin embargo, si la pierdes o necesitas una nueva, se puede generar una nueva.

Botón de creación de nueva clave secreta

Paso 3: Instalar la biblioteca Python de OpenAI

Ahora que la configuración de la cuenta y las claves de API están listas, el siguiente paso es trabajar en la configuración de nuestro equipo local. Podemos acceder a la API de OpenAI desde nuestro equipo local mediante la biblioteca Python de OpenAI.

Puedes instalarla con pip utilizando el comando que aparece a continuación:

pip install openai

Paso 4: Hacer tu primera llamada a la API

Ahora que tienes tu clave de API y la biblioteca de OpenAI instalada, es hora de hacer tu primera llamada a la API.

Aquí tienes el código para hacerlo:

def get_chat_completion(prompt, model="gpt-3.5-turbo"):
  
   # Creating a message as required by the API
   messages = [{"role": "user", "content": prompt}]
  
   # Calling the ChatCompletion API
   response = openai.ChatCompletion.create(
       model=model,
       messages=messages,
       temperature=0,
   )

   # Returning the extracted response
   return response.choices[0].message["content"]

response = get_chat_completion("Translate into Spanish: As a beginner data scientist, I'm excited to learn about OpenAI API!")

print(response)

Escribimos una función helper para utilizar la API de ChatCompletion seleccionando el modelo "gpt-3.5-turbo", que acepta el prompt generado por el usuario y devuelve la respuesta.

He aquí la respuesta (puedes validarla si sabes español):

Traducción al español mediante la API

Paso 5: Explorar más

Tras tu primera llamada a la API, vas por buen camino. Aquí tienes algunos pasos que debes tener en cuenta:

  • Explora diferentes motores y encuentra lo que mejor se adapte a tu caso de uso.
  • Experimenta con diferentes prompts y parámetros para ver cómo responde la API.
  • Sumérgete en la documentación de OpenAI para saber más sobre lo que puedes hacer con la API.

La idea es que a partir de aquí tienes que descubrir cómo puedes utilizar la API para el problema empresarial que tienes entre manos (hay más recursos al final del tutorial).

Prácticas recomendadas a la hora de utilizar la API de OpenAI

Ahora que ya te sientes cómodo con la API, aquí tienes algunas prácticas recomendadas que debes tener en cuenta antes de utilizarla en tus proyectos:

1. Comprender los precios de la API

La API proporciona una serie de modelos, cada uno con distintas capacidades y precios, según el enfoque de pagar por lo que uses. Los costes se calculan por cada 1000 tokens, y los tokens son esencialmente fragmentos de palabras: 1000 tokens equivalen a unas 750 palabras. Tienes los precios actualizados de todos los modelos en la página de precios de OpenAI.

Cuando te registras, empiezas con 5 $ de crédito gratuito que puedes utilizar durante tus tres primeros meses. Puedes probar el tutorial y comprender mejor la API antes de decidirte a pagar.

2. Proteger tu clave de API

En lugar de usar la codificación rígida con tu clave de API directamente en el código fuente de tu aplicación, utiliza variables de entorno para almacenar y recuperar la clave de API, que es una práctica más segura.

Además, es difícil gestionar las claves de API con codificación rígida, especialmente en un entorno de equipo. Si hay que girar o cambiar la clave, es necesario encontrar y actualizar cada instancia de la clave con codificación rígida en el código fuente.

3. Utilizar los modelos más recientes

OpenAI recomienda utilizar los modelos más recientes para el problema que quieras resolver cuando haya varias versiones disponibles. Esto tiene sentido, ya que los modelos más recientes son más capaces, pero también tienen un coste más elevado. En general, merece la pena experimentar con algunos modelos disponibles y elegir el que mejor se adapte a las necesidades de tu caso de uso, teniendo en cuenta la relación coste-rendimiento.

4. Utilizar eficientemente los límites de tokens mediante el procesamiento por lotes

El procesamiento por lotes es una técnica que te permite agrupar varias tareas en una única petición API para procesarlas juntas de forma eficiente, en lugar de enviar peticiones individuales para cada tarea.

La API de OpenAI impone límites separados para el número de peticiones por minuto y el número de tokens por minuto que puedes procesar. Si vas a alcanzar el límite de peticiones por minuto, pero tienes capacidad no utilizada en el límite de tokens por minuto, el procesamiento por lotes puede ayudar a utilizar esta capacidad de forma eficiente.

Al agrupar varias tareas menores en una sola petición, reduces el número total de peticiones enviadas y puedes procesar más tokens en una sola petición, manteniéndote así por debajo de los límites de tarifa y optimizando los costes.

Conclusión

Si eres relativamente nuevo en ciencia de datos, puede que no hayas usado mucho las API. Aunque eso era normal en el pasado, con el rápido progreso y las capacidades de IA de empresas como OpenAI, saber cómo utilizar eficazmente sus modelos preentrenados (y ajustarlos) desde su API se ha convertido en una habilidad esencial para que todo científico de datos ahorre tiempo, costes y otros recursos.

Este tutorial ha presentado OpenAI, su API y algunos casos de uso específicos del sector frecuentes para ella. En él, también has usado la API de OpenAI y conocido las prácticas recomendadas.

El siguiente paso sería ampliar tus conocimientos sobre la API de OpenAI utilizando tutoriales como:

Si prefieres un enfoque guiado que te proporcione una experiencia práctica que complemente este tutorial, consulta nuestro curso Trabajo con la API de OpenAI.

Temas

¡Comienza hoy tu viaje a la IA!

Course

Introduction to ChatGPT

1 hr
192.3K
Learn how to use ChatGPT. Discover best practices for writing prompts and explore common business use cases for the powerful AI tool.
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

blog

Todo lo que sabemos sobre GPT-5

Predecir cómo podría ser la próxima evolución de la tecnología de IA de OpenAI y qué avances podría tener el modelo GPT-5.
Josep Ferrer's photo

Josep Ferrer

10 min

blog

Los 16 mejores marcos y bibliotecas de IA: Guía para principiantes

Explore los mejores marcos y bibliotecas de IA y sus fundamentos en esta guía definitiva para profesionales de datos noveles que comienzan su carrera profesional.
Yuliya Melnik's photo

Yuliya Melnik

15 min

blog

¿Qué es la tokenización?

La tokenización divide el texto en partes más pequeñas para facilitar el análisis mecánico y ayudar a las máquinas a comprender el lenguaje humano.
Abid Ali Awan's photo

Abid Ali Awan

9 min

tutorial

Primeros pasos con Claude 3 y la API de Claude 3

Conozca los modelos Claude 3, las pruebas de rendimiento detalladas y cómo acceder a ellas. Además, descubra la nueva API Python de Claude 3 para generar texto, acceder a funciones de visión y streaming.
Abid Ali Awan's photo

Abid Ali Awan

tutorial

Guía introductoria para perfeccionar los LLM

La puesta a punto de grandes modelos lingüísticos (LLM) ha revolucionado el Procesamiento del Lenguaje Natural (PLN), ofreciendo capacidades sin precedentes en tareas como la traducción de idiomas, el análisis de sentimientos y la generación de textos. Este enfoque transformador aprovecha modelos preentrenados como GPT-2, mejorando su rendimiento en dominios específicos mediante el proceso de ajuste fino.
Josep Ferrer's photo

Josep Ferrer

12 min

tutorial

Cómo utilizar la API de conversión de texto a voz de OpenAI

La API TTS de OpenAI es un punto final que permite a los usuarios interactuar con su modelo de inteligencia artificial TTS, que convierte el texto en lenguaje hablado con sonido natural.
Kurtis Pykes 's photo

Kurtis Pykes

12 min

See MoreSee More