¡Potencia tus aplicaciones con la API de OpenAI! Guía introductoria.

octubre 19, 2024

Desde hace varias semanas hemos comenzado a explorar el uso de las API, con el objetivo de mejorar nuestra eficiencia en el trabajo diario. Hemos revisado conceptos fundamentales para entender cómo funcionan, así como cómo herramientas como Zapier nos permiten crear flujos de trabajo automáticos de manera sencilla y sin necesidad de programación. Hoy daremos un paso más para conocer la API de OpenAI, uno de los líderes en la revolución de la inteligencia artificial.

La API de OpenAI ofrece modelos avanzados de procesamiento de lenguaje natural, como GPT-4, que facilitan la creación de aplicaciones capaces de comprender y generar texto con alta precisión y fluidez. Esta guía te ayudará a entender en profundidad qué es la API de OpenAI, sus posibles aplicaciones, cómo empezar a utilizarla, el funcionamiento de los tokens, los costos asociados y cómo realizar peticiones básicas utilizando Postman. Utilizaremos la segunda persona del singular para hacer la explicación más directa y accesible.

Contenido del artículo:

¿Qué es la API de OpenAI?
Aplicaciones de la API de OpenAI
Requisitos para empezar a usar la API de OpenAI
Concepto de tokens y su relación con el costo
- 5.1. Explicación de ‘Prompt’ y ‘Completación’
- 5.2. Ejemplo práctico con 1,000 tokens
- 5.3. Ejemplos de acciones que puedes realizar con 1,000 tokens
Ejemplos de peticiones comunes con Postman
Conceptos clave
Notas finales

1. ¿Qué es la API de OpenAI?

La API de OpenAI es una interfaz que te permite integrar funcionalidades avanzadas de inteligencia artificial en tus aplicaciones, sin necesidad de entrenar modelos desde cero. Al conectarte a esta API, puedes acceder a modelos como GPT-4 y hacer que respondan preguntas, generen contenido, traduzcan idiomas y mucho más.

La API procesa el texto que le envías y responde de acuerdo con las instrucciones que le das. Esto permite que tu aplicación ofrezca respuestas rápidas, precisas y naturales a tus usuarios, mejorando su experiencia.

2. Aplicaciones de la API de OpenAI

La API de OpenAI es versátil y tiene aplicaciones en una amplia variedad de áreas. Aquí tienes algunos ejemplos de lo que puedes hacer con esta herramienta:

Generación de contenido: Escribir artículos, publicaciones en redes sociales, correos electrónicos y otros tipos de texto de forma automática.
Atención al cliente y chatbots: Proporcionar respuestas automáticas y personalizadas a las preguntas de los usuarios.
Análisis de texto y resúmenes: Procesar grandes cantidades de texto para extraer información relevante o resumir contenido.
Traducción automática: Convertir texto de un idioma a otro de forma precisa y rápida.
Aplicaciones educativas: Crear herramientas de aprendizaje que respondan preguntas y proporcionen explicaciones en tiempo real.

3. Requisitos para empezar a usar la API de OpenAI

Para utilizar la API de OpenAI, necesitas cumplir con ciertos requisitos iniciales:

Crear una cuenta en OpenAI: Regístrate en la plataforma de OpenAI para gestionar el uso y la facturación de la API.
Obtener una clave de API: OpenAI te proporcionará una clave única que usarás para autenticar tus solicitudes. Puedes encontrarla aqui.
Familiarizarte con las bibliotecas de programación necesarias: Aunque la API es compatible con varios lenguajes de programación, Python es el más común. La biblioteca openai en Python facilita la conexión con la API.
Configurar un entorno de desarrollo: Puedes usar un editor de código como Visual Studio Code o un entorno en la nube. Asegúrate de poder instalar y utilizar la biblioteca openai.
Gestión del uso y la facturación: La API de OpenAI tiene un costo asociado según los tokens que utilices. Puedes revisar el panel de control de OpenAI para establecer límites y gestionar el consumo.

4. Concepto de tokens y su relación con el costo

En la API de OpenAI, un token es una unidad de texto que puede ser una palabra completa, una sílaba o incluso una fracción de palabra. Cada solicitud que haces utiliza un número específico de tokens tanto para el texto de entrada como para el de salida, y esta cantidad determina el costo de la solicitud.

La facturación de OpenAI se basa en el número de tokens procesados, y cada modelo tiene un costo específico por cada mil tokens. A continuación, se muestra una tabla con ejemplos de costos aproximados en dólares para distintos modelos en función de la cantidad de texto.

Servicio / Modelo	Precio
GPT-4 (8K contexto)
– Tokens de entrada (Prompt)	$0.03 por cada 1,000 tokens
– Tokens de salida (Completación)	$0.06 por cada 1,000 tokens
GPT-4 (32K contexto)
– Tokens de entrada (Prompt)	$0.06 por cada 1,000 tokens
– Tokens de salida (Completación)	$0.12 por cada 1,000 tokens
GPT-3.5 Turbo
– Tokens de entrada (Prompt)	$0.0015 por cada 1,000 tokens
– Tokens de salida (Completación)	$0.002 por cada 1,000 tokens
GPT-3.5 Turbo (16K contexto)
– Tokens de entrada (Prompt)	$0.003 por cada 1,000 tokens
– Tokens de salida (Completación)	$0.004 por cada 1,000 tokens
Embeddings (Text Embedding Ada-002)	$0.0001 por cada 1,000 tokens
Generación de imágenes (DALL·E)	$0.02 por imagen generada
Conversión de voz a texto (Whisper API)	$0.006 por minuto de audio

Tabla que resume el costo de los tokens de la API de OpenAI, puedes ver más detalles aquí.

OpenAI ofrece una variedad de modelos y servicios a través de su API, cada uno con su propia estructura de precios:

GPT-4: Disponible con contextos de 8K y 32K tokens. Es el modelo más avanzado, ideal para tareas complejas que requieren comprensión profunda y generación de lenguaje natural de alta calidad. Los precios varían entre $0.03 y $0.12 por cada 1,000 tokens, dependiendo del tamaño del contexto y si los tokens son de entrada o de salida.
GPT-3.5 Turbo: Un modelo potente y más accesible en términos de costo, adecuado para una amplia gama de aplicaciones. Ofrece contextos de 4K y 16K tokens, con precios desde $0.0015 hasta $0.004 por cada 1,000 tokens.
Embeddings: Utiliza el modelo Text Embedding Ada-002 para convertir texto en representaciones numéricas, útiles para tareas como búsqueda semántica y clasificación. El costo es de $0.0001 por cada 1,000 tokens.
Generación de imágenes (DALL·E): Permite la creación de imágenes a partir de descripciones textuales, con un costo de $0.02 por imagen generada.
Conversión de voz a texto (Whisper API): Transcribe audio a texto con alta precisión por $0.006 por minuto de audio.

Estos servicios te permiten seleccionar el modelo que mejor se adapte a tus necesidades técnicas y presupuestarias, facilitando la integración de capacidades avanzadas de IA en tus aplicaciones.

4.1. Explicación de ‘Prompt’ y ‘Completación’

Prompt: Es la entrada o la solicitud que le das al modelo. Es la pregunta, el texto o la instrucción que envías para obtener una respuesta. En otras palabras, es el texto que introduces para que el modelo genere una respuesta.
Completación: Es la salida o respuesta generada por el modelo basada en el prompt que proporcionaste. Es la parte que el modelo produce como resultado del análisis de tu prompt.

4.2. Ejemplo práctico con 1,000 tokens

Supongamos que tienes un prompt que es una solicitud larga, como una breve historia o un texto complejo, y deseas que el modelo la complete o responda de forma detallada:

Prompt: «Escribe un ensayo de introducción sobre la importancia de la tecnología en la educación.» Este es tu texto de entrada, que podría consumir unos 200 tokens si es un enunciado largo.
Completación: El modelo responde con un ensayo completo sobre el tema. La respuesta generada podría tener 800 tokens.
Total de tokens: En este caso, el uso total sería de 1,000 tokens (200 del prompt + 800 de la completación).

4.3. Ejemplos de acciones que puedes realizar con 1,000 tokens

Resumen de un artículo: Puedes pedir un resumen de un artículo de hasta 800 palabras.
Conversación en chatbot: Realizar varias preguntas y respuestas cortas con un asistente de IA.
Generación de un ensayo corto: Crear un ensayo o un artículo breve sobre un tema en particular.
Traducción de un texto breve: Traducir un texto de unas 500-600 palabras.

5. Ejemplos de peticiones comunes con Postman

Para realizar peticiones a la API de OpenAI, puedes utilizar Postman. A continuación, te explico cómo hacer algunas de las peticiones más comunes y qué significa cada campo en el JSON.

Configuración inicial en Postman

Crear una nueva solicitud: En Postman, crea una nueva solicitud con método POST.
URL: Ingresa https://api.openai.com/v1/chat/completions.
Headers:

Authorization: Bearer TU_CLAVE_DE_API. Reemplaza TU_CLAVE_DE_API con tu clave real de API proporcionada por OpenAI.
Content-Type: application/json.

Ejemplo 1: Generación de texto básico

JSON para el cuerpo de la solicitud:

{
  "model": "gpt-4",
  "messages": [
    {
      "role": "system",
      "content": "Eres un asistente útil."
    },
    {
      "role": "user",
      "content": "¿Cuál es la capital de Francia?"
    }
  ],
  "temperature": 0.7
}

Explicación de cada campo:

"model": "gpt-4": Especifica el modelo de IA que deseas utilizar.
"messages": Es una lista de mensajes que forman la conversación.
{ "role": "system", "content": "Eres un asistente útil." }: Define el comportamiento general del asistente. El rol system establece el contexto o las instrucciones iniciales para el modelo.
{ "role": "user", "content": "¿Cuál es la capital de Francia?" }: Representa el mensaje del usuario o la pregunta que haces al modelo.
"temperature": 0.7: Controla la aleatoriedad de la respuesta. Valores más bajos hacen que las respuestas sean más deterministas, mientras que valores más altos permiten más creatividad.

Ejemplo 2: Traducción de texto

JSON para traducir una frase del español al inglés:

{
  "model": "gpt-4",
  "messages": [
    {
      "role": "system",
      "content": "Eres un traductor de español a inglés."
    },
    {
      "role": "user",
      "content": "¿Puedes traducir esta frase al inglés? 'La tecnología es el futuro de la humanidad.'"
    }
  ],
  "temperature": 0.3
}

Explicación de cada campo:

"model": "gpt-4": Indica el modelo que utilizarás.
"messages": Lista de mensajes en la conversación.
{ "role": "system", "content": "Eres un traductor de español a inglés." }: Establece que el modelo actuará como un traductor.
{ "role": "user", "content": "¿Puedes traducir esta frase al inglés? 'La tecnología es el futuro de la humanidad.'" }: La frase que deseas traducir.
"temperature": 0.3: Un valor más bajo para obtener traducciones más precisas y menos creativas.

Ejemplo 3: Completado de código

Para pedir a la IA que complete una función en Python:

{
  "model": "gpt-4",
  "messages": [
    {
      "role": "system",
      "content": "Eres un asistente de programación en Python."
    },
    {
      "role": "user",
      "content": "Escribe una función en Python para verificar si un número es primo."
    }
  ],
  "temperature": 0.2
}

Explicación de cada campo:

"model": "gpt-4": Especifica el modelo de IA.
"messages": Conversación entre el usuario y el asistente.
{ "role": "system", "content": "Eres un asistente de programación en Python." }: Indica al modelo que debe proporcionar ayuda en programación Python.
{ "role": "user", "content": "Escribe una función en Python para verificar si un número es primo." }: La solicitud específica que haces al modelo.
"temperature": 0.2: Un valor bajo para respuestas más precisas y técnicas.

7. Conceptos clave

Para comprender mejor esta guía, aquí tienes algunos conceptos técnicos explicados de forma sencilla:

API (Interfaz de Programación de Aplicaciones): Es una herramienta que permite a dos programas comunicarse entre sí. En este caso, la API de OpenAI te permite acceder a modelos de IA para usarlos en tus propias aplicaciones.
Token: Es una pequeña unidad de texto que la IA procesa. Puede ser una palabra, una sílaba o incluso una parte de una palabra. La cantidad de tokens utilizados afecta el costo de cada solicitud.
Modelo de IA: Es un sistema entrenado para realizar tareas específicas, como responder preguntas o traducir texto. En OpenAI, los modelos más conocidos son GPT-3.5 y GPT-4.
JSON (JavaScript Object Notation): Es un formato de datos que se utiliza para estructurar la información que envías y recibes de la API. Es una forma sencilla de organizar datos en forma de texto.
Postman: Es una herramienta para realizar peticiones HTTP. Te permite interactuar con APIs y visualizar las respuestas que recibes.
Contexto de tokens: La cantidad de tokens que un modelo puede manejar a la vez, como 8K o 32K tokens, lo que define el límite de información que el modelo puede recibir y generar en una sola solicitud.
Embeddings: Representación numérica de palabras o frases, usada para entender la relación entre términos en aplicaciones como búsquedas o clasificación.

8. Notas finales

La API de OpenAI te brinda la oportunidad de integrar capacidades avanzadas de inteligencia artificial en tus aplicaciones sin la necesidad de construir modelos desde cero. Con modelos como GPT-4 y GPT-3.5, puedes desarrollar soluciones que generan contenido, traducen texto, asisten en programación y mucho más.

Entender el funcionamiento de los tokens y cómo afectan al costo te permitirá optimizar tus solicitudes y controlar tu presupuesto. Además, herramientas como Postman facilitan la interacción con la API, permitiéndote probar y desarrollar tus aplicaciones de manera eficiente.

Al aprovechar esta tecnología, puedes ofrecer experiencias más ricas y personalizadas a tus usuarios, manteniéndote a la vanguardia en un mundo cada vez más impulsado por la inteligencia artificial.

En próximas entregas te enseñaré cómo hacer peticiones a la API de OpenAI utilizando Postman.

¡Hasta entonces!

Post Views: 177