Precios de Amazon Bedrock

Información general sobre precios

Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de funcionalidades que necesita para crear aplicaciones de IA generativa con seguridad, privacidad e IA responsable.

Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puede elegir entre dos precios de planes a modo de inferencia: 1. Bajo demanda y por lotes: este modo le permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2. Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.

Modelos de precios

Con el modo bajo demanda, solo paga por lo que utiliza, sin compromisos de plazo basados en el tiempo. En el caso de los modelos de generación de texto, se le cobra por cada token de entrada procesado y por cada token de salida generado. En el caso de los modelos de incrustación, se le cobra por cada token de entrada procesado. Un token está compuesto de unos pocos caracteres y se refiere a la unidad básica de texto que un modelo aprende para entender la entrada y el mensaje del usuario. En el caso de los modelos de generación de imágenes, se le cobra por cada imagen generada. Inferencia entre regiones: el modo bajo demanda también admite la inferencia entre regiones para algunos modelos. Permite a los desarrolladores administrar sin problemas las ráfagas de tráfico mediante el uso informático en diferentes regiones de AWS y obtener límites de rendimiento más altos y una mayor resiliencia. El uso de la inferencia interregional no conlleva ningún costo adicional, y el precio se calcula en función de la región en la que se realizó la solicitud (región de origen).

Con el modo por lotes, puede proporcionar un conjunto de solicitudes como un único archivo de entrada y recibir respuestas como un único archivo de salida, lo que le permite obtener predicciones simultáneas a gran escala. Las respuestas se procesan y almacenan en su bucket de Amazon S3 para que pueda acceder a ellas más adelante. Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

Con el modo de rendimiento aprovisionado, puede comprar unidades de modelo para un modelo base o personalizado específico. El modo de rendimiento aprovisionado se ha diseñado principalmente para grandes cargas de trabajo de inferencia consistentes que necesitan un rendimiento garantizado. Solo se puede acceder a los modelos personalizados mediante el rendimiento aprovisionado. Una unidad de modelo proporciona un rendimiento determinado, que se mide por la cantidad máxima de tokens de entrada o salida procesados por minuto. Con el rendimiento aprovisionado, se le cobra por hora y tiene la flexibilidad de elegir entre plazos de compromiso de 1 o 6 meses.

Con Amazon Bedrock, puede personalizar los FM con sus datos para ofrecer respuestas personalizadas a tareas específicas y su contexto empresarial. Puede ajustar de forma precisa los modelos con datos etiquetados o utilizar un entrenamiento previo continuo con datos sin etiquetar. Para personalizar un modelo de generación de texto, se le cobra por el entrenamiento del modelo en función de la cantidad total de tokens procesados por el modelo (la cantidad de tokens en el corpus de datos de entrenamiento × por la cantidad de épocas) y el almacenamiento del modelo se cobra por mes por modelo. Una época es un ciclo completo a través de su conjunto de datos de entrenamiento durante el ajuste de precisión o el entrenamiento previo continuo. Las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que compre este plan. Una unidad de modelo se encuentra disponible sin plazo de compromiso para su inferencia en un modelo personalizado. Se le cobrará por la cantidad de horas que utilice en la primera unidad de modelo para la inferencia de modelos personalizados. Si desea aumentar su rendimiento más allá de una unidad de modelo, debe adquirir un plazo de compromiso de 1 o 6 meses.

Custom Model Import le permite aprovechar sus inversiones anteriores en personalización de modelos en Amazon Bedrock y consumirlas de la misma manera totalmente administrada que los modelos existentes de Bedrock. Puede importar pesos personalizados para las arquitecturas de modelos compatibles y servir el modelo personalizado mediante el modo bajo de demanda. La importación de un modelo personalizado a Bedrock es gratuita. Una vez que importe un modelo, podrá acceder a él bajo demanda sin necesidad de realizar ninguna acción en el plano de control. Solo se le cobra por la inferencia del modelo, en función del número de copias de su modelo personalizado necesarias para atender su volumen de inferencias y del tiempo que cada copia del modelo esté activa, facturado en intervalos de 5 minutos. Una copia del modelo es una instancia única de un modelo importado lista para atender las solicitudes de inferencia. El precio por copia del modelo por minuto depende de factores como la arquitectura, la longitud del contexto, la región de AWS y la versión de la unidad de procesamiento (generación de hardware) y se distribuye por niveles según el tamaño de la copia del modelo.

Herramientas avanzadas

Los agentes de Amazon Bedrock le ofrecen la posibilidad de crear y configurar agentes autónomos dentro de su aplicación. Estos agentes se conectan de manera segura a los orígenes de datos de su empresa y mejoran las solicitudes de los usuarios con la información correcta para generar respuestas precisas. En tan solo unos pasos rápidos, puede crear un agente en Amazon Bedrock y acelerar el tiempo de creación de aplicaciones de IA generativa. Estos agentes admiten la interpretación de código para generar y ejecutar código de forma dinámica, así como para devolver el control, lo que permite definir un esquema de acción y recuperar el control cada vez que el agente invoca la acción. Además, los agentes de Amazon Bedrock pueden retener la memoria entre todas las interacciones, lo que ofrece experiencias de usuario más personalizadas y fluidas.

Las barreras de protección de Amazon Bedrock lo ayudan a implementar barreras de seguridad personalizadas y políticas de IA responsable para sus aplicaciones de IA generativa. Proporciona protecciones de seguridad personalizables adicionales además de las protecciones nativas que ofrecen los FM. Es la única capacidad de IA responsable ofrecida por un proveedor de nube importante que ayuda a habilitar a los clientes a crear y personalizar protecciones de seguridad, privacidad y veracidad para las aplicaciones de IA generativa en una única solución. Son compatibles con todos los FM de Amazon Bedrock, así como con modelos refinados. Las barreras de protección de Bedrock también se pueden integrar en los agentes y las bases de conocimiento de Amazon Bedrock para crear aplicaciones de IA generativa alineadas con sus políticas de IA responsable. Además, ofrecen una API ApplyGuardrail para ayudar a evaluar las entradas de los usuarios y modelar las respuestas que genera cualquier modelo fundacional personalizado o externo por fuera de Bedrock.

Las bases de conocimiento de Amazon Bedrock proporcionan un flujo de trabajo de generación aumentada (RAG) de recuperación y recuperación (RAG) de extremo a extremo totalmente administrado, que permite a los administradores y agentes acceder a la información contextual de los orígenes de datos privadas de su empresa. Esto les permite ofrecer respuestas más relevantes, precisas y personalizadas. Puede conectar de forma segura los FM y los agentes a varios orígenes de datos, como Amazon S3, Confluence, Salesforce y SharePoint. Si no tiene una base de datos vectorial existente, Amazon Bedrock crea un almacén vectorial de Amazon OpenSearch sin servidor para usted. Si no, puede especificar un almacén vectorial existente en las bases de datos compatibles, como Amazon OpenSearch sin servidor, Pinecone, Redis Enterprise Cloud, Amazon Aurora y MongoDB. También puede refinar la recuperación y la incorporación para lograr una mayor precisión en todos los casos de uso con opciones de análisis avanzadas para datos no estructurados, opciones de fragmentación de datos como la fragmentación personalizada o estrategias de fragmentación integradas que incluyen la fragmentación predeterminada, de tamaño fijo, sin fragmentación, jerárquica o semántica.

Con la evaluación de modelos en Amazon Bedrock, paga por lo que usa, sin compromisos de volumen en cuanto al número de solicitudes o respuestas. En el caso de la evaluación automática, solo paga por la inferencia del modelo que haya elegido en la evaluación. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada. Una tarea humana se define como la instancia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación; también es el mismo sin importar el número de métricas de la evaluación y los métodos de calificación que incluya. Los cargos por las tareas humanas aparecerán en la sección Amazon SageMaker de su factura de AWS y son los mismos para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted. En el caso de una evaluación administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Detalles sobre los precios

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

  • AI21 Labs
  • AI21 Labs

    Precios bajo demanda

    Modelos de AI21 Labs Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic-2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
  • Amazon

  • Anthropic
  • Anthropic

    Precios bajo demanda y por lotes

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 3.5 Haiku

    0,001 USD

    0,005 USD

    0,0005 USD

    0,0025 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 2.0

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

    *Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón)
    **Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región del oeste de EE. UU. (Oregón)

    Región: Europa (Londres)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Región: Europa (Zúrich)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Región: América del Sur (San Pablo)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Región: Canadá (centro)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Bombay)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Sídney)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Tokio)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

     

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Región: Asia-Pacífico (Singapur)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0,0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

    N/D

    Región: Europa (París)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Región: Europa (Fráncfort)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Región: Asia-Pacífico (Seúl)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Región: Este de EE. UU. (Ohio)

    Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Precios del rendimiento aprovisionado

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Anthropic Precio por hora y modelo
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0 y 2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Modelos de Anthropic Precio por hora y modelo
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0 y 2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Región: Asia-Pacífico (Tokio)

    Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    53,00 USD

    29,00 USD

    Claude 2.0/2.1

    86,00 USD

    48,00 USD

    Región: Europa (Fráncfort)

    Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Claude Instant

    49,00 USD

    27,00 USD

    Claude 2.0/2.1

    79,00 USD

    44,00 USD

    Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo. 

  • Cohere
  • Cohere

    Precios bajo demanda

    Modelos de Cohere Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
    Command 0,0015 USD 0,0020 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Embed: inglés 0,0001 USD N/D
    Embed: multilingüe 0,0001 USD N/D

    Precios por la personalización (ajuste preciso)

    Modelos de Cohere Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

    Cohere Command

    0,004 USD

    1,95 USD

    49,50 USD

    Cohere Command-Light 0,001 USD

    1,95 USD

    8,56 USD

    * El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

    Precios del rendimiento aprovisionado

    Modelos de Cohere Precio por hora y modelo 
    sin compromiso
    Precio por hora por unidad de modelo con un compromiso de 1 mes

    Precio por hora por unidad de modelo con un compromiso de 6 mes

    Cohere Command

    49,50 USD

    39,60 USD

    23,77 USD

    Cohere Command: Light 8,56 USD

    6,85 USD

    4,11 USD
    Embed: inglés 7,12 USD

    6,76 USD

    6,41 USD
    Embed: multilingüe 7,12 USD

    6,76 USD

    6,41 USD

    Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo. 

  • Meta Llama
  • Meta Llama

    Llama 3.2

    Precios bajo demanda y por lotes

    Llama 3.1

    Precios bajo demanda y por lotes

    Precios por la personalización del modelo (ajuste preciso)

    Precios del rendimiento aprovisionado

    Llama 3

    Precios bajo demanda 

    Llama 2

    Precios bajo demanda 

    Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

    Modelos de Meta Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

    Llama 2 Chat (13B)

    0,00075 USD

    0,001 USD

    Llama 2 Chat (70B)

    0,00195 USD

    0,00256 USD

    Precios por la personalización del modelo (ajuste preciso)

    Modelos de Meta Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

    Llama 2 Pretrained (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Pretrained (70B)

    0,00799 USD

    1,95 USD 23,50 USD

    * Almacenamiento de modelo personalizado = 1,95 USD

    Precios del rendimiento aprovisionado

    Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

    Llama 2 Pretrained y Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Pretrained (70B)

    21,18 USD

    13,08 USD

    * Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización. 

    Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Precios bajo demanda

    Modelo de Stability AI Precio por imagen generada
    Stable Image Core 0,04 USD
    SD3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.

    Modelo de Stability AI Resolución de imagen Precio por imagen generada de calidad estándar (<=50 pasos) Precio por imagen generada de calidad premium (>50 pasos)
    SDXL 1.0 Hasta 1024 x 1024 0,04 USD 0,08 USD

    Precios del rendimiento aprovisionado

    Modelo de Stability AI Precio por hora por unidad de modelo con un compromiso de 1 mes* Precio por hora por unidad de modelo con un compromiso de 6 mes*

    SDXL 1.0

    49,86 USD

    46,18 USD

    *Incluye inferencia para modelos básicos y personalizados

    Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

    Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.

  • Importación de modelos personalizados
  • Importación de modelos personalizados

    • Llama
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Llama multimodal
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.2 11B 128K requiere 4 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Mistral
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mistral 7B 32K requiere 1 unidad de modelo personalizado.
      *Facturado en intervalos de 5 minutos
    • Mixtral
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mixtral 8x7B 32K requiere 4 unidades de modelos personalizados.
      *Facturado en intervalos de 5 minutos
    • Flan
    • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Versión de unidad modelo personalizada v1.0
      Precio por unidad modelo personalizada por minuto* 0,0785 USD
      Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD
       
      Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Flan-T5 XL 512 requiere 1 unidad de modelo personalizado. 
      *Facturado en intervalos de 5 minutos

    Precios de inferencia bajo demanda:
    Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

    Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

Herramientas avanzadas de precios (detalles)

  • Barreras de protección de Amazon Bedrock
  • Barreras de protección de Amazon Bedrock

    Política de barreras de protección*

    Precio por 1000 unidades de texto**

    Filtros de contenido

    0,75 USD

    Temas denegados

    1 USD

    Verificación de la base contextual***

    0,1 USD

    Filtro de información confidencial (PII)

    0,1 USD

    Filtro de información confidencial (expresión regular) 

    Gratis

    Filtros de palabras

    Gratis

    Precios bajo demanda

    * Cada política de barreras de protección es opcional y se puede habilitar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de política utilizada en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estas dos políticas, pero no habrá cargos asociados a los filtros de información confidencial.

    ** Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.

    *** La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.

    Las barreras de protección no son compatibles con imágenes e incrustaciones.

  • Evaluación del modelo
  • Evaluación del modelo

    La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.

    Model

    Precio por cada 1000 tokens de entrada

    Precio por cada 1000 tokens de salida

    Precio por tarea humana

     

    Modelo seleccionado para la evaluación

    Basado en el modelo seleccionado

    Basado en el modelo seleccionado

     

    0,21 USD

     

Ejemplos de precios

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

    Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

    Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

    Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

    Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

    Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

    Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

    Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

    Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens. 

    Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

    Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD

  • Ejemplo 1 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

    Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Ejemplo 2 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

    Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo 1: chatbot de atención al cliente
    Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

    El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

    Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

    Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

    Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

    Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,75 USD + 1,00 USD) / 1000 = 5,25 USD

     

    Ejemplo 2: resumen de la transcripción del centro de llamadas
    Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

    Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

    Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.

    La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un período de 5 minutos, el intervalo se considerará activa para la facturación. Si no hay ninguna invocación entre las 8:07 a. m. y las 8:11 a. m., la medición se detendrá a las 8:11 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 3 intervalos cinco minutos = 2,355 USD.