Amazon Nova 基盤モデル

フロンティアインテリジェンスと業界トップクラスのコストパフォーマンス

Amazon Nova とは何ですか?

Amazon Nova は、最先端 (SOTA) のインテリジェンスと業界トップクラスの料金パフォーマンスを実現する新世代の最先端基盤モデル (FM) です。Amazon Bedrock でのみご利用いただけます。

この画像は、Amazon Nova Canvas で「hummingbird in a garden」(庭のハチドリ) というプロンプトを使用して生成されました。

Amazon Nova の理解モデル

Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Pro は、テキスト、画像、動画入力を受け入れてテキスト出力を生成する理解モデルです。機能、精度、速度、コストのオペレーションポイントを幅広く提供します。

  • インテリジェンスクラスを問わない高速かつ高コスト効率の推論
  • 最先端のテキスト、画像、動画理解
  • テキスト、画像、動画入力のファインチューニング
  • 先駆的なエージェントおよびマルチモーダル検索拡張生成 (RAG) 機能
  • Amazon Bedrock を利用した、独自のデータおよびアプリケーションへの簡単な統合

詳細: ベンチマークと例

Amazon Nova のクリエイティブコンテンツ生成モデル

Amazon Nova Canvas と Amazon Nova Reel は、テキストおよび画像入力を受け入れて画像または動画出力を生成するクリエイティブコンテンツ生成モデルです。ビジュアルコンテンツ生成のために、カスタマイズ可能な質の高い画像と動画を提供するように設計されています。

  • 最先端の画像および動画生成
  • ビジュアルコンテンツ生成の制御
  • ビジュアルコンテンツをカスタマイズおよび編集するための複数のアプローチ
  • ウォーターマークとコンテンツモデレーションによる AI の安全で責任ある使用のサポート


詳細: 画像と動画のギャラリー

モデルバージョン

Amazon Nova Micro

Amazon Nova Micro はテキストのみのモデルで、極めて低いレイテンシーのレスポンスを非常に低コストで実現します。言語理解、翻訳、推論、コード補完、ブレインストーミング、数学的問題解決において優れたパフォーマンスを発揮します。1 秒あたり 200 トークンを超える生成速度を備えた Amazon Nova Micro は、高速応答を必要とするアプリケーションに最適です。

最大トークン数: 128,000

言語: 200 以上の言語

ファインチューニングのサポート: あり (テキスト入力)

Amazon Nova Lite

Amazon Nova Lite は、画像、動画、テキストの入力を超高速で処理する、非常に低コストのマルチモーダルモデルです。幅広いタスクにわたる精度と超高速を実現した Amazon Nova Lite は、コストが重要な考慮事項となるインタラクティブでハイボリュームのさまざまなアプリケーションに適しています。

最大トークン数: 300,000

言語: 200 以上の言語

ファインチューニングのサポート: あり (テキスト、画像、動画入力)

Amazon Nova Pro

Amazon Nova Pro は、幅広いタスクに対応する精度、速度、コストの最適な組み合わせを備えた高性能なマルチモーダルモデルです。その機能と、業界トップクラスのスピードとコスト効率により、動画要約、質疑応答、数学的推論、ソフトウェア開発、マルチステップワークフローを実行できる AI エージェントなど、ほぼすべてのタスクに適したモデルとなっています。テキストとビジュアルインテリジェンスのベンチマークにおける最先端の精度に加えて、Amazon Nova Pro は指示実行ワークフローとエージェントワークフローで優れたパフォーマンスを発揮することが、Comprehensive RAG Benchmark (CRAG)、Berkeley Function Calling Leaderboard、Mind2Web によって測定されています。

最大トークン数: 300,000

言語: 200 以上の言語

ファインチューニングのサポート: あり (テキスト、画像、動画入力)

Amazon Nova Premier

近日リリース予定

Amazon Nova Canvas

Amazon Nova Canvas は、プロンプトで提供されるテキストまたは画像からプロフェッショナルグレードの画像を作成する最先端の画像生成モデルです。また、テキスト入力を使用して画像を簡単に編集できる機能、配色とレイアウトを調整するためのコントロール、AI の安全で責任ある使用をサポートする組み込みコントロールも備えています。

最大入力文字数: 1,024

言語: 英語

ファインチューニング対応: 近日リリース予定

 

Amazon Nova Reel

Amazon Nova Reel は、お客様がテキストや画像から質の高い動画を簡単に作成できるようにする、最先端の動画生成モデルです。カメラの動きのコントロールを含むビジュアルスタイルとペース配分を制御するための自然言語プロンプトの使用と、AI の安全で責任ある使用をサポートする組み込みコントロールに対応しています。

最大入力文字数: 512

言語: 英語

ファインチューニング対応: 近日リリース予定

  • Palantir Technologies

    Palantir Technologies は、世界で最も重要な状況の多くで AI 主導の意思決定を可能にするソフトウェアを構築しています。

    Amazon Nova Pro の高度な推論機能を、Palantir の AI プラットフォーム (AIP) 内のオントロジーシステムと統合できることを嬉しく思います。これには、40 以上の業界で新たな業務効率と意思決定ワークフローを推進できる見込みもあります。これには、コンプライアンスを維持し、きめ細かなガードレールを実施しながら、複雑な保険契約の要求を処理する保険代理店や、エンドツーエンドの再配分プロセスを調整するサプライチェーンエージェントを支援することが含まれます。

    Palantir Technologies、Chief Architect、Akshay Krishnaswamy 氏
  • Hearst Corporation

    The Hearst Corporation は、40 か国で事業を展開するグローバルで多様な情報、サービス、メディアの大手企業です。

    Amazon Nova Pro は、動画コンテンツから抽出できる詳細と雄弁な要約に驚きました。これらの動画とドキュメントの理解機能を活用できることを楽しみにしています。その高度な文書理解により、ビジネスワークフローを強化し、より高速で効率的なデータ処理ソリューションを提供できるようになります。また、その動画理解機能により、より多くの情報源を研究やコンテンツ制作に大規模に利用できるようになり、サブスクライバーの体験が向上します。

    Hearst、Chief Product and AI Strategist、Peter Goldstein 氏
  • Caylent

    Caylent は次世代のクラウドサービス企業で、AI と AWS を活用してアイデアをより迅速にインパクトに変えています。

    Amazon の新しいマルチモーダル Amazon Nova サービスの可能性、特に最先端の動画理解機能とその業界に幅広く応用できる可能性に非常に興奮しています。Caylent では、メディア、スポーツ、小売、ヘルスケアの各分野にわたるお客様が動画を把握できるように、長年にわたりさまざまな技術やモデルの組み合わせを考案してきました。今では、Amazon Bedrock API を呼び出すだけで業界をリードする結果が得られ、わずかなコストしかかかりません。お客様がプロトタイプから製造までかけている時間をさらに短縮できます。複雑な画像のタイリング、サンプリング、セマンティックハッシュ、その他の複雑な処理は不要です。必要なのは、動画へのポインタとプロンプトだけです。マジック!

     

    Caylent、CTO、Randall Hunt 氏
  • Dentsu Digital Inc.

    株式会社電通デジタルは、ビジネスの成長を支援するサービスを提供するデジタルマーケティング会社です。

    株式会社電通デジタルでは、デジタルマーケティングにおけるイノベーションの探求は、常に最先端のテクノロジーの活用によって支えられています。Amazon Nova Reel の動画生成 AI はまさにその実現を支援しています。Amazon Nova は、AWS の堅牢で信頼性の高いインフラストラクチャに支えられており、当社のクリエイティブプロセスにシームレスに統合されているため、優れた背景美学を備えた息をのむような動画コンテンツを制作できます。これにより、チームはクリエイティブな領域をより自由に探求できるようになり、以前は数週間かかっていた作業が数日に変わりました。Amazon Nova では、短くてインパクトのある動画を作成しながら、モックアップや正確な提案シナリオを迅速に作成できます。この変革によって効率が向上しました。

    電通デジタル、執行役員、山本 覚氏
  • Shutterstock

    Shutterstock は、ブランド、企業、メディア企業向けのフルサービスソリューション、高品質コンテンツ、ツールを提供する大手クリエイティブプラットフォームです。Shutterstock は、ブランド、デジタルメディア、マーケティング企業のストーリーテリングに命を吹き込むために、世界中の何百万人ものクリエイターに、高品質コンテンツの最も豊富で多様なコレクションを提供しています。

    Amazon Nova Canvas は、AWS の既に素晴らしいモデルのラインナップから画質が大幅に向上したことを示しており、Shutterstock AI 画像ジェネレーターにこの機能を組み込むことができて本当にワクワクしています。この新しいモデルは、驚くほど直感的で使いやすいだけでなく、プロンプト体験を真に向上させ、Shutterstock のカスタマーサービスにさらに価値をもたらしています。

    Shutterstock、Director of AI Services、Chris Loy 氏
  • Musixmatch

    世界最大の歌詞プラットフォームである Musixmatch は、音楽体験を向上させる音楽データ、AI、ツール、サービスを提供しています。8,000 万人以上のユーザーと 1,100 万を超えるユニークな歌詞のデータベースを持つ Musixmatch は、曲の検索と歌詞共有機能で業界をリードしています。

    Amazon Nova Canvas と Amazon Nova Reel は、新進アーティストのミュージックビデオ制作を民主化するのに役立ちます。Musixmatch Pro に Amazon Nova モデルを含めることで、アーティストが曲のコンテキストをインプットとして使用して高品質の動画を制作できるようになりました。アーティストは、自分の芸術的ビジョンに合わせて、自然言語によるプロンプトを使用して、動画を簡単にカスタマイズしたり、さまざまな音楽スタイルに合わせて微調整したりできます。私たちは、プロのミュージックビデオ制作をすべての人が利用できるようにできることを誇りに思っています。

    Musixmatch、Co-President、Marco Paglia 氏

Amazon Titan Embeddings モデルや Amazon Titan Image Generator モデルを含む Amazon Titan の基盤モデルについては、Amazon Titan の製品ページをご覧ください。