Amazon Nova とは何ですか?
Amazon Nova は、最先端 (SOTA) のインテリジェンスと業界トップクラスの料金パフォーマンスを実現する新世代の最先端基盤モデル (FM) です。Amazon Bedrock でのみご利用いただけます。
Amazon Nova の理解モデル
Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Pro は、テキスト、画像、動画入力を受け入れてテキスト出力を生成する理解モデルです。機能、精度、速度、コストのオペレーションポイントを幅広く提供します。
- インテリジェンスクラスを問わない高速かつ高コスト効率の推論
- 最先端のテキスト、画像、動画理解
- テキスト、画像、動画入力のファインチューニング
- 先駆的なエージェントおよびマルチモーダル検索拡張生成 (RAG) 機能
- Amazon Bedrock を利用した、独自のデータおよびアプリケーションへの簡単な統合
Amazon Nova のクリエイティブコンテンツ生成モデル
Amazon Nova Canvas と Amazon Nova Reel は、テキストおよび画像入力を受け入れて画像または動画出力を生成するクリエイティブコンテンツ生成モデルです。ビジュアルコンテンツ生成のために、カスタマイズ可能な質の高い画像と動画を提供するように設計されています。
- 最先端の画像および動画生成
- ビジュアルコンテンツ生成の制御
- ビジュアルコンテンツをカスタマイズおよび編集するための複数のアプローチ
- ウォーターマークとコンテンツモデレーションによる AI の安全で責任ある使用のサポート
モデルバージョン
Amazon Nova Micro
Amazon Nova Micro はテキストのみのモデルで、極めて低いレイテンシーのレスポンスを非常に低コストで実現します。言語理解、翻訳、推論、コード補完、ブレインストーミング、数学的問題解決において優れたパフォーマンスを発揮します。1 秒あたり 200 トークンを超える生成速度を備えた Amazon Nova Micro は、高速応答を必要とするアプリケーションに最適です。
最大トークン数: 128,000
言語: 200 以上の言語
ファインチューニングのサポート: あり (テキスト入力)
Amazon Nova Lite
Amazon Nova Lite は、画像、動画、テキストの入力を超高速で処理する、非常に低コストのマルチモーダルモデルです。幅広いタスクにわたる精度と超高速を実現した Amazon Nova Lite は、コストが重要な考慮事項となるインタラクティブでハイボリュームのさまざまなアプリケーションに適しています。
最大トークン数: 300,000
言語: 200 以上の言語
ファインチューニングのサポート: あり (テキスト、画像、動画入力)
Amazon Nova Pro
Amazon Nova Pro は、幅広いタスクに対応する精度、速度、コストの最適な組み合わせを備えた高性能なマルチモーダルモデルです。その機能と、業界トップクラスのスピードとコスト効率により、動画要約、質疑応答、数学的推論、ソフトウェア開発、マルチステップワークフローを実行できる AI エージェントなど、ほぼすべてのタスクに適したモデルとなっています。テキストとビジュアルインテリジェンスのベンチマークにおける最先端の精度に加えて、Amazon Nova Pro は指示実行ワークフローとエージェントワークフローで優れたパフォーマンスを発揮することが、Comprehensive RAG Benchmark (CRAG)、Berkeley Function Calling Leaderboard、Mind2Web によって測定されています。
最大トークン数: 300,000
言語: 200 以上の言語
ファインチューニングのサポート: あり (テキスト、画像、動画入力)
Amazon Nova Premier
近日リリース予定
Amazon Nova Canvas
Amazon Nova Canvas は、プロンプトで提供されるテキストまたは画像からプロフェッショナルグレードの画像を作成する最先端の画像生成モデルです。また、テキスト入力を使用して画像を簡単に編集できる機能、配色とレイアウトを調整するためのコントロール、AI の安全で責任ある使用をサポートする組み込みコントロールも備えています。
最大入力文字数: 1,024
言語: 英語
ファインチューニング対応: 近日リリース予定
Amazon Nova Reel
Amazon Nova Reel は、お客様がテキストや画像から質の高い動画を簡単に作成できるようにする、最先端の動画生成モデルです。カメラの動きのコントロールを含むビジュアルスタイルとペース配分を制御するための自然言語プロンプトの使用と、AI の安全で責任ある使用をサポートする組み込みコントロールに対応しています。
最大入力文字数: 512
言語: 英語
ファインチューニング対応: 近日リリース予定
-
Palantir Technologies
Palantir Technologies は、世界で最も重要な状況の多くで AI 主導の意思決定を可能にするソフトウェアを構築しています。
-
Hearst Corporation
The Hearst Corporation は、40 か国で事業を展開するグローバルで多様な情報、サービス、メディアの大手企業です。
-
Caylent
Caylent は次世代のクラウドサービス企業で、AI と AWS を活用してアイデアをより迅速にインパクトに変えています。
-
Dentsu Digital Inc.
株式会社電通デジタルは、ビジネスの成長を支援するサービスを提供するデジタルマーケティング会社です。
-
Shutterstock
Shutterstock は、ブランド、企業、メディア企業向けのフルサービスソリューション、高品質コンテンツ、ツールを提供する大手クリエイティブプラットフォームです。Shutterstock は、ブランド、デジタルメディア、マーケティング企業のストーリーテリングに命を吹き込むために、世界中の何百万人ものクリエイターに、高品質コンテンツの最も豊富で多様なコレクションを提供しています。
-
Musixmatch
世界最大の歌詞プラットフォームである Musixmatch は、音楽体験を向上させる音楽データ、AI、ツール、サービスを提供しています。8,000 万人以上のユーザーと 1,100 万を超えるユニークな歌詞のデータベースを持つ Musixmatch は、曲の検索と歌詞共有機能で業界をリードしています。
Amazon Titan Embeddings モデルや Amazon Titan Image Generator モデルを含む Amazon Titan の基盤モデルについては、Amazon Titan の製品ページをご覧ください。