Auroraモデル
xAIの自己回帰型画像モデルで、現実世界のシーンを写実的に描き出すために作られています。

Grok Imagine
xAIのAurora画像モデル——写実的なシーンと鮮明な文字を、Renoiseのキャンバスで。
Grok ImagineはxAIのクリエイティブモデルで、その画像エンジンのコードネームがAurora——画像をトークン単位で予測していく自己回帰型モデルです。写実的な描画、現実世界の鮮明な文字やロゴ、そして自分の参照画像を編集・合成する用途のために作られています。
Renoiseでは、Grokの画像生成がNano Banana、GPT Image 2、Midjourneyと並んでCanvas上で動きます。
動画側をお探しですか? Grok Imagineの動画を見る
xAIのAurora画像モデルを、Renoiseのキャンバスで。以下のモデル仕様はxAIによるものです。
xAIの自己回帰型画像モデルで、現実世界のシーンを写実的に描き出すために作られています。
現実世界の文字やロゴ、細部を高い精度で描画——ポスターや広告に強みを発揮します。
最大3枚のソース画像を組み合わせ——被写体の合成、スタイルの転写、新しいシーンの構成が可能。
ページを離れることなく、Grok、Nano Banana、GPT Image 2、Midjourneyを切り替えられます。
プロンプトから完成画像まで3ステップ。

プロンプトを書きます——被写体、スタイル、ライティング。編集したい参照画像を放り込んでもOK。

モデルセレクターでGrokの画像生成を選び、比率と1Kまたは2Kの解像度を設定します。

生成を押せば、その画像をそのまま同じCanvas上で動画へと持ち込めます。
Renoiseのキャンバス上で画像モデルを使って作れるものの一例です。

アングルや衣装が変わってもキャラクターの見た目を固定し、同じCanvasでそのまま動画へ引き継げます。

1つのプロンプトから4パターンの写実的なポートレート——ライティング、ポーズ、スタイリングを自在に。

読みやすい見出し文字を備えたデザイン品質のポスター——キャンペーンやSNSにそのまま使えます。

撮影なしでスタジオ品質のプロダクト・ファッションカット——衣装、シーン、アングルを差し替え自在。
ショットごとに最適なエンジンを——すべて1つのCanvas上で。
| 画像モデル | Grok ImageRecommended | Nano Banana Pro | GPT Image 2 |
|---|---|---|---|
| 最大出力 | 2K | 4K | 4K |
| 参照画像 | 最大3枚 | 対応 | 最大16枚 |
| 強み | 文字と写実性 | ディテールと4K | 編集とレイアウト |
| 向いている用途 | 写実的なシーン | 写実+アップスケール | デザインと合成 |
ほとんどの画像ジェネレーターはディフュージョン(拡散)モデルで、ノイズだらけのキャンバスからノイズを除去して画像を作り出します。Grok ImagineのAuroraは自己回帰型——言語モデルが単語を予測するのと同じように、画像をトークン単位で予測していきます。xAIによれば、これがAuroraの写実性と、読める現実世界の文字やロゴの描画における強みの源だといいます。ディフュージョンモデルは文字をにじませてしまいがちな領域です。
この違いが最も効いてくるのが、文字が読めなければならないポスターやパッケージ、広告、そして複数の参照画像を一つのまとまったシーンに合成する編集です。
Renoiseでは、Grokの画像生成が、写実的なディテールを最大4Kで描くNano Banana 2 / Pro、レイアウト重視の編集と合成に強いGPT Image 2、スタイライズされたアートに向くMidjourney V7と並んでCanvas上で動きます。カットごとに最適なモデルを選べ、ツールの切り替えは不要——どのフレームもそのまま動画へ持ち込めます。

Grok ImagineはxAIが開発しています。その画像モデルはコードネームAurora——写実的な描画のために作られた自己回帰型モデルです。Renoiseはこれを統合していますが、Renoise自身が画像モデルを学習させているわけではありません。
はい。Grokの画像生成は、Nano Banana 2 / Pro、GPT Image 2、Midjourney V7と並んでRenoiseのCanvas上で動きます——モデルセレクターで選んで生成するだけです。
xAIによれば、Auroraはディフュージョンベースではなく自己回帰型で、写実性と、現実世界の文字やロゴの描画に優れ、プロンプトに忠実に従うとされています。
はい。Grokは画像を編集でき、1回の編集で最大3枚のソース画像を組み合わせられます——被写体の合成、スタイルの転写、シーンの構成に役立ちます。
Grokの画像生成に加え、Nano Banana 2とPro(Google)、GPT Image 2(OpenAI)、Midjourney V7です——写実、デザイン、スタイライズされた表現までをカバーし、最大4K出力に対応。すべて1つのCanvas上で動きます。
いいえ。Grok Imagineは画像と動画の両方にまたがります。動画側はネイティブ音声とモーションを加えます——詳しくはGrok動画のページをご覧ください。