
少しでもAIに注目しているなら、おそらくあの画像を見たことがあるでしょう。SF映画やファンタジー小説から飛び出してきたかのような、息をのむほど美しく、奇妙で、素晴らしいビジュアルの数々。その多くは、おそらくMidjourneyで作られたものでしょう。ほんの数語を傑作に変えてしまうAI画像ジェネレーターです。
Discord上のMidjourneyボットのデモ。AI画像を生成する強力なツールです。
Midjourneyが初めて登場したとき、それはまさにAIアートの王様でした。しかし、DALL·E 3やStable Diffusionのような他のツールが進化するにつれ、状況は変わり始めました。人々はMidjourneyを使う上でいくつかの大きな壁にぶつかっており、楽しいサイドプロジェクト以上の目的で使うのが難しくなっています。
このガイドでは、Midjourneyについて知っておくべきことのすべてを解説します。Midjourneyとは何か、実際の使い方(これ自体が一筋縄ではいきません)、そのアートがなぜ特別なのか、そして使いにくいユーザーインターフェースからAPIが全くないことまで、知っておくべき主要な制約について説明します。
Midjourneyとは?
Midjourneyは、独立した研究ラボであり、そのラボが作成したAIツールの名称です。簡単に言えば、テキストの説明(「プロンプト」と呼ばれます)に基づいて画像を生成する、非公開のAIツールです。Stable Diffusionなど、耳にしたことがあるかもしれない他のモデルとは異なり、Midjourneyはクローズドソースです。その仕組みを覗き見ることはできません。
長い間、Midjourneyにアクセスする唯一の方法は、チャットプラットフォームDiscord上のボットを介することでした。これが、初日からそのユーザーエクスペリエンスとコミュニティ全体を形作ってきました。
Midjourneyの核心は、あなたの言葉を、しばしば絵画のような雰囲気を持つ、美しく芸術的なものに変えることです。構図や照明といった要素に長けており、生成される画像はすぐに洗練された印象を与えます。単なる画像作成ユーティリティではなく、同社は自らを「人類の想像力を拡大する」ためのプラットフォームと位置づけています。
Midjourneyの仕組み:セットアップとユーザーエクスペリエンス
Midjourneyを始めるのは、いつも… ちょっとした一仕事です。最近ウェブアプリが公開されましたが、そのDNAは依然としてDiscordと深く結びついており、使ったことがない人にとっては大きな障壁となり得ます。
MidjourneyのDiscordファーストなアプローチ
長い間、Midjourneyを使うことはDiscordで生活することを意味していました。具体的には以下のようになります。
-
**サーバーに参加する:**まず、Discordアカウントが必要です。次に、2,000万人以上が参加するMidjourneyの公式サーバーに参加しなければなりません。
-
**
/imagine
コマンドを使う:**指定された「newbie」(初心者向け)チャンネルのいずれかを見つけ、「/imagine」と入力し、続けてテキストプロンプトを記述します。 -
**生成して待つ:**ボットが作業を開始し、そのパブリックチャンネルに4つの画像オプションを出力します。そこから1つを選んで「アップスケール」(拡大して詳細化)したり、新しいバリエーションを作成したりできます。
Discordのユーザーインターフェース内でのMidjourney画像生成プロセスを示すスクリーンショット。
これは活気ある創造的なコミュニティを生み出す一方で、混沌ともしています。パブリックチャンネルは他の人のアートが絶え間なく流れ続ける滝のようであり、自分の生成物を見失うのは驚くほど簡単です。さらに、コマンドラインインターフェースはほとんどの人にとって直感的とは言えません。率直に言って、多くの人が敬遠する学習曲線が存在します。
新しいMidjourneyのウェブインターフェース
Midjourneyは不満の声に耳を傾け、ついにウェブアプリケーションの提供を開始しました。検索バーにプロンプトを入力し、整然としたギャラリーで自分の作品を確認するという、より標準的な体験を提供します。これは大きな改善ですが、ツールの評判は依然としてDiscord由来であるという事実に大きく影響されています。
この一連の仕組みは、実際に仕事をこなそうとするビジネスにとっては大きな悩みの種です。たった一つのツールのために、チーム全体にDiscordの使い方を学ばせるわけにはいきません。だからこそ、eesel AIのようなプラットフォームは、新しいツールを強制するのではなく、Slackのようなツールに直接プラグインして、あなたが働く場所で機能するように作られています。
Midjourneyの主な特徴と芸術的な強み
使い勝手の悪さにもかかわらず、Midjourneyがこれほど人気を博したのには理由があります。その芸術的なアウトプットが信じられないほど素晴らしいのです。箱から出した瞬間から、ライバル製品よりも洗練され、アートディレクションが施されているかのような独特の美学を持っています。
生成される画像は、とにかく見栄えが良いのです。Midjourneyは、美しい照明、力強い構図を生み出し、美術史やスタイルの深い知識を活用する達人です。あなたのプロンプトは、しばしばプロのコンセプトアートやデジタルペインティングのような結果を生み出します。
また、独自の「ルック」も持っています。白紙のキャンバスを提供する一部のAIツールとは異なり、Midjourneyには見栄えの良いものに対するバイアスが組み込まれており、これは超詳細なプロンプトの作成をまだマスターしていない初心者にとっては大きな助けとなります。また、ムード、感情、芸術運動に関するプロンプトを不思議なほどよく理解するため、単にアイデアを探求するだけでも楽しいツールです。さらに、チームは常に新しいバージョンをリリースしており、そのたびにリアリズムと理解力が飛躍的に向上しています。
Midjourneyの制約と課題
アーティストにとっては夢のようなツールですが、Midjourneyには深刻な制約があり、ほとんどの人、特にビジネスの場面には不向きです。
MidjourneyにはAPIアクセスがない
これは最大の制約で、特に仕事で使おうと考えている場合には重要です。MidjourneyにはAPIがありません。簡単に言えば、他のソフトウェア、ウェブサイト、または自動化されたワークフローに接続できないということです。Midjourneyの技術を使ったアプリを構築したり、プロセスの一部として画像を自動生成させたりすることはできません。これはスタンドアロンツールとして設計された壁に囲まれた庭であり、より大きなものを構築するための部品ではありません。
ビジネスにとって、統合はすべてです。eesel AIのようなAIサポートツールを考えてみてください。その目的は、Confluenceのようなナレッジベースや、ZendeskやIntercomのようなヘルプデスクと統合して、回答を自動化することです。これはAPIなしでは不可能です。
厳しいMidjourneyのコンテンツモデレーション
Midjourneyのコンテンツフィルターは…控えめに言っても、非常にアグレッシブです。ユーザーからは、全く問題のないプロンプトがブロックされるという報告が絶えません。人体やファッションデザインに関連する言葉でさえ、警告が表示されたり、BANされたりすることがあります。目的は職場での閲覧に不適切な(NSFW)画像を防止することですが、フィルターが過剰に働き、正当な創造的作業の妨げになることがよくあります。
Midjourneyのプライバシーに関する懸念
全世界に見られることなくプロジェクトに取り組みたいですか?デフォルトでは、それは不可能です。高価なProプランやMegaプランに加入して「ステルスモード」を利用しない限り、すべての画像はDiscord上で公開されます。機密性の高いプロジェクトやプライベートなプロジェクトに取り組む人にとって、安価なプランでのプライバシーの欠如は、契約を見送る大きな理由となります。
Midjourneyには無料プランがない
では、ちょっと試してみたいだけなら?残念ながら、それもできません。Midjourneyは人気が出すぎたため、2023年4月に無料トライアルを廃止しました。現在では完全に有料サービスとなっており、気軽に試したいユーザーを遠ざけ、競合他社がシェアを伸ばす一因となっている可能性があります。
Midjourneyの料金
では、これらすべてにいくらかかるのでしょうか?Midjourneyは、4つの階層からなるサブスクリプションモデルで運営されています。どのプランでもコミュニティギャラリーへのアクセスと画像の商用利用が可能ですが、主な違いは「高速GPU時間」の量です。高速モードではすぐに画像が生成されますが、リラックスモードではキューに入れられます(そして最安プランでは利用できません)。
以下に、標準的な月額プランの概要を示します。
プラン | 月額料金 | 年額料金(/月) | 高速GPU時間 | リラックスGPU時間 | 主な機能 |
---|---|---|---|---|---|
ベーシックプラン | $10 | $8 | 3.3時間/月 | なし | 生成回数制限あり(月あたり約200回) |
スタンダードプラン | $30 | $24 | 15時間/月 | 無制限 | リラックスモードでの生成は無制限 |
プロプラン | $60 | $48 | 30時間/月 | 無制限 | プライベート画像用のステルスモード |
メガプラン | $120 | $96 | 60時間/月 | 無制限 | ステルスモード、より多くの高速時間 |
ここでの重要なポイントは、真のプライバシーは月額60ドルから始まるということで、これはフリーランサーや小規模チームにとっては高額な価格設定です。
Midjourneyに関する最終的な考察
では、Midjourneyに対する結論はどうでしょうか?アーティスト、デザイナー、そして息をのむようなユニークな画像を作成したいすべての人にとって、素晴らしいツールです。純粋な創造的な楽しみのためであれば、これに勝るものはありません。
しかし、ビジネス用途ではどうでしょうか?話は別です。独特なDiscordインターフェース、安価なプランでのプライバシーの欠如、そして特にAPIがないことは、ほとんどの企業にとって導入の障害となります。これは、自動化や統合のためではなく、手作業で単発の画像を作成するために設計された、閉鎖的なツールです。
もし、壁を作るのではなく、実際にあなたのワークフローに組み込めるAIを探しているなら、別の種類のツールが必要です。eesel AIのようなプラットフォームは、セルフサービスで、管理可能で、あなたがすでに依存しているソフトウェアに接続できるように、ゼロから構築されています。
AIが既存のツールの外部ではなく内部でどのように機能するか見てみませんか? eesel AIがチームのサポートを自動化し、知識を統合する方法をご覧ください。
よくある質問
Midjourneyを始めるには、従来、そのDiscordサーバーに参加し、パブリックチャンネルで「/imagine」コマンドを使い、そこで作品を管理する必要がありました。現在はウェブアプリも利用できますが、その出自から、特にDiscordに慣れていない場合は学習が必要です。
Midjourneyは構図、照明、美術史の活用に優れており、プロのコンセプトアートのような画像を生成することがよくあります。独特の美学と「見栄えの良いものへのバイアスが組み込まれている」ため、初心者でも洗練された結果を出しやすいのが特徴です。
現在、MidjourneyはAPIを提供していません。つまり、他のソフトウェア、ウェブサイト、自動化されたワークフローと統合することができません。この統合性の欠如は、画像生成を自動化したり、既存のシステムに接続したりすることを目指す企業にとって、大きな障害となります。
はい、Midjourneyの安価なプランではプライバシーが懸念されます。デフォルトではすべての画像がDiscord上で公開されるためです。プライベートなプロジェクトで作業するには、より高価なProまたはMegaプランに登録して「ステルスモード」にアクセスする必要があります。
いいえ、Midjourneyは需要が非常に高かったため、2023年4月に無料トライアルを廃止しました。現在は完全に有料のサービスであり、最初に試すだけでもサブスクリプションが必要です。
Midjourneyは月額10ドルから120ドルまでの4つのサブスクリプション階層(ベーシック、スタンダード、プロ、メガ)を提供しています。プランは主に、提供される「高速GPU時間」の量と、プライベートな画像生成のための「ステルスモード」などの機能へのアクセス権によって異なります。