Midjourney課金フロー、コマンドリスト

Date
2022/08/04
Update
2022/8/12 5:36
Tag
アート
ハック
Midjourneyという、Discord上で動く超高精度な作画AIをトライアルしたところあまりにも面白すぎて、つい勢いで課金してしまった。
まだMidjourneyを知らない!という人はこのあたりの記事を見て、ぜひ試してみて欲しい。
折角なのでその課金フローとか、作画させる上で役に立ちそうなコマンドを自分用にメモっておく。
生成した作品は随時以下にアップしていきます

課金フロー

TOPページからSign In With Discordをクリック
Discordでログインするとマイページに行くので左上のハンバーガーメニューをタップ
左下の自分アイコンから「Manage Account」をタップ
マスフォーはStandardプランを選択
Basicプランの200枚だとすぐ使い切ってしまいそうなので、1ヶ月間鬼のようにハマってすぐ飽きる作戦を取ることにした
Basicプランの200枚だとすぐ使い切ってしまいそうなので、1ヶ月間鬼のようにハマってすぐ飽きる作戦を取ることにした
決済画面にカード情報を入れて申し込む
プロモコードは見つからなかった。残念
プロモコードは見つからなかった。残念
決済が完了しましたという画面が出たら完了。DiscordのリンクからDiscordに戻ると有料プランになっている
Standardプランを選ぶとDMでじっくり画像生成できる。うーん素敵
初めてDMを試みると規約同意を促されるので、Accept ToSを押す
初めてDMを試みると規約同意を促されるので、Accept ToSを押す
集中して生成できる
集中して生成できる
ちなみにBasicとStandardの違いは以下
BasicStandard
月額10ドル30ドル
最大枚数/月約200枚約900枚
DMで画像生成
/relax モードで枚数制限なし×

便利なコマンド(プロンプト・パラメータ)一覧

Midjourneyは、以下のように「参考画像の指定(URL)」「イメージを伝えるための文章/単語(プロンプト)」「画像や生成の仕様を指定するパラメータ」という組みあわせで生成内容を注文できます。
公式のgitbookより
公式のgitbookより
以下をいろいろ組みあわせて使ってみて下さい。

プロンプト(使いやすい文章/単語)

  • 上手な絵にする(おすすめ)
    • A concept art of,
  • 写真風にする
    • A photo of,
  • 油絵風にする
    • An oil painting of,
  • 芸術的なイラスト風にする
    • A sketch of,
  • ポップなイラスト風にする
    • An illustration of,
  • コミック風にする
    • A cartoon of,
  • 肖像画にする
    • A portrait of,
  • ロゴ風にする
    • A logo of,
  • 精緻な絵にする
    • ,detailed,
  • 図鑑のようにする
    • ,collection sheet,
  • 水墨画のようにする
    • ,india ink painting,
  • 画風を指定(作者軸)
    • ,by ***,
      ***の部分に画家の名前を入れる 例:Gogh
  • 画風を指定(作品軸)
    • ,in *** style,
      ***の部分に作品の名前を入れる 例:Ghibli
  • 単語ごとの優先度を指定
    • ,hot dog::1.5,food::-1,
      それぞれの合計がマイナスになるのはダメ。初期値はそれぞれ1。上の例だと「ホットドッグじゃなくて熱い犬」というニュアンスになる。

パラメータ(画像や生成の仕様を指定)

  • 入れたくない要素を指定
    • --no ***
      ***の部分に入れた単語のものは絵画しないようにする。広めの景色を描くと炎に包まれてしまうことがあるのだが、そのような際は「—no fire」の記述で火を消せる。
  • (参考画像を指定した場合)画像の優先度を指定
    • --iw 0.25
      0.0〜1.0で指定。初期値は0.25
  • 芸術度の指定
    • --stylize 2500
      数字を大きくすればするほど指定した内容よりも絵の綺麗さを優先する。初期値は2500。最低値(最もキーワードを優先する設定)は625
  • 品質を上げる
    • --quality 1
      初期値は1。2にすると絵の品質が2倍になるがスピードとコストも2倍に。
  • ヨコ幅を指定する
    • --w 1920
      64の倍数で指定する。512程度までにしたほうが安定するようだ
  • タテ幅を指定する
    • --h 1080
      64の倍数で指定する。512程度までにしたほうが安定するようだ
  • (サイズではなく)アスペクト比を指定する
    • --aspect 9:16
      ヨコ:タテで比率を指定
  • 生成を早くする
    • --stop 10
      10-100の間で指定

勉強になった記事

以下の方の記事がとても勉強になりました。
Midjourneyの使い方のコツを解説する記事でありつつ、「AIにうまく命令するにはどのようにするのが良いか?」ということがなんとなく掴めた気がします。
僕は幼い頃からインターネットやガジェットに触れ続けてきたことで、体系的にプログラミング言語などは修めていないド文系であるものの、私生活・仕事双方でメチャクチャ役に立ついわゆる「情強」的な肌感を身に着けてきました。
何となくですが、「AIの仕組みがイメージできてうまく命令できる」というスキルは次世代の「情強」としてのキーファクタな気がするので、意識的に勉強していきたいと思います。
魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)|note
やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおう メジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる 「Apple」という方向性ベクトル は、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」とは、AIにとってはとてもあいまいななのだ。 写真かイラストかもわからない。ついでに「ハート」も合体してきてる。このような短い詠唱は、多くのケースで制御不能となる。 AIはあいまいな命令には、同時に成立するような絵を錬成してしまう(注、顔が分裂するのはまた別の事象です) 。 すぐれたAI使役には、詠唱を通じてを束ねる設計が必要となる。 以下は、 「フルーツのアップル」と縛りをかけた詠唱 。改善したが、まだ赤リンゴと青リンゴが同時に存在している。 このように、りんごを1つ出すのにも、それなりの詠唱が必要となる。 実はより安定した詠唱には、発想を変える必要がある。 「 イーコマースサイト用の、画質の良い、シンプルな背景にある、単独の赤いりんご 」 とすれば、一発でリンゴが錬成される。 「イーコマース用商品写真」は背景やレイアウトの再現性が高い。ここに気づけば、よいを練れる。 だがAIのベクトルは数千次元におよぶ。無闇に単語をならべても、複数の単語が、お互いのベクトルを打ち消しあってしまう。 だからAIをよく使役するには、2つの理解「ベクトルの方向を強く適宜する力ある言葉ルーン の語彙力」と「再現性をもった呪文の組み立て」が必要になる。 とは、 明快な方向性つよいベクトル をもった言葉である。「曖昧さのない純粋な単語」と言ってもよい。 これは、AIの学習の仕組みに起因する。AIはネットにある、画像とその解説文をペアにして学習している。無数のペアの学習から、 可能性空間アカシックレコード でもいうべきベクトル空間を形成する。 その仕組み上、「学習の中で内容がブレずに何度もでてくる画像と文字のペア」には、強い力が生まれる。 呪文詠唱の最終節に、" Unreal Engine"や" Playstation5"というルーンを置くと、画質が向上しやすい。これはAIが、記事と画像のペアから「 アンリアルエンジン(ゲーム作成ツール名)は、画質がすごい 」といった内容を学んでいるからだろう。 同様に、第一節に " beautiful concept art of" を付与するのも強い。これも「 平均的なコンセプトアートと呼ばれる画像は、絵が上手い 」からだ。 以下に比較図を示す。 個人的におすすめの強いルーンはカメラ設定だ。 詠唱の末節に、「Canon EOS 5D Mark 4と、SIGMA Art Lens 35mm F1.4 DG HSMレンズで撮影、F値2.4、ISO 200、シャッタースピード2000」など追加すると、品質が大きく高まる 。 画質だけでなく、構図やライティング、ボケなどを含めて全体的にコントロールできる。 これは、「そのような表記がついている画像は、プロの写真や、メーカー公式のサンプル写真、ハイアマチュアがとった写真サイトの作品」とAIが学んでいるためだ。前ボケや後ろボケを狙って出したいときには、強いルーンとして機能する。 まず初心者は、遊びながら強いルーンのレパートリーを見つけていくとよいだろう。 詠唱時のワード選定の順番も大事である。 以下「ロボットのいる風景」と「風景にあるロボット」での表示の違い。 一見、おなじように見える命令でも、ロボットの扱いが大きく変わっているのがわかる。このように、「 何をどういう順番で言うか? 」は、画像錬成の品質を大きく左右する。 原則としては、おおまか「手前にある文ほど強く、後ろにある単語ほど弱い」「最後の文はそこそこ強い」「前置詞や関係代名詞の前の単語のほうが強くでて、後ろの単語のほうが弱くなる」というような特徴を、やんわりと持つ。 基本的には、「美術館や、写真サイト、画集のキャプションに近い文体」で、呪文プロンプト を作るのがよい。 AI錬成を古からしている上級魔術師の間では、以下のような構成が定番となっているように思える。 <全体フォーマット>Detailing oil painting of ...