AIを利用して美しい絵を簡単に作成することができるサービス midjourney が日本でも大きな話題になっています。私もさっそく使ってみて、時間が際限なく溶けてゆく面白さに夢中になっているのですが、同時にこれがもたらす未来に対する漠然とした危機感も感じないわけにはいきません。そのことについて、粗雑な考えをまとめておこうと思います。
画像と言葉の論理空間。その限界
Midjourneyは、Discordのサーバーに参加して初心者用のチャンネル、あるいはbotに対してキーワードを入力することですぐに画像を作成することができます。たとえば:
/imagine prompt:a missle incoming on a dark crystal palace at night --wallpaper
といったように英語の文章で入力をおこない、それに wallpaper、stylize などといったいくつかのオプションを加えるだけで、画像の大きさや比率、どれだけ文章に対して重み付けをするかといったパラメータに基づいて画像が生成されます。
上の例だとこのような感じになります。この文章はトマス・ピンチョンの「重力の虹」をすこし機械に理解しやすくしたものですが、「クリスタル・パレス」の言葉に引きずられすぎて宮殿ばかりが目立つ結果になっていますね(笑)。
このように、midjourneyはなにかを無から生み出しているわけではなく、画像とそこに描かれているものの文字上の対応付けを膨大なデータから選別して画像を生み出しています。
原理がそのようになっていますので、漠然とした文章には漠然とした映像が生み出されます。たとえば「虹色のブラックホールの降着円盤。ただし中心には猫がいる」と指定しても猫はいませんし、色となにか渦っぽいものだけが残っています。
画像のイメージを収束させるテクニックとしてよく使われているのが、特定のアーティストや傾向をあえて指定することです。「watercolor」と入れれば水彩画に吸い寄せられますし、「MTG」といれれば「Magic the Gathering」に、「hayao miyazaki」といれればジブリ風にといったようにです。
才能は不連続なもので、映像におけるタッチにも時代性や方向性の傾向は存在します。というより、私達はそうした非連続な部分でしかタッチを認識していないという面もあるからで、それが映像と言葉の対応付けにも埋め込まれているため、AIから取り出すのも楽になるといえるのでしょう。
まったくのことができないことがあるのも興味深いところです。たとえばとあるやり取りで「砂漠でひっくり返った亀」を描かせようとしたところ、亀らしいものは生成できてもなかなかひっくり返ってくれないということもありました。
べつにこれは、ひっくり返った亀の映像が少ないというわけではありません。Googleの画像検索をみればそれはいくらでも見つかります。
しかし機械学習されているデータが偏っているのか、「亀 + ひっくり返った」という属性が「亀」そのものと分離できていないのか、像は焦点を結びません。
想像力とはなにか
これは、なにかを考え、想像しているときに私たちが何をしているのかについて考えさせられる例といえます。
私たちはひっくり返った亀を見たことがなくてもそれを想像できますし、なんならそれをいくらでも脳裏の映像のなかで回転させたり、動きを想像できます。しかし機械学習のみている世界には(まだ)それは存在しないのです。
美しく、微細な映像を生み出せる midjourney ですが、いったいそれは何をみていて、何を引き出しているのかを意識して利用しなければいけないことを教えてくれる例ともいえるでしょう。
もう少し踏み込むと、倫理的な問題もありえます。
たとえば誰かがやってきて、「あなたがなかなかこのテーマについて書いてくれないので、人工知能にあなたの著作を学習させて続編を書かせたところ面白かったよ」と言った場合、私たちはどう反応すればいいのでしょうか?
厳密にいえば、そうして生み出された文章は私とは関わりのないものです。それが面白いか面白くないかは私とは関係がないものです。
しかしその一方で、何かが侵犯され、踏み越えられたような気持ちになってしまうのも避けられません。そのテーマについてちょうど書いていて推敲している最中だったら憮然とした表情にもなるでしょう。
読む側からみても、作品をAIが生み出したか人間が生み出したかは関係がないともいえますし、同じ程度に関係あるともいえます。
テクストを作者との共謀関係と捉えるなら、作者がいることは重要だといえます。しかし、オリジナルがないまま誤解された模倣物がオリジナルとして独り歩きする状況を想像すれば、作者という存在だって構図の一部分に過ぎず、必要不可欠なものとはいえないと論じることも可能です。
どちらかに正解があるという話ではなく、情報をどのような性格のものとして受け止めるのかという問題に、「人間ならざるものがうみだすもの」という新しい属性が誕生したのです。
AIとともに生きてゆく
近い将来、私たちは絵だけではなく、文章においても、仕事全般についても、AIの力を借りながら二人三脚で仕事をするのが普通になるはずです。
既に私は音声認識でざっくりとした文章を書き、それをDeepLにかけて英文に変換したあとで文章を推敲して、それをGrammerlyにかけてブラシアップするといった流れで英語レターを作成していますが、白紙の紙にむかうよりも圧倒的に高速に仕事が片付きます。
問題は、審美的な判断がともなう作品です。
その価値はどこからくるのでしょうか。感動は? 学びは? 楽しさは? 機械が与えるものは人間と当価値なのでしょうか? 感動できて面白ければ、どう生み出されたかは関係がないでしょうか? 本当に?
これはAIがこれからもっと使われる時代の入り口であるからこそ、今のうちに考えを深めておきたい部分です。私たちは情報と触れ合わずには生きていけませんが、そこに何を求めているのかを、情報の真偽以上のなにかに依拠しているのかどうかをどこかで意識しておかなければいけません。
さもなければ、機械によって作られた情報を機械が消費するだけ、人間性の喪失の時代がやってきたことを私達は意識もできなくなるかもしれないからです。
「われわれは幸福を考案した」― と最後の人間たちは言って、まばたきする
フリードリヒ・ニーチェ「ツァラトゥストラ」
今週の記事
1Password 8のiOS版がリリース。最強パスワード管理サービスがさらに便利に
Lifehacking.jp は「人生を変える小さな習慣」をテーマとした、ライフハック、知的生活・知的生産、ITテクニック、文具に関するブログです。ライフハック・ジャーナル、ライフハックLiveshowなどを含む私の活動は読者のみなさんの支援のおかげで広告フリーでお届けしています。
もしここで読んだ記事があなたの人生なにか変化をもたらしたなら、Pixiv Fanboxでご支援いただけると今後も安定して記事をお届けすることが可能になります。 ご支援いただいたかたには、近況や最新の展開についての投稿をお届けしています。