AIイラスト:AI生成コミックブックのための倫理シート

AIイラスト:AI生成コミックブックのための倫理シート

by Mike Gallaspy
この記事は、2022/09/20に公開された「Ethics Sheet for AI-assisted Comic Book Art Generation」の翻訳です。

はじめに

このブログは、「Ethics Sheets for AI Tasks (AI タスクのための倫理シート)」に触発されて、AI によるコミックブックの生成に関する倫理シートとして機能することを目的としています。「AIによるコミックブックアート生成」は、Cloudera の The Fast Forward Labs Blog に執筆した記事で提案したタスクとなります。私はリサーチエンジニアであり、仕事を始めてからはなんらかの形でソフトウェアの開発に携わってきました。さらに、あまり腕が良いとは言えませんが、アマチュアアーティストでもあります。個人的に、私を含む AI 専門家は、自分たちの仕事や研究が持つ意味を慎重に、そして批判的な視点と共に検討する責任があると考えています。そこで、倫理シートという形で「倫理声明」を作成する必要性を感じました。

このブログ記事は、分野全体を包括するものではなく、意図的に簡潔なものにしています。実際、このタスクシートには欠点があり、それは、私の同僚以外の他のアーティストや AI 倫理学者のような関係者は関与していません。また、私の考えうる新しい AI タスクの提案における重大な欠陥を網羅するものではありますが、さらにこの分野が発展するにあたっては、より包括的かつ代表的な分析があった方が良いでしょう。このドキュメントが多様な人々のディスカッションを促進させ、その結果が今後作成されるであろうドキュメントに組み込まれることを望んでいます。

さらに、私は AI によるコミックブックアートの生成を批判的に捉えようと努めていますが、完全な客観性を持って書くことは不可能です。それは、個人の持つ社会性や生活経験には、偏見や盲点が残されているからです。したがって、情報を開示するという意味で、最初にこの課題に対する私の個人的な感情を簡単に説明したいと思います。それによって、私が導き出した結論や、どのような質問を検証することを選択したかについて、ある程度の文脈をご理解いただけると思います。

端的に言うと、私は AI アート生成システムに大賛成です。ただし、このようなシステムがすべて倫理的であるとは限らないことも認識しています。賛成する理由としては、このシステムによってアートを作り出すことがより身近な行為になると信じているからです。私個人にとって創作することがより気軽なものになることはもちろんのこと、それがみなさんにとっても身近なものになって欲しいと考えています。しかし、そのようなシステムが、例えば、多くのプロのアーティストから突然仕事を奪うなど、過度の苦しみを生み出すとしたら、それは明らかに倫理的に問題があります。AI アート生成システムがそのような苦しみを生み出すことは、当然意図したものではないとしても、思わぬところに落とし穴はあるものです。

対象範囲、動機、メリット

今回の文脈での「コミックブック」は、一連の画像を通じて視覚的に語られる物語であり、多くの場合吹き出しやキャプションなど、文字を組み合わせることもあります。コミックブックは芸術作品でもあり、芸術作品を作成するシステムに関する考察は、一般的にコミックブックを作成するシステムにも当てはまります。

この記事では、「コミックブック」はグラフィックノベル、コミックストリップ(連載漫画)、 ウェブコミック、などと同義であると考えます。例としては、スーパーヒーローコミックのような古典作品、『Prince of Cats』のような現代作品、『Dinosaur Comics』のようなウェブコミックなどが挙げられます。

AI によるコミックアート生成のタスクは、コミックブックのベースとなる一連の画像を作成し、場合によってはさらに修正を加えることです。このタスクの利点は、望ましい品質の画像を制作するための労力とスキルの負担を軽減することです。もちろん、画像作成はコミック制作の一側面でしかなく、通常は作家とイラストレーターの共同作業で行われます。ここでは、画像制作という側面に焦点を当てたいと思います。

倫理的配慮

なぜ自動化するのか?誰がメリットを得るのか?

画像を思い通りの品質でアウトプットするスキルを身につけることは、決して簡単なことではありません。長い時間と多くの練習が必要です。もし、レッスンを受けたり、芸術系の学校に通ったり、トレーニングプログラムに参加したりすれば、経済的にも大きな負担となります。また、一通りの技術を身につけたとしても、画像1枚を制作するのは大変な労力です。自動化は、人間が行うよりも早くアウトプットすることで労力を軽減します。また、アーティストが自分では容易に達成できないような品質の画像を生成できることから、スキル習得の必要がなくなる可能性があります。

デジタルアートといえども、その制作は物理的な作業であり、人によっては大変な労力を必要とします。その身体的負担を軽減する自動化によって、競争の場が平準化します。プロのアーティストを目指しながら、従来の道具や技術ではプロの現場で求められる一定の生産性を満たせない人たちは、生産性を向上させる自動化の恩恵を受けることができるかもしれません。この平準化は、AI に限ったことではなく、生産性を向上させる多くの技術に当てはまります。例えば、「コンピュータ」という言葉は、かつてはマニュアルで数学的な計算を行う人間のことを指していました。しかし、現代では、そんな「コンピュータ」と呼ばれた人が部屋いっぱいに集まった状態の計算能力よりも、スマートフォンの方が勝るのです。20世紀初頭には、対応不可能であったような種類の科学技術問題を、かなりの規模で、労働力を持てない人々や組織が解決できるようになっています。

資本主義的価値観のもとでは、アートの消費者である企業や個人は、生産性の向上によって恩恵を得ることができます。自動化によって、従来型の方法に比べ、一定量のアートがより低いコストで提供されるようになるかもしれません。一方でアーティストにとっては、市場が一定レベルの生産しか必要としない可能性があるため、仕事の安定を脅かすこともあります。誠実なアート制作 AI システムの開発者なら、被害をもたらすような結果を回避または軽減するために、そのシステムが関連する労働市場に与える実際の影響を、予測・評価するよう努めるべきです。例えば、人を排除して質の低い作品を作るシステムよりも、人の力を取り込んで質の高い作品を作る自動化システムの方が望ましい場合があります。

生産性もさることながら、物語を伝えることに、緊急性があると感じています。物語は言いたいことを伝えるだけではなく、人々をインスパイアし、学びを与え、感動させることができます。中には、一刻を争う社会的課題を伝えたいかもしれません。コミックは物語を伝えるメディアであり、自動化によってより早く生産することができれば、より効果的に議題を追求することができます。

アクセス:誰が使えるのか?

アート制作 AI システムの最新技術では、ほぼ例外なくディープラーニングモデルが使用されており、作成と、作成後の画像生成を使うためには、相当量の計算リソースが必要となります。これらのリソースへのアクセスは、地理的、生活レベル的、人種的な格差があり、明らかに公平ではありません。AI によるコミックブックのための画像生成システムの作成者は、そのシステムが公平であることを望むのであれば、アクセスが難しい人に手を差し伸べるなど、格差に対処する努力が必要です。

データがどこから来るのか?

ディープラーニングモデルはデータを大量に必要とします。例えば、DALL-E 2 のような最先端のシステムは、インターネットからかき集めた画像の膨大なデータセットで学習します。このようなデータセットの内容は、モデルの結果に、問題となるバイアスをもたらす可能性があります。また、インターネットから大量のデータセットを収集することは、プライバシー、同意、表記、報酬を中心とした多くの倫理的問題を引き起こすことにもなります。

ディープラーニングモデルの学習に用いるデータセットは、性能の高さに決定的な役割を果たします。よって、高度な技術を持つ AI システムを作りたい開発者は、データセットの収集に関する倫理的な懸念をおろそかにしてしまう傾向にあります。特に、顕著なのは、データが多ければ良い結果が得られると考える場合や、倫理的に問題のあるソースが高品質のデータを持っていると考える場合です。

誠実な AI システム設計者は、データの収集方法について特別な注意を払う必要があります。この点を詳細に議論することは、このドキュメントの範囲外ではありますが、データをインターネットからかき集める以外に、大規模で高品質なデータセットを収集する代替手段を模索することをお勧めします。アートを創造するためのAIシステムには、データセットを委託することも含まれるかもしれません。

そして、アーティストが自分の芸術的影響を主張するのは一般的なことです。極端な話、その自分の作品だと主張しない場合は、盗作とみなされる可能性もあります。今日、ほとんどの AI システムには、学習セットのどの要素が結果に影響を与えたかを示す機能がありません。アート制作 AI システムの設計者は、トレーニングセットのどの画像が結果に強く影響を与えたかを、画像の類似性の測定基準を用いて特定する必要があります。影響(金銭的なことも含む)を適切に表記し、盗作とならないようにするのです。

誤使用:何が問題になるのか?

すべてのリスクや悪用方法を予測することは不可能ですが、私が本から得た知識や同僚から提案されたものには以下のようなものがあります。これらのリスクは簡単には解決しませんが、技術がどのように悪用されるかについて、明確な視点を持つことが重要です。

人間の創造性に終止符を打つ

一般にアート制作 AI システムは、制作の労働負担を軽減することが期待されており、労働負担が十分に小さくなれば、AI システムがアート制作を支配するようになる可能性があります。人間は見たことのないものを想像し、それをアートとして表現することができますが、ディープラーニングシステムは、学習セットから外れた画像をどの程度まで再現できるかは分かっていません。もし、人間と AI が根本的に異なるアートを生み出すことができた場合で、かつ AI に過度に依存してしまった場合を考えると、人間のみが作成できるアートが衰退してしまうことも考えられます。

この懸念の前提を少し検証してみましょう。この懸念は、労力を減らすことで価値を向上させるということを前提としています。しかし、アート作品の価値には、金銭的価値、美的価値、感傷的価値など、様々な主観的かつ潜在的に比較不可能な要素が含まれています。労働負担がかからないことで価値があるのは、一部の場合のみです。それは例えば、締め切りの厳しい報道機関が、記事のためにオリジナルアートを掲載したいと考えた場合などです。むしろ、労力が減ることが評価されることは少ないかもしれません。人の手による制作が AI に完全に取って代わるというのは想像できません。それは、時間をかけて作り上げた作品を評価する人は、常に存在するはずだからです。

AI システムで何ができるのかということについては、具体的な方法を参照しないと、正確に答えることはできません。確かに機械学習システムは、デザイン上、ある種の画像を生成しやすいのですが、その画像群を理論的にマッピングするような取り組みを私は知りません。つまり、AI と人間が原理的に生み出すことのできる作品群に違いがあるのかどうかさえ、未知の問題なのです。

誠実なシステム設計者は、このことから何を学ぶべきなのでしょうか。仮に、AI システムがアート制作を支配するようになったとします。その上で、AI だけではあるタイプのアート作品を制作できなくなったとしたら、1つの解決策として、AI システムに人間の力を取り入れることで、アウトプットの幅を広げることが考えられます。このような AI によるアート制作は、「DALL-E」のようなシステムで既に提案されています。The DALL-E 2 Prompt Bookに掲載されている例をご覧ください。DALL-EによるAIイラスト生成のサンプル画像

上記の例では、ユーザーが不要なディテールを削除し、DALL-E にその部分を補ってもらうよう依頼しました。しかし、もし AI ができないのであれば、人間がそれを行うことで、AI と人間の技術を融合させた新しい作品が生まれる可能性があります。そのため、誠実なシステム設計者は、アート作品を生み出すシステムには人間の力が必要であることを予測しておく必要があります。

偽情報とプロパガンダ

物語の語り手の中には、偽情報を流したり、有害な思想を社会に植え付けたりするなど、悪意のある社会的思想の持ち主がいるかもしれません。もし、AI による語り手支援システムが、語り手の意図の実現を容易にするのであれば、悪意を持っている利用者も支えることになります。また、悪意のない目的のために作られたものが、悪意を持って使用することも可能となってしまうので、すべての懸念事項の中でこれは最も難しい課題だと言えます。

AI システムを使って虚偽の情報が真実として伝わってしまうリスクは、コミックに限ったことではなく、ディープフェイクや、誤解を招く情報でニュース記事全体を作成できる、自然言語処理(NLP)システムという形で既に存在しています。したがって、誠実なシステム設計者は、ディープフェイクやその他の AI が悪用された事例をめぐる倫理的な議論に、目を向ける必要があります。

また、AI システムは、「本物」と偽ることだけではなく、他の操作技術を用いた悪意あるプロパガンダの作成にも利用される可能性があります。例えば、読み手を過激化させる目的で、暴力的なイデオロギーに同調させるような物語を作成することが考えられます。このリスクを軽減する方法としては、既存のシステムですでに採用されているものですが、好ましくない内容を排除するためにシステムの入出力をフィルタリングするがあります。しかし、これは主に事後的な対策です。それは、「好ましくないもの」の性質が定まっていないことで、実際のシステムでは未知の悪用を受け入れる可能性が高いからです。

結論

コミックアート生成のような、楽しいように思われるタスクであっても、単に高度な技術を持つシステムを作るだけでなく、誠実なシステム設計者が取り組むべき多くの倫理的考察があることは明らかです。私は、AI によるコミックアート生成のタスクや、より一般的なアートのための AI システムに関する倫理的考察について、さらに研究し学んでいくことを楽しみにしています。

このブログを読んで、Cloudera Fast Forward Labs が進めている様々な研究プロジェクトについて興味をお持ちになった方は、CFFLブログ(英語)をご確認いただき、また、CFFLニュースレター(英語)にご登録ください。

参考リンク:

1 Mohammad, Saif M. “Ethics Sheets for AI Tasks.” arXiv, March 19, 2022. https://doi.org/10.48550/arXiv.2107.01183.

2 I am not the first, although I believe my formulation of the task is novel. See Yang, Xin, Zongliang Ma, Letian Yu, Ying Cao, Baocai Yin, Xiaopeng Wei, Qiang Zhang, and Rynson W. H. Lau. “Automatic Comic Generation with Stylistic Multi-Page Layouts and Emotion-Driven Text Balloon Generation.” arXiv, January 26, 2021. https://doi.org/10.48550/arXiv.2101.11111. See also https://bleedingcool.com/comics/lungflower-graphic-novel-drawn-by-a-i-algorithm-is-first-to-publish/.

3 Not least so that people actually read it.

4 Unless your desired quality is “unskilled,” I guess.

5 Maybe it sounds counterintuitive, but the fact is that humans are still better than state-of-the-art AI systems at many tasks. For such a complex task as creating art it is not far fetched that superior results will be achieved when a system admits human intervention for tasks that AI struggles with. See Korteling, J. E. (Hans)., G. C. van de Boer-Visschedijk, R. A. M. Blankendaal, R. C. Boonekamp, and A. R. Eikelboom. “Human- versus Artificial Intelligence.” Frontiers in Artificial Intelligence 4 (2021). https://www.frontiersin.org/articles/10.3389/frai.2021.622364.

6 Srinuan, Chalita, and Erik Bohlin. “Understanding the Digital Divide: A Literature Survey and Ways Forward.” 22nd European Regional ITS Conference, Budapest 2011: Innovative ICT Applications – Emerging Regulatory, Economic and Policy Issues. 22nd European Regional ITS Conference, Budapest 2011: Innovative ICT Applications – Emerging Regulatory, Economic and Policy Issues. International Telecommunications Society (ITS), 2011. https://ideas.repec.org/p/zbw/itse11/52191.html.

7 IEEE Spectrum. “DALL ·E 2’s Failures Are the Most Interesting Thing About It,” July 14, 2022. https://spectrum.ieee.org/openai-dall-e-2.

8 https://www.engadget.com/dall-e-generative-ai-tracking-data-privacy-160034656.html

9 Perceptual similarity is a good candidate. See Johnson, Justin, Alexandre Alahi, and Li Fei-Fei. “Perceptual Losses for Real-Time Style Transfer and Super-Resolution.” In Computer Vision – ECCV 2016, edited by Bastian Leibe, Jiri Matas, Nicu Sebe, and Max Welling, 694–711. Lecture Notes in Computer Science. Cham: Springer International Publishing, 2016. https://doi.org/10.1007/978-3-319-46475-6_43.

10 For example, when I see an oil painting I like, part of my appreciation for the artwork stems from my recognition of the skill and time it took to produce. It’s not cheapened by the fact that it may be possible to render a similar digital image with less labor.

11 However an empirical effort has emerged in the form of prompt engineering for systems like DALL-E. See https://dallery.gallery/the-dalle-2-prompt-book/.

 

E-book: IoTによる デジタル トランスフォーメーション

Cloudera Japan Marketing
この著者の他の記事

コメントする

あなたのメールアドレスは公開されません。また、コメントにリンクを貼ることはできません。