#ITBS_textと見出しがついていたらおれが書きたいだけのなんか適当な文章で、#C4P_demoという見出しがついていたら文フリ用原稿の叩き台だと思ってください。よろしくお願いします。
Rage Against the AI
新しく登場したテクノロジーに対しては、初見であるが故に種々様々なリアクションが発生するわけであるが、アマチュアクリエイターマジョリティの領域で、生成AIに対して最初にめちゃくちゃブチギレた態度を取ったのはいわゆる”絵師”の界隈であった。一方で、音楽クリエイターはしばらくは割と楽観的な態度であるように見えて、この対比が妙に印象的で、理由を考えていたのである。
生成AIがもたらす影響はC4Q/C4P文脈で考えると非常にわかりやすい。AIが脅かすのは我々の市場価値である。市場におけるクオリティ軸で考えたときに、時間的/金銭的なコストという点で人間がAIに敵うことはない。AIは爆速で、ダイレクトに最終成果物を生成する。そもそもどうやったって3分の曲を作ろうと思ったら3分以上かかる人間とは作りが根本的に違うわけであるから、投入コストあたりの成果量でAIが人間に勝るのは明確であり、C4Q的な態度で挑むと、我々の市場価値は今後相対的に低下し続けることがほぼ決まっている。
一方、AIは特にC4P的な態度には影響を与えない。創作の意義をパーソナリティの発現とする姿勢の下でみると、AIがすごいスピードで何曲作ろうが、それ自体は個々人のパーソナリティを取り出してはくれない。無関係であるから、実にどうでもいい話である。逆に、あり得ない速度でAIに1000000曲作らせて、好きなやつを選びとるといったように、選択行為の対象にすれば、あくまで自らをC4P的な動作の主体として置くことも可能である。望むにせよ望まないにせよ、自分の曲が学習データとしてモデル生成に使われる場合のみ、一応パーソナリティと干渉するので争点になりうるが、汎用作曲モデルであればパーソナリティ発現の純度は相当に下がっているし、あるいはおれ模倣独自モデルのようないい感じに自己を反映したものが存在するならば、自らを鑑みる装置として使えば良い。理屈を超えてなんかキモいと感じる、といった類の感情は尊重されるべきであるが、まあだいたいはこんなふうに捉えている。
要するに、生成AIはC4Qにおいては我々の価値を相対的に下げる。他方、C4Pには特に影響がないか、それなりに便利な道具になりうる、という構図である。
ここでよくある誤解が2つある。1つ目が、「AIは平均出力マシンであり、没個性的であるから、個性こそがAIに勝る」といったもので、もう1つが、「人間にはアナログ特有の揺らぎがあって、AIにはそれが存在しない」というものである。
前者に関しては、作家性が高い=特徴量の抽出が容易といえるのでどちらかというとむしろ逆である。世間の人々が個性を認識できているということは、大量の公開作品があり、ビジュアル文法が整理されているので、むしろAI模倣の精度が高まってしまう。例えばジブリ絵は、意識的に、作者が数多の意図を明確に介在させてあの作風に至っているわけであるが、テイストが明確であるからこそ、AIは容易に雰囲気を似せることができる。AIが何枚のジブリ風の絵を生成してもそこに宮崎駿のパーソナリティは発現しないが、作風面での個性が明確なのはむしろAI利用の対象物としてよいおもちゃとなるということである。
後者の「揺らぎこそが人間や!」的なロジックも、体感的にはそう思いづらいが、もし本当に重要なのであれば、現時点では無理でも、どこかのタイミングでAIがいずれ高い精度でそれを踏襲可能になるだけである。揺らぎやブレそのものが人間のアイデンティティになることはない。
これらを踏まえて最初の話に戻る。そもそも現状は生成AIの技術の進展レベルが画像と音声では大きく異なるのは留意してほしい。デジタル画像は各ピクセルが (R, G, B) の 3 チャネル値を持つ 2Dグリッドで、局所畳み込みを数十層積めば全画面の文脈が届くため学習効率が高い。一方、3 分の音楽は振幅のサンプルデータが時間順に並び、コード進行や楽式が数百万ステップに跨る長距離依存を孕む。公開コーパスや客観評価指標も未整備で、現状は画像モデルの方が先行している。テクニカル面では、この 技術成熟ギャップが、絵師と音屋の脅威感の差を生んでいるのが現状である。そして、この差はいずれなくなるという仮定を前提として、さらに法解釈での違法合法を一切無視した上で以下の話をする。
AIが脅かすのは我々の市場価値である、という見地で見ると、強固な市場が形成されていて、相対的な価値比較に晒されやすい環境で活動している人であればあるほどAIにイラつく傾向にあるということがわかる。いわゆる”絵師”は、群を抜いて市場規模が大きいからこそ、ブチギレが目立つのである。イラストにおいては二次創作が一大ジャンルを築いていて巨大マーケットになっていること自体がかなり特殊であるし、一次創作でもアマチュアから商業プロになったり、活動の形態を変えないまま野良で金が稼げるようになったりといった例が豊富である。草の根からプロまでのグラデーションが整備されていて、金策に至るまでの道筋の轍が多彩であるという点で、他の分野よりも土壌が豊かなのだ。DLsiteやBOOTHでの直販、pixivFANBOXやFantia、skebなどのマネタイズプラットフォームの充実からもそれは見てとれる。3Dモデルでも音楽でも同様のサービスを利用できるが、イラストは市場規模が違いすぎる。これはひとえに界隈全体の努力の功績であるが、それゆえに、コミケでの売り上げ規模やSNSフォロワーなど、数字での相対評価が苛烈なのもまた事実である。C4Q的競争が明確であればあるほど、AIはブチギレ対象になっていく。絵師がイラつきやすい性分であるとかテクノロジーへの理解が浅いとかそういうわけではなく、ただどの分野よりも、明確に市場競争圧が強いからこうなっているような気がしている。
そう考えると、音楽でのブチギレがマイルドなのは、実際のところ単に相対的にアマチュア-ハイアマチュアの商業的な市場規模がまだ小さいからという単純な話になる。先日、ボカロ曲匿名投稿イベント「無色透名祭3」で生成AIの使用を認める規約が入り、自分は初めて音楽界隈での集団的な対AI大ブチギレを観測したが、これはボカロ界隈が市場として豊かであることを反映しているからであると感じている。市場の豊かさ、というのは何も金の稼ぎやすさだけではない。客観指標が明確であればあるほどAIのやだみが強まるというだけである。いまのボカロ界隈は客観指標でのヒエラルキー付けがなかなかシビアである。怒っている人は大体「突然ポコポコと成果物を生む謎の装置が爆誕し、突然一生懸命作ったものの市場における相対的な価値が低下している」ということに怒っている、というのが私の所感である。
生成AIがC4Qにおいては我々の価値を下げるのはもう揺るぎない事実であって、そればっかりはもう仕方がない。恣意的にAIを排除した市場を設けることは可能であるが、自由競争を是とする市場の重力を完全に無視したユートピアが作れるわけではない。AIが、市場において、どんどんとおれたちを相対的に雑魚にしていくことは確定しているのだ。
かたやC4P的な態度においては、生成AIの存在というのは原理的には我々を阻害しない。心理的な不快感は残ることは認めるが、AIが素晴らしい曲を何曲作ったところで、パーソナリティに能動的に干渉し、取り出してくれることはない。パーソナリティを取り出せたければ、自らの手で成し遂げなければならないという構図は普遍で、創作の本質価値は毀損されないのだ。
前述の通り、創作とは分解すると選択の連鎖であるとみなせるから、なんならAIにアホみたいな量の曲を生成させ、その良し悪しをこちらが能動的にジャッジし、選択のふるいにかけることで、パーソナリティーの輪郭を浮かび上がらせるといった新しい形態の遊びも生まれるわけである。市場さえ無視できれば、主導権はこちらにある。おれを知るためにおれが作る。またはおれが作らせておれが選ぶ。おれが選んでいる限りおれが一番偉い。人間の勝ちや。ざまあみやがれ!