Creativity is a fundamental feature of human intelligence, and a challenge for AI. AI techniques
can be used to create new ideas in three ways: by producing novel combinations of familiar ideas;
by exploring the potential of conceptual spaces; and by making transformations that enable the
generation of previously impossible ideas. AI will have less difficulty in modelling the generation of
new ideas than in automating their evaluation.
創造性は人間の知性の基本的な特徴であり、AIにとって課題でもあります。AI技術は、3つの方法で新しいアイデアを生み出すために使用できます。それは、既知のアイデアの斬新な組み合わせを生み出すこと、概念空間の可能性を探求すること、そしてこれまで不可能だったアイデアの生成を可能にする変革を行うことです。AIにとって、新しいアイデアの生成をモデル化することは、その評価を自動化することよりも容易です。
Creativity is a fundamental feature of human intelligence, and an inescapable challenge
for AI. Even technologically oriented AI cannot ignore it, for creative programs could be
very useful in the laboratory or the market-place. And AI-models intended (or considered)
as part of cognitive science can help psychologists to understand how it is possible for
human minds to be creative.
創造性は人間の知性の根本的な特徴であり、AIにとって避けられない課題です。技術志向のAIでさえ、創造性を無視することはできません。創造的なプログラムは、研究室や市場で非常に役立つ可能性があるからです。そして、認知科学の一部として意図された(または考えられている)AIモデルは、心理学者が人間の心がどのようにして創造的になるのかを理解するのに役立つ可能性があります。
Creativity is not a special “faculty”, nor a psychological property confined to a tiny elite.
Rather, it is a feature of human intelligence in general. It is grounded in everyday capacities
such as the association of ideas, reminding, perception, analogical thinking, searching
a structured problem-space, and reflective self-criticism. It involves not only a cognitive
dimension (the generation of new ideas) but also motivation and emotion, and is closely
linked to cultural context and personality factors [3]. Current AI models of creativity focus
primarily on the cognitive dimension.
創造性は特別な「能力」でもなければ、ごく少数のエリート層に限定された心理的特性でもありません。
むしろ、それは人間の知能全般に備わった特徴です。創造性は、アイデアの連想、想起、知覚、類推思考、構造化された問題空間の探索、そして内省的な自己批判といった、日常的な能力に根ざしています。創造性は、認知的側面(新しいアイデアの創出)だけでなく、動機付けや感情も伴い、文化的背景や性格的要因と密接に関連しています[3]。現在のAIによる創造性モデルは、主に認知的側面に焦点を当てています。
A creative idea is one which is novel, surprising, and valuable (interesting, useful,
beautiful. .). But “novel” has two importantly different senses here. The idea may be novel
with respect only to the mind of the individual (or AI-system) concerned or, so far as we
know, to the whole of previous history. The ability to produce novelties of the former kind
may be called P-creativity (P for psychological), the latter H-creativity (H for historical).
P-creativity is the more fundamental notion, of which H-creativity is a special case.
創造的なアイデアとは、斬新で、驚きがあり、価値あるもの(興味深い、役に立つ、美しいなど)です。しかし、「斬新」という言葉には、ここでは2つの重要な異なる意味があります。アイデアは、関係する個人(またはAIシステム)の精神に関してのみ斬新である場合もありますが、私たちが知る限り、過去の歴史全体に関して斬新である場合もあります。前者の種類の斬新さを生み出す能力はP創造性(Pは心理的創造性)、後者はH創造性(Hは歴史的創造性)と呼ぶことができます。P創造性はより基本的な概念であり、H創造性はその特別なケースです。
AI should concentrate primarily on P-creativity. If it manages to model this in a powerful
manner, then artificial H-creativity will occur in some cases-indeed, it already has, as we
shall see. (In what follows, I shall not use the letter-prefixes: usually, it is P-creativity which
is at issue.)
AIは主にP-創造性に集中すべきです。もしAIがこれを強力にモデル化できれば、人工的なH-創造性がいくつかのケースで実現するでしょう。実際、これから見ていくように、既に実現しています。(以下では、文字接頭辞は使用しません。通常、問題となるのはP-創造性です。)
There are three main types of creativity, involving different ways of generating the novel
ideas. Each of the three results in surprises, but only one (the third) can lead to the “shock’
of surprise that greets an apparently impossible idea [2]. All types include some H-creative
examples, but the creators celebrated in the history books are more often valued for their
achievements in respect of the third type of creativity.
創造性には主に3つのタイプがあり、それぞれ斬新なアイデアを生み出す方法が異なります。3つのタイプはどれも驚きをもたらしますが、一見不可能なアイデアに驚かされる「ショック」をもたらすのは3つ目のタイプだけです[2]。すべてのタイプにH創造性の例が含まれていますが、歴史書に名を残すクリエイターは、3つ目のタイプの創造性における功績がより高く評価されることが多いのです。
The first type involves novel (improbable) combinations of familiar ideas. Let us
call this “combinational” creativity. Examples include much poetic imagery, and also
analogy-wherein the two newly associated ideas share some inherent conceptual
structure. Analogies are sometimes explored and developed at some length, for purposes
of rhetoric or problem-solving. But even the mere generation, or appreciation, of an apt
analogy involves a (not necessarily conscious) judicious structural mapping, whereby the
similarities of structure are not only noticed but are judged in terms of their strength and
depth.
最初のタイプは、馴染みのあるアイデアの斬新な(あり得ない)組み合わせです。これを「組み合わせ的」創造性と呼びましょう。例としては、多くの詩的なイメージや、新たに関連付けられた2つのアイデアが何らかの固有の概念構造を共有するアナロジーなどが挙げられます。アナロジーは、修辞学や問題解決のために、ある程度長く探求され、発展させられることがあります。しかし、適切なアナロジーを単に生成したり、理解したりするだけでも、(必ずしも意識的ではない)賢明な構造マッピングが伴い、それによって構造の類似性が認識されるだけでなく、その強さと深さによって判断されます。
The second and third types are closely linked, and more similar to each other than
either is to the first. They are “exploratory” and “transformational” creativity. The former
involves the generation of novel ideas by the exploration of structured conceptual spaces.
This often results in structures (“ideas”) that are not only novel, but unexpected. One can
immediately see, however, that they satisfy the canons of the thinking-style concerned.
The latter involves the transformation of some (one or more) dimension of the space,
so that new structures can be generated which could not have arisen before. The more
fundamental the dimension concerned, and the more powerful the transformation, the more
surprising the new ideas will be. These two forms of creativity shade into one another, since
exploration of the space can include minimal “tweaking” of fairly superficial constraints.
The distinction between a tweak and a transform is to some extent a matter of judgement,
but the more well-defined the space, the clearer this distinction can be.
2番目と3番目のタイプは密接に関連しており、どちらが1番目と似ているかよりも、互いに似ている点が多い。それらは「探索的」創造性と「変革的」創造性である。前者は、構造化された概念空間の探索によって斬新なアイデアを生み出すことを伴い、
その結果、斬新なだけでなく予想外の構造(「アイデア」)が生まれることが多い。しかし、それが関連する思考スタイルの規範を満たしていることはすぐに分かる。後者は、空間のある(1つまたは複数の)次元の変革を伴い、
これまでは考えられなかった新しい構造を生み出すことができる。対象となる次元がより根本的であればあるほど、そして変革がより強力であればあるほど、
新しいアイデアはより驚くべきものとなる。空間の探索には、かなり表面的な制約の「微調整」が最小限含まれる場合があるので、これら2つの創造性の形態は互いに影響し合っている。
微調整と変革の区別はある程度判断の問題ですが、空間が明確に定義されていればいるほど、この区別は明確になります。
Many human beings-including (for example) most professional scientists, artists,
and jazz-musicians-make a justly respected living out of exploratory creativity. That
is, they inherit an accepted style of thinking from their culture, and then search it,
and perhaps superficially tweak it, to explore its contents, boundaries, and potential.
But human beings sometimes transform the accepted conceptual space, by altering or
removing one (or more) of its dimensions, or by adding a new one. Such transformation
enables ideas to be generated which (relative to that conceptual space) were previously
impossible.
多くの人間 ― 例えば、ほとんどのプロの科学者、芸術家、そしてジャズミュージシャンを含む ― は、探求的な創造性によって当然ながら尊敬される生計を立てています。つまり、彼らは自らの文化から受け入れられた思考様式を受け継ぎ、それを探求し、場合によっては表面的に微調整することで、その内容、限界、そして可能性を探求するのです。
しかし、人間は時として、受け入れられた概念空間を、その次元の一つ(あるいは複数)を変更または削除したり、新たな次元を追加したりすることで、変容させます。こうした変容によって、(その概念空間において)以前は不可能だったアイデアを生み出すことが可能になります。
The more fundamental the transformation, and/or the more fundamental the dimension
that is transformed, the more different the newly-possible structures will be. The shock
of amazement that attends such (previously impossible) ideas is much greater than the
surprise occasioned by mere improbabilities, however unexpected they may be. If the
transformations are too extreme, the relation between the old and new spaces will not
be immediately apparent. In such cases, the new structures will be unintelligible, and very
likely rejected. Indeed, it may take some time for the relation between the two spaces to be
recognized and generally accepted.
変革がより根本的であればあるほど、そして/または変革される次元がより根本的であればあるほど、新たに可能となる構造はより異なったものとなるでしょう。そのような(以前は不可能だった)アイデアに伴う驚きの衝撃は、たとえそれがどれほど予想外のものであったとしても、単なるあり得ないことによって引き起こされる驚きよりもはるかに大きいです。変革があまりにも極端な場合、古い空間と新しい空間の関係はすぐには明らかになりません。そのような場合、新しい構造は理解不能であり、おそらく拒絶されるでしょう。実際、2つの空間の関係が認識され、一般的に受け入れられるまでには、ある程度の時間がかかるかもしれません。
Computer models of creativity include examples of all three types. As yet, those
focussed on the second (exploratory) type are the most successful. That’s not to say
that exploratory creativity is easy to reproduce. On the contrary, it typically requires
considerable domain-expertise and analytic power to define the conceptual space in the first
place, and to specify procedures that enable its potential to be explored. But combinational
and transformational creativity are even more elusive.
創造性のコンピュータモデルには、これら3つのタイプすべてが含まれています。今のところ、2番目のタイプ(探索的)に焦点を当てたモデルが最も成功しています。これは、探索的創造性が容易に再現できるということではありません。むしろ、まず概念空間を定義し、その可能性を探求するための手順を規定するためには、通常、相当の専門知識と分析力が必要です。しかし、組み合わせ的創造性や変革的創造性は、さらに捉えどころのないものです。
The reasons for this, in brief, are the difficulty of approaching the richness of human
associative memory, and the difficulty of identifying our values and of expressing them in
computational form. The former difficulty bedevils attempts to simulate combinational
creativity. The latter difficulty attends efforts directed at any type of creativity, but is
especially problematic with respect to the third (see Section 4, below).
その理由は、簡単に言えば、人間の連想記憶の豊かさに近づくことの難しさ、そして人間の価値観を特定し、それを計算形式で表現することの難しさである。前者の難しさは、組み合わせ創造性をシミュレートしようとする試みを困難にする。後者の難しさは、あらゆる種類の創造性に向けた取り組みに共通するが、特に3番目の点に関しては問題となる(下記第4節参照)。
Combinational creativity is studied in AI by research on (for instance) jokes and analogy.
Both of these require some sort of semantic network, or inter-linked knowledge-base, as
their ground. Clearly, pulling random associations out of such a source is simple. But an
association may not be telling, or appropriate in context. For all combinational tasks other
than “free association”, the nature and structure of the associative linkage is important too.
Ideally, every product of the combinational program should be at least minimally apt, and
the originality of the various combinations should be assessable by the AI-system.
AIにおける組み合わせ創造性は、例えばジョークやアナロジーに関する研究によって研究されています。
これらはどちらも、基盤として何らかの意味ネットワーク、つまり相互にリンクされた知識ベースを必要とします。
そのような情報源からランダムな連想を引き出すのは明らかに簡単です。しかし、
連想は必ずしも意味を成さない、あるいは文脈に適切ではない場合があります。「自由連想」以外のすべての組み合わせタスクでは、
連想的なつながりの性質と構造も重要です。
理想的には、組み合わせプログラムから得られるすべての成果物は、少なくとも最低限の適切性を備え、
様々な組み合わせの独創性はAIシステムによって評価可能であるべきです。
A recent, and relatively successful, example of AI-generated (combinational) humour is
Jape, a program for producing punning riddles [I]. Jape produces jokes based on nine
general sentence-forms, such as: What do you get when you cross X with Y?; What
kind of X has Y?; What kind of X can Y?; What’s the difference between an X and
a Y? The semantic network used by the program incorporates knowledge of phonology,
semantics, syntax, and spelling. Different combinations of these aspects of words are used.
in distinctly structured ways, for generating each joke-type.
AI生成(組み合わせ型)ユーモアの最近の比較的成功した例として、Japeがあります。これは、しゃれのなぞなぞを生成するプログラムです[I]。ジェイプは、例えば「XとYを掛け合わせると何になるか?」「どのようなXにYがあるか?」「どのようなXがYになるか?」「XとYの違いは何か?」といった9つの一般的な文型に基づいてジョークを生成します。このプログラムが使用する意味ネットワークには、音韻論、意味論、統語論、綴りに関する知識が組み込まれています。これらの単語のさまざまな側面の異なる組み合わせが、明確に構造化された方法で使用され、それぞれのジョークタイプが生成されます。
Examples of riddles generated by Jape include: (Q) What kind of murderer has fibre?
(A) A cereal killer; (Q) What do you call a strange market? (A) A bizarre bazaar; (Q) What
do you call a depressed train? (A) A low-comotive; and (Q) What’s the difference between
leaves and a car? (A) One you brush and rake, the other you rush and brake. These may
not send us into paroxysms of laughter-although, in a relaxed social setting, one or two
of them might. But they are all amusing enough to prompt wryly appreciative groans.
ジェイプが生成したなぞなぞの例には、次のようなものがあります。(Q) どんな殺人犯が食物繊維を持っている?
(A) シリアルキラー(cereal killer:穀物殺人犯 ⇔ serial killer:連続殺人犯) (Q) 奇妙な市場を何と呼ぶ?(A) 奇妙なバザール。(「Bizarre(奇妙な)」と「bazaar(バザール、市場)」の発音が非常に似ている)(Q) 落ち込んでいる列車を何と呼ぶ?(A) ローコモーティブ(低い機関車)(「locomotive」(機関車) を「Low-comotive」に分割。「low」は「低い」だけでなく「落ち込んだ」の意味もある)(Q) 葉っぱと車の違いは?(A) 落ち葉はブラシで掃き集め、車は急ブレーキをかける。
(「brush and rake(掃き集める、熊手)」と「rush and brake(急ぐ、ブレーキ)」)
これらは私たちを激怒させるほどにはならないかもしれません。もっとも、くつろいだ社交の場であれば、1つか2つはそうかもしれません。しかし、どれも皮肉なほど面白いので、皮肉っぽくも感嘆するようなうめき声をあげてしまうのです。
Binsted did a systematic series of psychological tests, comparing people’s reception
of Jape’s riddles with their response to human-originated jokes published in joke-books.
She also compared Jape’s products with “non-jokes” generated by random combinations.
She found, for instance, that children, by whom such humour is most appreciated, can
distinguish reliably between jokes (including Jape’s riddles) and non-jokes. Although they
generally find human-originated jokes funnier than Jape’s, this difference vanishes if Jape’s output is pruned, SO as to omit the items generated by the least successful schemata. The
riddles published in human joke-books are highly selected, for only those the author finds
reasonably funny will appear in print.
ビンステッドは、体系的な一連の心理テストを行い、人々がジェイプの謎かけをどのように受け止めるかと、ジョーク本に掲載された人間発のジョークに対する反応を比較した。
また、彼女はジェイプの作品を、ランダムな組み合わせによって生成された「ジョークではないもの」と比較した。
例えば、彼女は、そのようなユーモアを最も好む子供たちは、ジョーク(ジェイプの謎かけを含む)とジョークではないものを確実に区別できることを発見した。子供たちは一般的に、人間発のジョークをジェイプのジョークよりも面白いと感じているが、ジェイプの作品から最も成功していないスキーマによって生成されたものを除外すると、この違いは消える。
人間のジョーク本に掲載された謎かけは厳選されており、著者がそれなりに面白いと感じたものだけが印刷物として掲載される。
Binsted had set herself a challenging task: to ensure that every one of Jape’s jokes
would be amusing. Her follow-up research showed that although none were regarded as
exceptionally funny, very few produced no response at all. This contrasts with some other
Al-models of creativity, such as AM [161, where a high proportion of the newly generated
structures are not thought interesting by human beings.
ビンステッドは、ジェイプのジョークを一つ一つ確実に面白いものにするという、挑戦的な課題を自らに課した。彼女の追跡調査によると、どれも非常に面白いとみなされたものはなかったものの、全く反応を示さないものもごくわずかだった。これは、AM [161] などの他のAIによる創造性モデルとは対照的である。これらのモデルでは、新たに生成された構造の大部分が人間にとって興味深いとは考えられていない。
It does not follow that all Al-modelling of creativity should emulate Binsted’s ambition.
This is especially true if the system is meant to be used interactively by human beings,
to help their own creativity by prompting them to think about ideas that otherwise they
might not have considered. Some “unsuccessful” products should in any case be allowed,
as even human creators often produce second-rate, or even inappropriate, ideas. Jape’s
success is due to the fact that its joke-templates and generative schemata are very limited.
Binsted identifies a number of aspects of real-life riddles which are not parallelled in Jape,
and whose (reliably funny) implementation is not possible in the foreseeable future. To
incorporate these aspects so as to produce jokes that are reliably funny would raise thorny
questions of evaluation (see Section 4).
だからといって、すべてのAIによる創造性モデリングがビンステッドの野望を模倣すべきというわけではない。
これは特に、システムが人間によってインタラクティブに使用され、そうでなければ考えなかったかもしれないアイデアを考えるよう促すことで、人間自身の創造性を高めることを意図している場合に当てはまる。人間のクリエイターでさえ、二流、あるいは不適切なアイデアを生み出すことがよくあるため、いずれにせよ「失敗した」製品は許容されるべきである。Japeの成功は、そのジョークテンプレートと生成スキーマが非常に限られているという事実による。
ビンステッドは、ジェイプには類似していない、そして近い将来に(確実に面白い)実装が不可能な、現実世界の謎かけの多くの側面を特定している。
確実に面白いジョークを生み出すためにこれらの側面を取り入れることは、評価に関する厄介な問題を引き起こすだろう(第4節参照)。
As for AI-models of analogy, most of these generate and evaluate analogies by using
domain-genera1 mapping rules, applied to prestructured concepts (e.g. [7,12,13]). The
creators of some of these models have compared them with the results of psychological
experiments, claiming a significant amount of evidence in support of their domain-general
approach [8]. In these models, there is a clear distinction between the representation of
a concept and its mapping onto some other concept. The two concepts involved usually
remain unchanged by the analogy.
類推のAIモデルに関しては、そのほとんどは、事前構造化概念に適用されるドメインジェネリックマッピングルールを用いて類推を生成・評価する(例:[7,12,13])。これらのモデルの作成者の中には、心理学実験の結果と比較し、ドメインジェネリックアプローチを支持する相当量の証拠があると主張している者もいる[8]。これらのモデルでは、概念の表現と他の概念へのマッピングの間に明確な区別がある。関係する2つの概念は、類推によって通常は変化しない。
Some AI-models of analogy allow for a more flexible representation of concepts.
One example is the Copycat program, a broadly connectionist system that looks for
analogies between alphabetic letter-strings [11,181. Copycat’s concepts are context-
sensitive descriptions of strings such as “mmpprr” and “klmmno”. The two m’s in the
first string just listed will be described by Copycat as a pair, but those in the second string
will be described as the end-points of two different triplets.
類推に関するAIモデルの中には、概念をより柔軟に表現できるものがあります。
一例として、Copycatプログラムが挙げられます。これは、アルファベット文字列間の類似性を探す、広義のコネクショニストシステムです[11,181]。Copycatの概念は、「mmpprr」や「klmmno」といった文字列の文脈依存的な記述です。
最初の文字列の2つの「m」はCopycatによってペアとして記述されますが、2番目の文字列の「m」は2つの異なる3つ組の終点として記述されます。
One might rather say that Copycat will “eventually” describe them in these ways. For
its concepts evolve as processing proceeds. This research is guided by the theoretical
assumption that seeing a new analogy is much the same as perceiving something in a new
way. So Copycat does not rely on ready-made, fixed, representations, but constructs its own
in a context-sensitive way: new analogies and new perceptions develop together. A part-
built description that seems to be mapping well onto the nascent analogy is maintained,
and developed further. One that seems to be heading for a dead end is abandoned, and
an alternative begun which exploits different aspects. The model allows a wide range
of (more or less daring) analogies to be generated, and evaluated. The degree to which
the analogies are obvious or far-fetched can be altered by means of one of the system-
parameters.
Copycat は「最終的に」それらをこのように記述するだろうと言う人もいるかもしれません。なぜなら
その概念は処理が進むにつれて進化するからです。この研究は、新しいアナロジーを見ることは何かを新しい方法で知覚することとほぼ同じであるという理論的仮定に基づいています。そのため、Copycat は既成の固定された表現に頼るのではなく、文脈に応じて独自の表現を構築します。つまり、新しいアナロジーと新しい知覚は共に発展します。初期のアナロジーにうまく対応しているように見える部分的に構築された記述は維持され、さらに発展します。行き詰まりに向かっているように見える記述は放棄され、異なる側面を活用した代替案が開始されます。このモデルは、幅広い(多かれ少なかれ大胆な)アナロジーを生成し、評価することを可能にします。アナロジーがどの程度自明であるか、あるいは無理があるかは、システムパラメータの1つによって変更できます。
Whether the approach used in Copycat is preferable to the more usual forms of (domain-
general) mapping is controversial. Hofstadter [1 l] criticizes other AI-models of analogy
for assuming that concepts are unchanging and inflexible, and for guaranteeing that the
required analogy (among others) will be found by focussing on small representations
having the requisite conceptual structures and mapping rules built in. The opposing camp
rebut these charges [8].
Copycatで使用されているアプローチが、より一般的な(ドメイン全般の)マッピング形式よりも優れているかどうかは議論の余地がある。Hofstadter [11]は、他のAIアナロジーモデルを批判している。
概念は不変かつ柔軟性がないと仮定し、必要な概念構造とマッピング規則が組み込まれた小さな表現に焦点を当てることで、必要なアナロジー(とりわけ)が見つかることを保証している。
反対派はこれらの批判に反論している [8]。
They argue that to identify analogical thinking with high-level perception, as Hofstadter
does, is to use a vague and misleading metaphor: analogical mapping, they insist, is
a domain-general process which must be analytically distinguished from conceptual
representation. They point out that the most detailed published account of Copycat
[181 provides just such an analysis, describing the representation-building procedures as
distinct from, though interacting with, the representation-comparing modules. They report
that the Structure Mapping Engine (SME), for instance, can be successfully used on
representations that are “very large” as compared with Copycat’s, some of which were
built by other systems for independent purposes. They compare Copycat’s alphabetic
microworld with the “blocks world” of 1970s scene analysis, which ignored most of
the interesting complexity (and noise) in the real-world. Although their early models
did not allow for changes in conceptual structure as a result of analogising, they refer
to work on learning (using SME) involving processes of schema abstraction, inference
projection, and re-representation [9]. Moreover (as remarked above), they claim that their
psychological experiments support their approach to simulation. For example, they say
there is evidence that memory access, in which one is reminded of an (absent) analog,
depends on psychological processes, and kinds of similarity, significantly different from
those involved in mapping between two analogs that are presented simultaneously.
彼らは、ホフスタッターのように類推思考を高次の知覚と同一視することは、曖昧で誤解を招くメタファーを用いるものだと主張する。類推マッピングは、概念的表現とは分析的に区別されなければならない、ドメイン全般にわたるプロセスである、と彼らは主張する。彼らは、Copycatに関する最も詳細な公表された説明[181]がまさにそのような分析を提供しており、表現構築手順は、表現比較モジュールとは相互作用しながらも、異なるものとして記述されていると指摘する。彼らは、例えば構造マッピングエンジン(SME)は、Copycatの表現と比較して「非常に大きな」表現、つまり他のシステムによって独立した目的で構築された表現にも効果的に使用できると報告している。彼らは、Copycatのアルファベットのマイクロワールドを、現実世界の興味深い複雑さ(およびノイズ)のほとんどを無視していた1970年代のシーン分析の「ブロックの世界」と比較している。彼らの初期のモデルは類推による概念構造の変化を考慮に入れていなかったが、彼らは、スキーマ抽象化、推論投影、再表現のプロセスを含む(SMEを用いた)学習に関する研究[9]を参照している。さらに(上述のように)、彼らは、心理学実験がシミュレーションへのアプローチを裏付けていると主張している。例えば、彼らは、(存在しない)類似物を思い出す記憶アクセスは、心理的プロセスや類似性の種類に依存しており、同時に提示される2つの類似物間のマッピングに関与するものとは大きく異なるという証拠があると主張している。
The jury remains out on this dispute. However, it may not be necessary to plump
absolutely for either side. My hunch is that the Copycat approach is much closer
to the fluid complexity of human thinking. But domain-general principles of analogy
are probably important. And these are presumably enriched by many domain-specific
processes. (Certainly, psychological studies of how human beings retrieve and interpret
analogies are likely to be helpful.) In short, even combinational creativity is, or can be, a
highly complex matter.
この論争についてはまだ結論が出ていません。しかし、どちらか一方に絶対的に肩入れする必要はないかもしれません。私の直感では、コピーキャットのアプローチは人間の思考の流動的な複雑さに非常に近いでしょう。しかし、類推の領域一般原理はおそらく重要です。そして、これらは多くの領域固有のプロセスによって豊かになると考えられます。(もちろん、人間がどのように類推を取り出し、解釈するかについての心理学的研究は役立つでしょう。)つまり、組み合わせによる創造性でさえ、非常に複雑な問題であり、あるいは複雑になり得るのです。
The exploratory and transformational types of creativity can also be modelled by
AI-systems. For conceptual spaces, and ways of exploring and modifying them, can be
described by computational concepts.
探索型および変革型の創造性も、AIシステムによってモデル化できます。
概念空間と、それを探索・修正する方法は、計算概念によって記述できます。
Occasionally. a “creative” program is said to apply to a wide range of domains, or
conceptual spaces-as EURISKO. for instance, does [16]. But to make this generalist
program useful in a particular area, such as genetic engineering or VLSI-design,
considerable specialist knowledge has to be provided if it is not to generate hosts of
nonsensical (as opposed to merely boring) ideas. In general, providing a program with
a representation of an interesting conceptual space, and with appropriate exploratory
processes, requires considerable domain-expertise on the part of the programmer-or
at least on the part of someone with whom he cooperates. (Unfortunately, the highly
subject-bounded institutional structure of most universities works against this sort of
interdisciplinarity.)
時折、「創造的な」プログラムは、EURISKO [16] のように、広範囲の領域、あるいは概念空間に適用されると言われることがあります。しかし、このジェネラリストプログラムを遺伝子工学やVLSI設計などの特定の分野で有用なものにするには、無意味な(単なる退屈なアイデアではなく)アイデアを大量に生み出さないためには、相当の専門知識を提供する必要があります。一般的に、興味深い概念空間の表現と適切な探索プロセスを備えたプログラムを提供するには、プログラマー、あるいは少なくともプログラマーと協力する誰かに、相当の専門知識が必要です。(残念ながら、ほとんどの大学の高度に分野限定された組織構造は、この種の学際性を阻害しています。)
For example, EMI (experiments in musical intelligence) is a program that composes
in the styles of Mozart, Stravinsky, Joplin, and others [6]. In order to do this, it employs
powerful musical grammars expressed as ATNs. In addition, it uses lists of “signatures”:
melodic, harmonic, metric, and ornamental motifs characteristic of individual composers.
Using general rules to vary and intertwine these, it often composes a musical phrase
near-identical to a signature that has nut been provided. This suggests a systematicity in
individual composing styles.
例えば、EMI(音楽知能実験)は、モーツァルト、ストラヴィンスキー、ジョプリンなどのスタイルで作曲するプログラムです[6]。そのために、EMIはATNとして表現された強力な音楽文法を採用しています。さらに、個々の作曲家に特徴的な旋律、和声、拍子、装飾モチーフである「署名」のリストも使用します。
一般的な規則を用いてこれらを変化させ、絡み合わせることで、EMIはしばしば、提供されていない署名とほぼ同一の音楽フレーズを作曲します。これは、個々の作曲スタイルに体系性があることを示唆しています。
Individual musical style has been addressed also in a pioneering program that improvises
jazz in real time, though the technique can be applied to other types of music [lo]. The
most highly developed version, at present, generates jazz in the style of Charlie Parker-
and (ignoring the lack of expressiveness, and the quality of the synthesized sound) it
actually sounds like Parker. Besides strong (and relatively general) knowledge of musical
dimensions such as harmony and rhythm, and of musical conventions characteristic of
jazz, the system has access to a large set of Parker-specific motifs, which can be varied and
combined in a number of ways. (The programmer is an accomplished jazz-saxophonist:
without strong musical skills, he would not be able to identify the relevant motifs, or judge
the aptness of specific processes for using them.) In exploring this conceptual space, the
program often originates interesting musical ideas, which jazz-professionals can exploit in
their own performance. However, in its present form it never moves outside Parker-space:
its creativity is merely exploratory, not transformational.
個々の音楽スタイルへの取り組みは、ジャズをリアルタイムで即興演奏する先駆的なプログラムでも行われてきましたが、この技術は他の種類の音楽にも応用可能です[lo]。現在最も高度に開発されたバージョンは、チャーリー・パーカー風のジャズを生成します。そして(表現力の欠如や合成音の質を無視すれば)、それは実際にパーカーのように聞こえます。ハーモニーやリズムといった音楽的側面、そしてジャズ特有の音楽的慣習に関する強力な(そして比較的一般的な)知識に加えて、このシステムはパーカー特有のモチーフを多数備えており、それらを様々な方法で変化させたり組み合わせたりすることができます。 (プログラマーは熟練したジャズサックス奏者です。
優れた音楽的スキルがなければ、関連するモチーフを特定したり、それらを使用するための特定のプロセスの適切性を判断したりすることはできないでしょう。)この概念空間を探求する中で、プログラムはしばしば興味深い音楽的アイデアを生み出し、ジャズのプロフェッショナルはそれを自身の演奏に活用することができます。しかし、現状では、パーカー空間の外に出ることはありません。
その創造性は単なる探求であり、変革的なものではありません。
Architectural design, too, has been formally modelled. For instance, a shape-grammar
describing Frank Lloyd Wright’s Prairie houses generates all the ones he designed, as well
as others he did not [14]. To the initiated eye, every one of these novel (exploratory-
creative) structures falls within the genre. The grammar not only identifies the crucial
dimensions of the relevant architectural space, but also shows which are relatively
fundamental. In a Prairie house, the addition of a balcony is stylistically superficial, for it is
a decision on which nothing else (except the appearance and ornamentation of the balcony)
depends. By contrast, the “addition” of a fireplace results in overall structural change,
because many design-decisions follow, and depend upon, the (early) decision about the
fireplace. Exploring this space by making different choices about fireplaces, then, can give
rise to surprises more fundamental than can adding balconies in unexpected places.
建築デザインもまた、形式的にモデル化されてきた。例えば、フランク・ロイド・ライトのプレーリーハウスを記述する形状文法は、彼が設計したすべての住宅だけでなく、彼が設計しなかった住宅も生成する[14]。専門家の目には、これらの斬新な(探究的・創造的な)構造のすべてがこのジャンルに属するように見える。この文法は、関連する建築空間の重要な次元を特定するだけでなく、どれが比較的基本的な次元であるかを示す。プレーリーハウスにおいて、バルコニーの増設は様式的に表面的なものである。なぜなら、バルコニーの外観と装飾を除いて、バルコニーの増設は他の何にも左右されない決定だからである。対照的に、暖炉の「増設」は全体的な構造的変化をもたらす。なぜなら、多くの設計上の決定は、暖炉に関する(初期の)決定に続き、それに依存するからである。暖炉についてさまざまな選択をすることでこの空間を探索すると、予期しない場所にバルコニーを追加するよりも根本的な驚きが生まれる可能性があります。
Perhaps the best-known example of AI-creativity is AARON, a program-or rather, a
series of programs-for exploring line-drawing in particular styles [171 and, more recently,
colouring also [5]. Written by Harold Cohen, an artist who was already an acclaimed
professional in the 1960s AARON explores a space defined with the help of rich domain-
expertise.
AI創造性の最もよく知られた例は、おそらくAARONでしょう。これは、特定のスタイルでの線画[171]、そして最近では色付け[5]を探求するためのプログラム、というよりはむしろ一連のプログラムです。1960年代にすでに高い評価を得ていたアーティスト、ハロルド・コーエンによって書かれたAARONは、豊富な専門知識を活用して定義された空間を探求します。
AARON is not focussed primarily on surfaces, but generates some representation of
a 3D-core, and then draws a line around it. Versions that can draw many idiosyncratic
portraits use 900 control points to specify the 3D-core, of which 300 specify the structure
of the face and head. The program’s drawings are aesthetically pleasing, and have been
exhibited in galleries worldwide. Until very recently, coloured images of AARON’s work
were hand-painted by Cohen. But in 1995, he exhibited a version of AARON that can
do this itself. It chooses colours by tonality (light/dark) rather than hue, although it can
decide to concentrate on a particular family of hues. It draws outlines using a paintbrush,
but colours the paper by applying five round “paint-blocks” of differing sizes. Some
characteristic features of the resulting painting style are due to the physical properties of
the dyes and painting-blocks rather than to the program guiding their use. Like drawing-
AARON, painting-AARON is still under continuous development.
AARONは主に表面に焦点を当てているのではなく、3Dコアの表現を生成し、その周りに線を描きます。多くの独特な肖像画を描けるバージョンでは、900個の制御点を用いて3Dコアを指定し、そのうち300個は顔と頭部の構造を指定します。このプログラムの描画は美しく、世界中のギャラリーで展示されています。ごく最近まで、AARONの作品のカラー画像はコーエン氏によって手描きされていました。しかし1995年、彼はこれを自動的に行うことができるAARONのバージョンを発表しました。このプログラムは色相ではなく、色調(明暗)によって色を選択しますが、特定の色相群に集中することもできます。輪郭線は絵筆で描きますが、紙に色を塗る際には、5つの異なるサイズの丸い「ペイントブロック」を塗ります。結果として得られる絵画スタイルの特徴のいくつかは、染料と版木の物理的特性によるものであり、それらを使用するためのプログラムによるものではありません。描画AARONと同様に、絵画AARONも現在も開発が進められています。
The drawings (and paintings) are individually unpredictable because of random choices,
but all the drawings produced by a given version of AARON will have the same style.
AARON cannot reflect on its own productions, nor adjust them so as to make them better.
It cannot even transform its conceptual space, leaving aside the question of whether this
results in something “better”. In this, it resembles most current AI-programs focussed on
creativity.
描画(および絵画)はランダムな選択のため、個々に予測不可能ですが、
特定のバージョンのAARONによって生成される描画はすべて同じスタイルになります。
AARONは自身の作品を振り返ることも、より良い作品にするために調整することもできません。
それが「より良い」作品を生み出すかどうかという疑問を脇に置いて、概念空間を変革することさえできません。
この点において、AARONは創造性に重点を置いた現在のほとんどのAIプログラムに似ています。
A further example of exploratory AI-creativity is the BACON suite designed to model
scientific discovery [15]. The heuristics used by the BACON system are carefully pre-
programmed, and the data are deliberately prestructured so as to suit the heuristics
provided. New types of discovery are impossible for BACON. It is therefore misleading
to name such programs after scientists remembered for noticing relations of a type never
noticed before. Even the notion that there may be (for instance) some linear mathematical
relation to be found was a huge creative leap.
探索的AI創造性のさらなる例として、科学的発見をモデル化するために設計されたBACONスイート[15]が挙げられます。BACONシステムが使用するヒューリスティックは綿密に事前プログラムされており、データは提供されたヒューリスティックに適合するように意図的に事前構造化されています。BACONでは新しいタイプの発見は不可能です。したがって、これまで気づかれなかったタイプの関係に気づいたことで知られる科学者にちなんで、このようなプログラムに名前を付けるのは誤解を招きます。例えば、何らかの線形数学的関係が見つかるかもしれないという考え自体が、大きな創造的飛躍でした。
Almost all of today’s “creative” computers are concerned only with exploring pre-
defined conceptual spaces. They may allow for highly constrained tweaking, but no
fundamental novelties or truly shocking surprises are possible. However, a few AI-systems
attempt not only to explore their conceptual space but also to transform it, sometimes in
relatively unconstrained ways.
今日の「創造的な」コンピュータのほとんどは、事前に定義された概念空間の探索のみに関心を持っています。高度に制約された微調整は可能かもしれませんが、根本的な斬新さや真に衝撃的な驚きをもたらすことは不可能です。しかしながら、少数のAIシステムは、概念空間の探索だけでなく、時には比較的制約のない方法でそれを変革しようと試みます。
Transformational systems include AM and EURISKO [161, and certain programs based
on genetic algorithms. Some of these have produced valued structures that the human
experts say they could never have produced unaided: the sculptor William Latham, for
example, has generated 3D-forms of a type which he could not have imagined for
himself [22].
変革システムには、AMやEURISKO [161]、そして遺伝的アルゴリズムに基づく特定のプログラムが含まれます。これらの中には、人間の専門家が助けなしでは決して生み出せなかったと断言するような価値ある構造物を生み出したものもあります。例えば、彫刻家のウィリアム・レイサムは、自分自身では想像もできなかったタイプの3D形状を生成しました [22]。
Most GA-programs only explore a pre-given space, seeking the “optimal” location
within it. But some also transform their generative mechanism in a more or less
fundamental way. For example, GA-work in graphics may enable superficial tweaking of
the conceptual space, resulting in images which, although novel, clearly belong to the same
family as those which went before [22]. Or it may allow the core of the image-generating
code to be lengthened and complexified, so that the novel images may bear no family-
resemblance even to their parents, still less to their more remote ancestors [21]. Similarly,
some work in evolutionary robotics has generated novel sensory-motor anatomies and
control systems as a result of GAS that allow the length of the “genome” to be altered [4].
ほとんどのGAプログラムは、あらかじめ与えられた空間を探索し、その中で「最適な」位置を探すだけです。しかし、中には生成メカニズムを多かれ少なかれ根本的に変えるものもあります。例えば、グラフィックスにおけるGAの作業は、概念空間の表面的な微調整を可能にし、その結果、斬新ではあるものの、明らかに以前の画像と同じファミリーに属する画像が生成されることがあります[22]。あるいは、画像生成コードの中核部分を長く複雑にすることで、斬新な画像が親画像、ましてや遠い祖先画像とさえファミリーとしての類似性を持たないようにすることもあります[21]。同様に、進化ロボティクスの研究では、GASの結果として「ゲノム」の長さを変更できる新しい感覚運動構造と制御システムが生成されています[4]。
One should not assume that transformation is always creative, or even-in the present
state of the art-that AI-systems that can transform their rules are superior to those which
cannot. Significantly, some AI-modellers deliberately avoid giving their programs the
capacity to change the heart of the code. That is, they prevent fundamental transformations
in the conceptual space, allowing only exploration and relatively superficial tweaking. One
reason for this is the human may be more interested, at least for a time, in exploring a
given space than in transforming it in unpredictable ways. A professional sculptor such as
Latham, for instance, may wish to explore the potential (and limits) of one particular family
of 3D-structures, before considering others [221. Another reason for avoiding rampant
transformation in AI-models of creativity is the difficulty of automating evaluation.
変革は常に創造的であると想定すべきではないし、あるいは現状の技術水準においてさえも、ルールを変革できるAIシステムがそうでないAIシステムよりも優れているとも考えるべきではない。重要な点として、一部のAIモデラーは、プログラムにコードの核心部分を変更する能力を意図的に与えないようにしている。つまり、概念空間における根本的な変革を防ぎ、探索と比較的表面的な調整のみを許可している。その理由の一つは、人間は、少なくともしばらくの間は、与えられた空間を予測不可能な方法で変革するよりも、その空間を探索することに興味を持つ場合があるからである。例えば、レイサムのようなプロの彫刻家は、他の3D構造を検討する前に、ある特定の3D構造ファミリーの可能性(と限界)を探求したいと考えるかもしれない[221]。創造性のAIモデルにおいて、過度な変革を避けるもう一つの理由は、評価の自動化が難しいことである。
A main reason why most current AI-models of creativity attempt only exploration, not
transformation, is that if the space is transformed then the resulting structures may not have
any interest or value. Such ideas are novel, certainly, but not creative. (We saw in Section 1
that “creativity” implies positive evaluation.)
現在の創造性に関するAIモデルのほとんどが、変革ではなく探索のみを試みている主な理由は、空間が変革された場合、結果として得られる構造が何の興味も価値も持たない可能性があるからです。そのようなアイデアは確かに斬新ですが、創造的ではありません。(第1章で、「創造性」は肯定的な評価を意味することを見ました。)
This would not matter if the AI-system were able to realize the poor quality of the
new constructions, and drop (or amend) the transformation accordingly. A truly automatic
AI-creator would have evaluative mechanisms sufficiently powerful to do this. At present,
this is very rarely so (an exception is artificial co-evolution in which the fitness function
evolves alongside the several species involved [19]). Notoriously, AM produced many
more useless items than powerful mathematical ideas, and although it did have heuristics
of “interestingness” built into it, its evaluations were often mistaken by human standards.
And some “adventurously” transformational programs embody no evaluative criteria at all,
the evaluation being done interactively by human beings [21].
AIシステムが新しい構築の質の悪さを認識し、それに応じて変革を削除(または修正)できれば、これは問題にならないでしょう。真に自動化されたAI作成者は、これを行うのに十分な強力な評価メカニズムを備えているはずです。現時点では、これは非常にまれです(例外は、適応度関数が関与する複数の種と共に進化する人工共進化です[19])。悪名高いことに、AMは強力な数学的アイデアよりも役に立たないアイテムをはるかに多く生成し、「興味深さ」のヒューリスティックスは組み込まれていましたが、その評価は人間の基準からするとしばしば誤っていました。
そして、一部の「冒険的な」変革プログラムには評価基準が全くなく、評価は人間によって対話的に行われています[21]。
There is no reason in principle why future AI-models should not embody evaluative
criteria powerful enough to allow them to transform their conceptual spaces in fruitfully
creative (including H-creative) ways. But for such computerized self-criticism to be
possible, the programmers must be able to express the values concerned sufficiently clearly
for them to be implemented. Even if the values are not predetermined, being represented
instead as an evolving fitness function, the relevant features must be implemented in and
recognized by the (GA) system.
将来のAIモデルが、概念空間を実りある創造的(H創造的を含む)方法で変革できるほど強力な評価基準を具体化すべきでない理由は原理的に存在しない。しかし、そのようなコンピュータ化された自己批判を可能にするには、プログラマーが関連する値を実装できる程度に明確に表現できなければならない。たとえ値が事前に決定されておらず、進化する適応度関数として表現されているとしても、関連する特徴は(GA)システムに実装され、認識されなければならない。
To some extent, this can be achieved implicitly, by defining a culturally accepted
conceptual space so successfully that any structure that can be generated by the program
will be accepted by humans as valuable [5,14]. But the structures generated within newly
transformed spaces will need types of evaluation different (at least in part) from those
implicit within the original space, or previously provided in explicit form.
これは、文化的に受け入れられている概念空間をうまく定義することで、ある程度は暗黙的に達成できる。つまり、プログラムによって生成できるあらゆる構造が人間に価値あるものとして受け入れられるようになる[5,14]。しかし、新たに変革された空間内で生成される構造は、元の空間内で暗黙的に含まれる評価、あるいは以前に明示的に提供されたものとは(少なくとも部分的に)異なる種類の評価を必要とする。
It is even more difficult to express (verbally or computationally) just what it is that we
like about a Bach fugue, or an impressionist painting, than it is to recognize something as
an acceptable member of one of those categories. And to say what it is that we like (or
even dislike) about a new, or previously unfamiliar, form of music or painting is even more
challenging.
バッハのフーガや印象派の絵画のどこが好きなのかを(言葉で、あるいは計算的に)表現するのは、何かをそれらのカテゴリーのいずれかに受け入れられるものとして認識するよりもさらに困難です。そして、新しい、あるいはこれまで馴染みのなかった音楽や絵画のどこが好きなのか(あるいは嫌いなのか)を述べるのは、さらに困難です。
Identifying the criteria we use in our evaluations is hard enough. Justifying, or even
(causally) explaining, our reliance on those criteria is more difficult still. For example,
just why we like or dislike something will often have a lot to do with motivational and
emotional factors-considerations about which current Al has almost nothing to say.
私たちが評価に用いる基準を特定することさえ難しい。それらの基準への依存を正当化し、あるいは(因果関係を)説明するのは、さらに困難だ。例えば、私たちが何かを好きになったり嫌いになったりする理由は、動機づけや感情的な要因と大きく関係していることが多い。しかし、現状のAIは、これらの要因についてほとんど何も語っていない。
To make matters worse, human values-and therefore the novelties which we are
prepared to approve as “creative”+hange from culture to culture, and from time to time.
In some cases, they do so in unpredictable and irrational ways: think of the fashion-
industry, for example, or of rogue memes like the back-to-front baseball-cap. Nor are
value-shifts confined to trivial cases such as these: even Bach, Mozart, and Donne were
ignored and/or criticized in certain periods.
さらに悪いことに、人間の価値観、そしてそれゆえに私たちが「創造的」だと認めるであろう新奇なものは、文化によって、そして時代によって変化する。
場合によっては、予測不可能で非合理的な形で変化する。例えば、ファッション業界や、野球帽を後ろ向きにかぶるミーム(奇抜なミーム)を考えてみよう。価値観の変化は、こうした些細なケースに限った話ではない。バッハ、モーツァルト、ドンでさえ、ある時期には無視され、批判された。
The scientific criteria of theoretical elegance and coherence, and of experimental
verification, are less variable than artistic values. But that’s not to say they are easy to define, or to implement. (An attempt to do so, for certain sorts of mathematical symmetry,
has been made by the BACON team.)
理論的な優雅さと一貫性、そして実験的検証といった科学的基準は、芸術的価値ほど変動性はありません。しかし、だからといって、それらを定義したり実装したりすることが容易というわけではありません。(ある種の数学的対称性については、BACONチームがそれを試みてきました。)
Moreover, science too has its equivalent of fad and fashion. Even the discovery of
dinosaurs was not a cut-and-dried event, but the culmination of a process of scientific-
and political-nationalistic-negotiation lasting for several years [20]. The important point
is that what scientists count as “creative”, and what they call a “discovery”, depends largely
on unarticulated values, including social considerations of various kinds. These social
evaluations are often invisible to scientists. For sure, they are not represented in AI-models.
さらに、科学にも流行や流行に相当するものがある。恐竜の発見でさえ、単純な出来事ではなく、数年にわたる科学的・政治的・ナショナリズム的な交渉のプロセスの集大成であった[20]。重要な点は、科学者が「創造的」とみなすもの、そして「発見」と呼ぶものは、様々な社会的配慮を含む、明確に表現されていない価値観に大きく依存しているということである。こうした社会的評価は、科学者にはしばしば見えない。もちろん、AIモデルには反映されていない。
Some H-creative ideas have already been generated by AI-programs, though usually by
merely exploratory (or combinational) procedures. Transformational AI-originality is only
just beginning.
いくつかのH-創造的アイデアは既にAIプログラムによって生成されていますが、通常は単なる探索的(あるいは組み合わせ的)な手順によるものです。変革をもたらすAIの独創性は、まだ始まったばかりです。
The two major bottlenecks are:
2つの主なボトルネックは次のとおりです。
These two bottlenecks interact, since subtle valuation requires considerable domain
expertise. Valuation, thus far, is mostly implicit in the generative procedures used by
the program, or interactively imposed by a human being. Only a few AI-models can
critically judge their own original ideas, And hardly any can combine evaluation with
transformation.
これら2つのボトルネックは相互に関連しています。なぜなら、微妙な評価には相当な専門知識が必要だからです。これまでのところ、評価は主にプログラムが用いる生成手順に暗黙的に組み込まれているか、人間によって対話的に課されています。独自のアイデアを批判的に評価できるAIモデルはごくわずかで、評価と変革を組み合わせられるAIモデルはほとんどありません。
The ultimate vindication of AI-creativity would be a program that generated novel ideas
which initially perplexed or even repelled us, but which was able to persuade us that they
were indeed valuable. We are a very long way from that.
AIの創造性を究極的に証明するのは、最初は私たちを困惑させたり、反発させたりした斬新なアイデアを生み出し、それが本当に価値があると納得させてくれるようなプログラムです。しかし、私たちはまだそこまでには程遠いのです。