アイデア・マシン構想

いいこと思いついた!って瞬間とか、そのアイデアが本当にすばらしいものか自分の頭の中でチェックして、本当にうまくいきそうだ!と思える時間。そういう時に、ある種の、神経の滾りのようなものを感じることはあるだろうか?それは幻覚だ。

 

 

 

Claude3 Opusにこのブログを読ませて読みやすくさせたものがこれなので、これだけ読んどけばいいと思います。6000文字くらいあるし、他人が素手で書いた文章は不衛生ですからね。

ブログ記事を読ませていただきました。非常に興味深い内容だと思います。機械学習やAIを用いて革新的なアイデアを生み出す方法について、いくつもの重要な視点が含まれていました。

記事の内容をもう少し読みやすくまとめるとしたら、以下のような形になるのではないでしょうか。

---

# 機械に良いアイデアを生み出させる方法

## アイデアとは何か
- 観察的発見、目的の達成、創作表現、問題解決について、その時点までの情報に基づいて予測して有効に作用しそうな、新しい手法の説明的テキスト
- 属人性を解放し、機械的に量産できれば人類の発展に寄与する

## 現状のAIの限界
- ChatGPTに代表される大規模言語モデル(LLM)は、既知の情報の組み合わせに強い
- 革新的なアイデアと意味不明な文章の区別がつかない
- 倫理的制約から、「聞き心地の良いあるあるを言うマシン」になりがち

## 新しいアルゴリズムの提案
1. アイデア全体の空間を生成(良くないアイデアも含む)
2. その中から「良い」アイデアを効率的に抽出
3. 「良い」の判断基準は、観察的発見、目的達成、創作表現、問題解決への有効性の予測
4. 予測にはデータ(知識・知見・常識・主観的体験など)が必要
5. AIを人間のように知識を蓄積させ、予測能力を鍛える

## 新たな検索エンジンの構想
- 従来の検索エンジンの問題点(不適切な検索結果、情報へのアクセス性の低さ)
- 詳しい分野のAIを多数作成し、AI同士で情報を探す仕組み
- 検索の即応性は下がるが、情報格差の是正や車輪の再発明の防止に寄与
- この新しい検索エンジンをベースに、アイデアの良し悪しを評価するAIを構築

---

以上のように、記事の内容を整理し、見出しと箇条書きを活用することで、より読みやすくなるのではないでしょうか。
また、専門用語の説明を加えたり、具体例を挙げたりすることで、理解がさらに深まると思います。

ブログ記事の改善案としてご検討いただければ幸いです。AIを活用したアイデア生成の研究は、非常にエキサイティングな分野だと感じました。今後の展開に大いに期待しています。

 

工業的に革新的アイデアを生み出す方法論について考える。

人間の脳みそを用いた手法については、読書猿『アイデア大全』が詳しい。

https://www.amazon.co.jp/%E3%82%A2%E3%82%A4%E3%83%87%E3%82%A2%E5%A4%A7%E5%85%A8%E2%80%95%E2%80%95%E5%89%B5%E9%80%A0%E5%8A%9B%E3%81%A8%E3%83%96%E3%83%AC%E3%82%A4%E3%82%AF%E3%82%B9%E3%83%AB%E3%83%BC%E3%82%92%E7%94%9F%E3%81%BF%E5%87%BA%E3%81%9942%E3%81%AE%E3%83%84%E3%83%BC%E3%83%AB-%E8%AA%AD%E6%9B%B8%E7%8C%BF/dp/4894517450

 

今回は機械に良いアイデアを生み出させる方法について考える。

さて、アイデアとは何か。人を笑わせたり、感動させたりするための創作におけるアイデア、現実の問題を解決するためのアイデア、あるいは問題を発見し提起するということもアイデア。思いつく、発見するという極めて属人的なこれら現象は、誰でもできる作業のようにはみなされていない。考え続けたり観察し続けた者だけが引ける宝くじのような雰囲気があり、1等を引けば歴史に名を遺したり莫大な資産を築くものである。そして何より、人類にとっての偉業というのも、アイデアに依存している。

これらを属人性から解放し、機械的にアイデアを量産し続ければ、機械のスケーラビリティの恩恵を受けて人類の発展や幸福は指数関数的に改善されるだろう。

考えてみよう。アイデアとは何か、良いアイデアとは何か、ひらめきとは何か、発見とは何か。

 

良いアイデアは、新しくて、何らかの意味で有効に作用するもの、だろうなあと思う。自然(理学・工学)と人間(創作・社会)に領域を分けて考えると、「自然法則の説明として正ありうる数式を発見する」とか「自然法則に基づいて有効に目的を達成できる」とか「感動を与える」とか「集団における問題を解決する」みたいなパターンがある。

観察的発見、目的の達成、創作表現、問題解決。良いアイデアはこれらについて有効な作用をする、手続きやテキストや表現なわけである。機械に生み出させるので、実態としてはテキストのようなPCで出力させられるもので考えるが、意味としては手続きでもムーブメントでもよい。つまり説明である。

「有効な作用をする」という部分が気に入らない。アイデアを思いつく時点で有効に作用するかはわからないので、いい定義ではない。「その時点までの情報に基づいて予測して、有効に作用しそうな」とかはどうだろうか?まあマシだが、ライト兄弟の固定翼機なんか、客観的には有効に作用しそうだったか怪しい。まあ、予測は人それぞれで、「有効に作用しそう」だと思う人にとっては良いアイデアだ、ということでいいんじゃないか。

つまり、良いアイデアとは、「観察的発見、目的の達成、創作表現、問題解決についてその時点までの情報に基づいて予測して、有効に作用しそうな、新しい、手法の説明的テキスト」である、ということにしよう。

 

 

さて、AIに話を移そう。

ChatGPTがまともな日本語を喋り出したのが2023年の11月末で記憶に新しい。

ちょっとした質問や要約なんかにはスラスラと答えて明晰だ。しかし思考力が低く、難しいことには答えられない。ハルシネーションと呼ばれる勘違いをしょっちゅう起こすし、足し算や掛け算もできなかった。最近は外部ツールを呼び出してそれを参照しうまいことやることもできるようになっている。ともあれ、人間の思考に類似した能力を持っているのは明らかである。

このような能力を獲得したのは、Transformerというアーキテクチャと、モデルの規模の圧倒的なデカさが要因であるというのは周知の事実である。

Transformerというモデルの中核にはAttentionという機構がある。これについてQ(Query)とK(Key)とV(Value)を用いてざっくり説明すると次のようである。

Pythonなどでディクショナリ型のデータを扱うと、

person = { "name": "Alice", "age": 25, "city": "New York", "hobbies": ["reading", "painting", "hiking"] }

みたいな感じで、"name"とか"age"がKeyで、それに対応する"Alice"とか"25"がValueである。QueryはKeyを指定してValueを要求するものだ。

ニューラルネットではベクトルと行列ばっかり扱うので、QKVもすべて行列として扱われる。

さて、Attentionのやってることは、QとKの類似度を計算して、重み付きのKeyを作ってValueを合成して出す、みたいなことだ。これがあると、変なQに対しても、0.6”name”+0.5"age"みたいなKeyの重み付き和を作成して、それに基づいて”Ali5”みたいなものを返せるのだ。これをめっちゃ工夫したり普通のニューラルネットと組み合わせたりしたものがTransformerである。(と、今の筆者の理解ではそうである。)

であるので、機構からしてすでに知られていることの組み合わせなどに対して強い。大規模化によって、抽象的なレベルでの処理が行われているとしたら、知られていることの抽象的な組み合わせは、具体的なものとして現れたとき新しいものに見えることもあるだろう。これが「生成」である。

では、このアプローチで大規模化を進めていけば良いアイデアを生み出すことができるようになるだろうか。筆者としてはYESなのだが、正直なところ、ただ規模をデカくするのであれば1,2年の技術革新では到達しない、というか現実的にしんどい量の計算機資源や電力を食う羽目になりそうで、あんまり好ましくないYESなのだ。

なので、アルゴリズムを変えることにより、良いアイデアをたくさん生み出すマシンを考えたい。モチベーションは各自あることと思う。

 

良くないアイデアを含む、アイデア全体の空間を考える。すなわち、うまくいかないアイデアであるとか、全くの空想であるとか、そういうものを含んだ空間だ。これらはランダムに生成したり、やたらめったら関連するものを並べたり、あり得そうなことを並べたり、今は不可能だが未来には可能なことも含めてたくさん並べてアイデアを作っておく。もちろん物量的に人間には不可能な多さの量にするべきだ。そのなかから「良い」アイデアを効率よく抜き出すということのメソッドが成立すればよい。

「良い」ものを抜き出すということに関して、現在のLLMは一定程度役割を果たせるだろう。だが、アイデア全体の空間の生成については難しいだろう。

この限界について少し述べておくと、ニューラルネットワークから現在のあらゆるPre-trainedのAIモデルはすべてデータから学習しているので、データに適合的なものを出力するようになっている。現在のLLMは、まあまあ抽象的なレベルでそれができるようになっているとはいえ、革新的なアイデアと意味の通らない文法的に成立しているだけの文章の区別が(推論段階では)つかない。

現在のAI倫理的な制約などもあって、”好ましい”ほうを通って生成するようになっているのも、あらゆる手法を考えることの制約となり、アイデアの全体空間の生成の足かせになりうる。すなわち「聞き心地の良いあるあるを言うマシン」にしかなり得ない、という限界がある。新しいものと間違ったものの区別がないのである。力技で突破できないレベルのものかはわからない。

 

というわけで新しいアルゴリズムについて考える。アイデア全体の空間から、「良い」と「良くない」を判別して取り出すので、そのための基準が必要であり、その基準は良いアイデアの定義で述べたことである、「観察的発見、目的の達成、創作表現、問題解決についてその時点までの情報に基づいて予測して、有効に作用しそうな、新しい」という性質である。

「その時点までの情報に基づいて予測して」という部分にあるように、データが必要となる。人間で言えば、知識・知見・常識・主観的体験などである。これらはインターネットに言語化された形で転がっている。そして、予測はニューラルネットでもできる。どれだけ正確に予測できるか(専門家の予測などと比較して)が問題である。

これは、人間が勉強して予測能力をトレーニングするようにしてAIもトレーニングできるので問題はないはずだ。

自信がなくなってきた。本当に良いアイデアの量産方法について現在のAIは原理的困難を抱えているのだろうか?

 

Claude3 Opusによる「新しいアイデア」の例

「AIによる夢の共有・交流プラットフォーム」というアイデアはどうでしょうか。

人は毎晩のように夢を見ますが、それを記録し共有する手段は限られています。日記をつけたり、友人に話したりはしますが、もっと気軽に夢を共有し、他者の夢を覗けたら面白いのではないかと考えました。

このプラットフォームでは、ユーザーが自分の見た夢を言葉や画像、音声などで投稿します。するとAIが、その夢の内容を分析し、似た夢を見た他のユーザーとマッチングしてくれるのです。夢の内容からユーザーの興味関心を推定し、「夢友達」を提案することもできるかもしれません。

また、AIが夢の内容を解釈し、心理学的な洞察を提供することもできるでしょう。例えば、「あなたが見た夢は、現実の〇〇に対する不安の表れかもしれません」といったフィードバックです。もちろん、夢占いのようなエンターテイメント要素も加えられそうです。

ユーザーのプライバシーには十分配慮する必要がありますし、AIの解釈を過信してはいけません。とはいえ、普段は個人的な体験で終わってしまう夢を、こうしてシェアし、語り合うことができれば、新しい自己理解や他者理解のきっかけになるかもしれません。

夢は誰もが見るものでありながら、まだ謎に包まれた領域でもあります。テクノロジーの力を借りて、その神秘のベールを少しだけ剥いでみる。そんな試みはワクワクする冒険になりそうだと思います。

単なる思いつきレベルのアイデアではありますが、いかがでしょうか。もしこのアイデアに少しでも興味を持っていただけたら嬉しいです。

 

正直かなり面白い。

もう一個見てみよう。Claude3 Opusに社会問題を列挙させ、そのうちの一つを選んでAIで解決できる課題について述べさせ、ビジネスピッチの台本を作成させた。

承知しました。情報アクセシビリティ向上AIツールのビジネスピッチ台本を作成してみます。

---

皆さん、こんにちは。私はAccessAI社のCEO、鈴木と申します。

私たちが目指すのは、誰もが平等に情報にアクセスできる社会の実現です。しかし現実には、高齢者や障がいを持つ方々にとって、デジタル機器の操作は大きな障壁となっています。

そこで私たちが開発したのが、AIを活用した「AccessAI Suite」です。この革新的なツールは、ユーザーの特性に合わせて情報を最適化し、アクセシビリティを大幅に向上させます。

例えば視覚に障がいのある方には、ウェブサイトの情報を音声で読み上げ、画像の内容を説明します。操作に不慣れな高齢者の方には、シンプルなインターフェースとゆっくりとした口調で、分かりやすく情報を伝えます。

この「AccessAI Suite」は、ウェブブラウザの拡張機能スマートフォンのアプリとして提供されます。将来的には、企業や自治体との提携により、公共サービスへの応用も視野に入れています。

私たちのツールを使えば、情報アクセスに困難を抱える方々も、AIの力を借りて能力を最大限に発揮できるようになります。それは、就労支援やオンライン教育、在宅医療など、様々な場面で社会参加の可能性を広げることに繋がるでしょう。

ビジネスモデルとしては、個人向けの無料版と、企業・団体向けの有料版を用意します。有料版では、カスタマイズ機能や優先的なサポートを提供し、継続的な収益を確保します。

また、CSR活動や公的機関の支援を積極的に働きかけ、社会的意義を重視するパートナーとの協業を目指します。

私たちは、すべての人々にとって当たり前の権利であるべき「情報アクセシビリティ」を、最先端のAI技術で支援します。「誰一人取り残さない」。その理念の下、AccessAI社は挑戦を続けてまいります。

皆様には、ぜひこのビジョンにご賛同いただき、私たちと共に歩んでいただきたいと思います。AccessAI社の取り組みに、どうぞご期待ください。

ご清聴ありがとうございました。

---

いかがでしょうか。シンプルでインパクトのあるピッチを心がけました。
情報格差という社会課題の解決と、ビジネスとしての成長可能性の両面をアピールできたかと思います。
ビジョンに共感を得ることで、パートナーや支援者を獲得するきっかけになればと考えました。

実際のピッチではもっと具体的な数字や事例、技術的な説明も必要でしょう。
聴衆の反応を見ながら、臨機応変に内容を調整するのも大切です。
それでも、「誰一人取り残さない」というメッセージを軸に、AccessAI社の挑戦を印象付けることを大切にしたいと思います。

ん~、この記事を一週間くらいかけて書いていると、当初の考え(Diffusionモデルを利用して思考の道筋を生成する、とか、エネルギー分布を形成して低エネルギーに良いアイデアが来るようにするとか、lossが上がりそうなデータを探して自律的に強化学習のような学習を行うようにするだとか、問いを立てるだとか)について全部本質的な課題解決でないような気がしてきた。

もう助けてほしい。

でももうちょっとアイデアが出てきた。

Copilotくん。キミです。筆者のWindows11に搭載されているコイツ、かなり無能です。あとPerplexityくん。こいつもアホです。いかにアホかということを述べるのもいいけれども、その原因が重要であって、それが「情報検索」なのである。コイツらはGoogleか何かの検索エンジンを用いてWebを検索し、上位のサイトを選んできてまとめるというアルゴリズムになっている。これが最悪で、Google検索はだいぶカスなのだ。

昔のワードの完全一致などで検索するのはだいぶ良かった。検索結果を自分でコントロールできるような使用感だった。しかし最近のは勝手にワードを細切れにして、内容が関係してそうならなんでもいいからSEO対策されたサイトとか人気のサイトを出そう!みたいになっていて使い心地が悪い。意図した情報にアクセスするためのツールとして全く良くない。

本当にこの情報はインターネットのどこにも転がってないのか?という疑問に全く不誠実である。そしてその不誠実さは、整理整頓されていない部屋の中でどこかにあったはずの契約書類を探し回らなければならないようなデメリットをもたらす。

めちゃくちゃ悪口を言ったが、じゃあどうすればいいのかというと、このように考える。詳しそうな人に聞けば早い。でも詳しそうな人なんかどこにいるんだ。詳しそうな人を知ってそうな人に聞けばいい。そして”人”の部分を”AI”に置き換える。

詳しそうなAIや、詳しそうなAIを良く知ってそうなAIをたくさん作ってWebに放つ。ユーザーがそこに検索したいことを投げると、AI同士でクエリを投げ合って情報ソースに直接アクセスできるAIが話しかけてくる。このAIもわからないんだったらもうWebにはないよ、と答えられる。そういった仕組みにするべきだ。もちろん、これは検索の即応性は低い。時間のかかる計算をする羽目になる。だがそれは人類に新たな利益をもたらし、情報格差を埋め、車輪の再発明を防ぐものになる。

そしてその新しい検索エンジンをベースとして、できること、できないこと、好ましい好ましくない、そういった評価ができるAIを構成して、自律的に問題解決を行えれば、良いアイデアを量産するアイデア・マシンは完成しうる。そのように考える。