ロボットはいかにして読み書きを学び、考えるようになるのか

ロボットが文章を読み解くとはどういうことなのか、さらに言えば、どうすればロボットにそれができるのか...。

私たちはいつも、コンピューターが私たちのことを理解していると話しています。Googleは私たちが何を検索しているかを「知っている」、Cortanaは私たちが何を言っているかを「知っている」と言いますが、「理解する」というのは非常に難しい概念です。特にコンピューターに関しては。

自然言語処理（NLP）と呼ばれる計算言語学の一分野では、この特に厄介な問題に取り組んでいる。さて、この分野は魅力的で、その仕組みがわかると、いたるところでその影響が見られるようになります。

簡単な説明：Siriに何かを要求するときなど、コンピュータが音声に反応する例を紹介します。音声をコンピュータが理解できる形式に変換することを音声認識といいます。nlpはこれとは関係ありません（少なくともここで議論している分量においては）。この2つのプロセスは多くのアプリケーションで必要なものですが、全く異なる問題なのです。

定義的理解

コンピュータが自然言語を処理する仕組みに入る前に、いくつかのことを定義しておく必要がある。

まず、自然言語を定義する必要がある。これは簡単なことで、人々が常用するあらゆる言語がこのカテゴリーに入る。構築言語（クリンゴン語、エスペラント語）やコンピュータ・プログラミング言語は含まれません。友達と話すときは、自然な言葉を使っていますよね。また、デジタルパーソナルアシスタントとの会話に使うこともあるかもしれません。

理解するとはどういうことか？まあ、複雑なんですけどね。文章を理解するということはどういうことなのか？おそらく、意図した内容の情報が脳に入るようになったということだと思うのですが、いかがでしょうか。ある概念を理解することは、その概念を他の概念に応用できることを意味するかもしれません。

哲学者たちは、何世紀にもわたってこのような問題について議論してきた。

ここでは、自然言語から正確に意味を抽出する能力を「理解力」と呼ぶことにする。コンピュータが理解するためには、入力された音声ストリームを正確に処理し、そのストリームを意味のある単位に変換し、入力に対して何か役に立つ応答をできるようにする必要があるのです。

明らかに漠然としていますね。しかし、（神経哲学の学位がない）私たちの限られたスペースでは、これが精一杯です。もしコンピュータが自然言語の入力に対して人間のような、あるいは少なくとも有用な応答を返すことができれば、それは理解したと言える。これは今後、私たちが使う定義です。

複雑な問題

コンピュータは自然言語の処理に苦労しています。あなたは "Siri, show me to Punch Pizza "と言うかもしれないし、私は "Siri, show me the directions to Punch Pizza "と言うかもしれませんね。

文中では、Siriが「give me directi***」というキーワードを選択し、「Punch Pizza」という検索ワードに関連したコマンドを実行する可能性があります。しかし、私の文では、Siriは「ルート」というキーワードを選択し、私が行きたいのは「パンチピザ」であり、「お願いします」ではないことを知る必要があります。".これはあくまで簡単な例です。

メールを読んで詐欺かどうかを判断する人工知能のようなものを考えてみてください。また、ソーシャルメディアの投稿を監視して、特定の企業への関心を測ることもできます。以前、コンピュータに（いろいろと変な癖のある）カルテを読ませて、そこから情報を集めるというプロジェクトを手がけたことがあります。

つまり、略語や変な文法、たまにあるスペルミスなど、さまざまなメモの矛盾に対応できるシステムでなければならない。これは、機械はおろか、経験者でも難しい非常に複雑な作業です。

率先垂範

このプロジェクトで私は、特定の単語や単語間の関係を認識するようコンピューターに教えるチームの一員でした。そのためにはまず、それぞれのノートにどんな情報が含まれているかをコンピューターに見せる必要があるため、ノートに注釈をつけました。

エンティティやリレーションシップの種類は非常に多い。例えば、「グリーンさんの頭痛はイブプロフェンで治療された」という文章を考えてみましょう。グリーンさんは人、頭痛は徴候または症状、イブプロフェンは薬物としてラベル付けされています。グリーンさんはその後、頭痛のことで親戚に連絡した。最後に、イブプロフェンは頭痛と密接な関係があります。

私たちは、この方法で何千ものノートをマークしてきました。診断、治療、症状、根本的な原因、併存疾患、投与量など、薬に関連して思いつくものをすべてコード化しました。他のアノテーションチームは、文法など他の情報をコード化した。最終的には、AIが "読む "ことのできる医療記録だらけのコーパスを手に入れました

読書は、理解することと同じくらい定義が難しい。コンピューターは、頭痛に効くイブプロフェンを簡単に見ることができますが、この情報を学習するとき、（私たちにとって）意味のない1と0に変換してしまいます。確かに人間らしく、役に立つと思える情報を返すことができますが、これは理解と言えるのでしょうか？これも非常に哲学的な問いかけです。

真の学習

このとき、コンピューターはノートを閲覧し、いくつかの機械学習アルゴリズムを適用した。プログラマーは、語彙的特性をマークし、依存関係や構成要素を分析し、意味的役割をマークするためのさまざまなルーチンを開発する。本来、AIはノートを「読む」ことを学習しているのです。

最終的には、カルテを渡して、それぞれの実体と関係に注釈をつけるよう依頼することで、テストができるようになるでしょう。人間が書いたメモをコンピュータが正確に再現すれば、そのメモの読み方を学習したと言えるでしょう。

あとは、どの病気にどの薬が使われているか、どの治療法が最も効果的か、特定の症状の根本的な原因など、たくさんの統計を集めるだけです。このプロセスの最後には、実際のカルテから得たエビデンスに基づいて、AIが医学的な質問に答えることができるようになるのです。教科書や製薬会社、勘に頼らなくてもいいのです。

ディープラーニング

別の例を見てみましょう。グーグルのニューラルネットワーク「DeepMind」が、ニュース記事の読み方を学習している。前述のバイオメディカルAIと同様に、より大きなテキストの断片から関連性のある有用な情報を抽出することができると研究者は期待している。

医療情報をAIに学習させるだけでも大変なのに、一般的なニュース記事を読めるAIを作るには、どれだけのアノテーションデータが必要なのか想像がつきますよね。** 十分なアノテーターと十分な情報の閲覧には、非常に高い費用と時間がかかるでしょう。

そこでDeepMindチームは、別の情報源であるニュースサイトに目を向けました。

なぜこれらのサイトなのか？なぜなら、記事そのものから単に文章を抜き出すのではなく、記事の要点を要約して提供しているからです。つまり、AIには学ぶべきことがあるのです。研究者たちは、基本的にAIに "ここに記事があります、その中で最も重要な情報はこれです "と伝えています。そして、ハイライトされていない記事から同じような情報を抽出するようAIに依頼しました。

このレベルの複雑さは、特に複雑な機械学習システムであるディープニューラルネットワークで処理することができます。(DeepMindチームはこのプロジェクトで驚くべきことをやってのけたのです。具体的な内容については、MITテクノロジーレビューに掲載された素晴らしい概要をご覧ください)。

読む人工知能は何ができるのか？

コンピュータがどのように読み取ることを学習するのか、一般的に理解することができるようになりました。たくさんのテキストが必要で、何が重要かをコンピューターに伝え、いくつかの機械学習アルゴリズムを適用します。しかし、テキストから情報を抽出する人工知能で何ができるのでしょうか。

私たちはすでに、医療記録から特定の実用的な情報を抽出したり、一般的なニュース記事を要約したりできることを知っています。テーマやイメージを抽出して詩を分析するP.A.N.というオープンソースのプログラムがあります。研究者はしばしば機械学習を用いて大量のソーシャルメディアデータを分析し、企業がユーザーの気分を理解し、人々が何を話しているかを知り、有用なマーケティングパターンを見出すために利用しています。

研究者は、機械学習を用いて、電子メールの行動と電子メールの過負荷の影響について洞察を深めています。メールプロバイダーは、受信トレイからスパムをフィルタリングしたり、一部のメールを優先的に分類するために使用できます。効果的な***チャットボットを作るには、人工知能を読み解くことが不可欠です。テキストがあるところには、自然言語処理を研究する研究者がいる。

この機械学習のアプローチが向上すれば、可能性は広がる一方です。チェスや囲碁、ビデオゲームなどは、今やコンピュータの方が人間より優れている。やがて読解力や学習能力も向上していきます。強力な人工知能への第一歩となるか？様子を見なければならないが、そうなる可能性もある。

テキストを読んで学習する人工知能には、どのような使い道があるのでしょうか。近い将来、どのような機械学習が見られると思いますか？以下のコメントであなたの考えを共有してください。

写真提供：Vasilyev Alexandr/Shutterstock

2021-03-16 12:24 に公開
閲覧 ( 20 )
分類：IT