複数ロボット自然会話システム(3)

LINEで送る
Pocket

複数ロボット自然会話システム(3)

複数ロボット自然会話システム(1)
複数ロボット自然会話システム(2)
複数ロボット自然会話システム(3)
複数ロボット自然会話システム(4)

複数ロボット自然会話システム

インターネットで繋がった複数の自然会話ロボットがロボット同士でお互いに自然会話を行うシステムです。
各ロボットは、音声認識、自然会話、音声合成の機能を有し、3種の会話モードで会話しまします。

3つのモード:

  • 対談モード(2人で会話する)
  • 鼎談(ていだん)モード(3人で会話する)
  • 会談モード(4人以上の複数のロボットがお互いに会話する)

 システムは、システムを管理するサーバーと複数のロボットから構成される。
サーバーのMySQLデータベースサーバーに会話内容とログ情報を保存する。
会話内容は、ある特定の話題について会話を行うことができ、その話題の「キーワード」でインターネットから情報検索してその内容を会話の材料にして、会話内容を膨らませていきます。

    1. システム構成図:
      1. サーバーには、ホームページ、WebサービスAPI、MySQLデータベースを設置。サーバーでの開発言語は、PHPを利用。
      2.  ロボットAには、サーバープログラムとクライアントプログラムを設置。サーバープログラムは、サーバーのWebサービスAPIと連携してシステム全体を管理する。クライアントプログラムは、ロボット同士の会話処理を行う。
      3.  ロボットA以外のロボットには、クライアントプログラムのみを設置。
      4.  サーバーと各ロボットは、インターネットで繋ぐ。
      5.  ロボットは、複数台繋ぐことができる。
      6.  ロボットは、インターネット上の各種(AI)クラウドWebサービスなどを利用する。
      7.  各ロボットは、WebサービスAPIで、サーバーと交信する。
      8.  サーバーは、NTTのレンタルサーバー、ロボットのハードウェアは、RaspberryPiのマイクロコンピュータ。ロボットのプログラミング言語は、python。

  1. サーバー・ソフトウェア構成
    1. ホームページ、サーバーは、OCNホスティングのBizメール&ウェブビジネスを利用。
    2.  WebサービスAPI(複数ロボット管理プログラム、ログ情報管理プログラム)
    3.  開発プログラミング言語は、PHPバージョン5.6
    4.  MySQLデータベースのバージョン5.1.73(会話情報、ログ情報、制御情報など)

 

  1. クライアント・ソフトウェア構成 
    1. OSは、RaspberryPiに特化したLinuxのRaspbian
    2. ロボットには、音声入力、音声認識、自然会話、音声合成処理のソフトウェアパッケージを利用。
      1) 音声入力:SOX(Sound eXchange)ライブラリ
      2) 音声認識:Google Speech API
      3) 自然会話:docomo雑談会話API 4) 音声合成:Open JTalk
    3. ロボットのプログラム
      1) 会話処理プログラム
      2) サーボ制御プログラム(ロボットの頭、手の動きを実現)
      3) LED制御プログラム(ロボットの目の点滅など)
      4) WebサービスAPIプログラム(サーバーとの交信含む)
      5) ログ情報収集プログラム

 

 

LINEで送る
Pocket

複数ロボット自然会話システム(2)

LINEで送る
Pocket

複数ロボット自然会話システム(2)

複数ロボット自然会話システム(1)
複数ロボット自然会話システム(2)
複数ロボット自然会話システム(3)
複数ロボット自然会話システム(4)

複数ロボット自然会話システム

ソフトウェア要件定義:

  1. ホームページの仕様:
    ホームページにアクセスして、参加ロボットのID、名前、会話モード、独り言モード、鼎談モードのロボット指定などのパラメータをFormで設定し、サーバーに設定する。設定データは、MySQLデータベースに保存する。

    以下の機能もホームページで行う。

    1. 新規ロボットの追加
    2. ロボットの削除
    3.  登録情報の表示
  2. サーバーのWebサービスAPI仕様
    1. 複数ロボット自然会話システムの中枢でシステム全体をクライアント側のサーバープログラムと連携して管理する。
    2.  プログラミング言語はPHP。
    3.  セッションを立ち上げ、session変数で管理する。
    4.  会話情報やログ情報は、サーバーのMySQLデータベースで管理する。
  3. クライアント側のサーバープログラムの仕様
    1. サーバーから参加ロボット情報、会話モード、独り言モードなどのパラメータ情報をMySQLデータベースからダウンロードして、設定する。
    2. 会話モードに従って、パターンを設定して、サーバーのsession変数にアップロードする。
    3.  対談モード:

      1) 順序(重複あり)nΠr=nのr乗でパターンリスト生成。 n=3、r=2の場合、3Π2=3の2乗=9通りのパターン
      AA  BA  CA  
      AB  BB  CB  
      AC  BC  CC
      となる。
      独り言パターンは、AA、BB、CCの3通りとなる。

      2) 独り言モードに対応して、重複パターンの有無を設定する。

      3) 各パターンのアップロード・パターンに最初の挨拶文を時刻に応じて、「こんにちは」、「こんばんは」を設定してサーバーにアップロードする。

      4) AA-u/d、AB-u/dの形式でパターンを設定。
      AAは、独り言モードで、u/dは、アップロード済/ダウンロード済を表す。 AB-u/dは、AロボットからBロボットへの会話文が格納され、u/dは、アップロード済/ダウンロード済を表す。

    4. 鼎談(ていだん)モード:

      1) 組合せ、nCrで、rは3とし、鼎談パターンを生成。

      2) nが4の場合は、4!/3!×(4-3)!=4通りのパターンを生成。

      3) nが4の場合は、ABC、ACD、BCD、BADの4パターンとなる。
      ABC-A-u/d  ACD-A-u/d  BCD-B-u/d  BAD-B-u/d
      ABC-B-u/d  ACD-C-u/d  BCD-C-u/d  BAD-A-u/d
      ABC-C-u/d  ACD-D-u/d  BCD-D-u/d  BAD-D-u/d

      4) 各パターン毎に各ロボットの会話文格納場所を確保して、u/dの状態で、アップロード済、ダウンロード済を表す。

      5) 各パターンからランダムに1つのロボットを抽出して、残りのロボットへ最初の挨拶文を時刻に応じて、「こんにちは」、「こんばんは」を設定してサーバーにアップロードする。

    5. 会談モード:

      1) 組合せ、nCrで、n、rは4以上の人数とし、会談パターンを生成。

      2) 仕組みは鼎談モードと同一。

  4. クライアントプログラム仕様
    1. クライアントプログラムは、1つのロボットのプログラムで、各ロボットの数だけ存在する。
    2. 各ロボットは、IDと名前を持ち、サーバーを通して他のロボットと会話する。
    3. 電源投入すると、サーバーから参加ロボット情報、会話モードなどのパラメータ情報をダウンロードして、初期化を行いスタンバイ状態になったら、スタンバイ状態をサーバーに送信する。
    4. ロボットとサーバー間の通信は、WebサービスAPIで行う。
    5. サーバーの会話開始合図で、他のロボットと会話を始める。
    6. サーバーの会話終了の合図で会話を中止する。
    7. 各ロボットは、投げ掛けられた会話に対して、応答を順次行う。
    8. 応答文は、AIクラウドの自然会話サービスを利用したり、ローカルで機械学習で生成したもの、形態素解析で抽出した品詞で新たに会話文を生成、マルコフ連鎖で生成した応答文などを使用する。
    9.  ロボットは、ある特定の話題について会話を行うことができる。その話題のキーワードでインターネットから検索した情報をもとに応答文を生成して会話相手のロボットに応答文を返すこともできる。

 

LINEで送る
Pocket