TEA LEARNING SYSTEM

株式会社ティー・パートナーズ 代表取締役 野間口 徹

TEA LEARNING SYSTEM とは情報工学的なアプローチに機械工学的な知見を加えて考案されたシステムです。TEA LEARNINGの「TEA」は、"Tensor"(テンソル)、"Essential"(必要不可欠な)、"Architecture"(アーキテクチャ)の頭文字を取って命名されています。

機械系で用いられる逆問題解析とは「結果として観測される量からその原因を推定する問題を解析するもの」ですが、このような命題は一般化可能であり、機械系に止まらずに様々なものに応用することができます。

この命題を会社組織における情報システムSに適用する場合、観測量 y とは業務より発生する様々なデータであり、そのようなデータからモデルを構築し会社における課題xを可視化していくことであると考えることが可能となります。また、その課題xを解決するために業務自体を刷新していかなければならない場合、モデルS自体も更新されていくものであると考えることができます。この場合、更新されるモデルの目的関数は短期利益や長期利益や顧客満足度や従業員の働きやすさや収入などのメトリクス bi に重みづけ wi をし総合的に考えた利得 Benefit であると考えられます。

y → S(t) →x (maximize Benefit)
Benefit = Σ wi bi

Benefitを構成する各メトリクスはベクトルのように多元的であり、相互に依存するものかもしれません。が、線形分離可能な命題であれば、各部門内で閉じた問題と全社的な問題に分割ができ、また各要因が互いに素な命題として再定義することも可能です。還元主義的なアプローチにせよ、フラクタル的なアプローチにせよ、命題の再定義はエントロピーを縮小する処理であると考えられます。

AIのようなシステムが長期的な経営やブランディングの最適化のようなものを人が判断するよりも的確にするのかという点に関しては明確な答えはないと考えられますが、少なくとも経営者や従業員がより的確な判断をするための材料をシステム側が抽出することにより判断材料が増えることはいえます。また、経営判断により事業活動を刷新していくことはシステムの刷新が必要であることを意味しています。
そのような人がシステムの意思決定の中心となるシステムにおいて、逆解析的なアプローチで業務用システムSを考えた場合に必要な要件を述べましょう。

まず、日々の業務をこなすデータyというものがあります。それはExcelかもしれないし、SQLのデータベースかもしれないし、紙のテンプレートかもしれないし、メールかもしれませんが、いずれにせよ何かしらの業務に特化した観測可能なデータyというものが存在します。そのデータからモデルMというものを構築した場合、そのモデルMはそのデータを処理可能なシステムの部分集合といえます。よくあるシステム形態では、スキーマのような形態のモデルMがあり、本番データΣy(t)を組み合わせることでシステムS(t)が構成されます。多くの業務には様々な例外系があり、そのモデルで具体的に記述されないデータというのは将来的にモデル化するべきものであるかもしれません。すなわち、モデルMもマイグレーションなどにより刷新されるものである前提のものであるといえます。

システムを構成するのに最もシンプルなアプローチはその観測データ y からモデル M を生成し、そのモデルMからプログラムSとデータベースΣy(t)を生成することです。業務が定型化されていれば、観測データの確率密度分布は容易に計算可能であり、確率モデルは容易に得ることができます。

データy -(モデルM→プログラムS)→ 出力 x
モデル自動生成:  観測量y →確率密度分布→ モデルM

典型的な確率密度分布の分類としては次のようなものが挙げられます。

  • 均等離散型
  • 離散型
  • 連続量・統計量型
  • 例外型

しかしながら、現在の業務の定型化自体が適切でない場合、分析に必要な情報は整っていないかもしれません。例えば、顧客リストであれば、多くのお金を落とす特別な顧客や、お金を落とさないクレーマーや万引き犯に関する詳細な分析が必要になるかもしれません。そのような分析の結果として会社組織そのものの目指す方向性が変わり業務の定義が変わることもあります。業務によって予め起きそうな問題を想定してそういったデータを処理することを考える場合、ヒューリスティックなモデル自動生成が必要となります。

ヒューリスティックモデル自動生成: 想定データ→確率密度分布→モデル

ヒューリスティックなシナリオというのは一般に十分性に欠く。そこでヒューリスティックなモデル自動生成により生成されたモデルから、さらにテストシナリオを自動生成することにより、より複雑な実際的な例外をテストすることで網羅度をあげる必要があります。

テストデータ自動生成: モデル→確率密度分布→データ

また、このような要求分析を実装の手戻りなく効率的にやるにはプログラムの自動生成をすることが望ましいでしょう。

プログラム 自動生成: モデル → プログラム

こういった様々な想定を取り込んだ要求分析をしても実際の人間や環境が細かく関係してくるシステムというのはわからないことが多いものです。そういった動的な解析が必要なケースにおいてシステムでの解析が必要となる場合、統計処理やベイジアンやニューラルネットワークのような機械学習が有効です。

学習済モデル自動生成: 各種学習データ→学習済モデル

時系列のデータを機械学習する場合に様々な条件で分類したヒストグラムのような整形データがあると簡単に解析することができます。ヒストグラムの分類、分割ブロック、予測モデルなどを想定することで、より適切なストラテジーを組むことができます。

ヒストグラムの分類:

  • ほぼ一定
  • 線形成長
  • 多項式的成長
  • 指数関数的成長
  • ...

ヒストグラムの分割ブロック

  • 日別
  • 月別
  • 年別
  • タイプ別
  • ...

予測モデルの分類:

  • パーセプトロン
  • ベイジアン
  • ...

また、AIにより全てを自動化するわけではない場合、システムの改善のためのカスタマイズやシステム利用者の統計的なものの考え方といった教育面でのサポートがあることが望ましいと考えられます。

このような分析から

  • モデル自動生成機能
  • ヒューリスティックモデル自動生成機能
  • テストデータ自動生成機能
  • プログラム 自動生成機能
  • 学習済モデル自動生成機能
  • ヒストグラム等の統計自動生成機能
  • 利用者の学習機能

といった機能が機械工学的な業務システムに必要であると考えられます。
TEA LEARNING SYSTEMは情報システムにそのような機械工学的な設計思想の知見を加えるべく設計されたシステムです。