AIに使われる統計学でも大事な一次情報

 

 現代のAIやデータサイエンスは、「確率」と「統計」を中心に成り立っています。

  世の中のあらゆる現象をデータで表す研究や学問を行うのが「統計学」ですが、この統計学は、いまやAIの機械学習などの計算や分析に大きく関係しているのです。
 AIは、社会の過去のデータを数字や固有名詞など「変数」として採取し、それをサンプルとして解析した上で、物事の相関関係や因果関係をパラメーターとして推定するーなどという作業をコンピュータ(正しくはCPUやGPUなどの半導体が)行っています。

 その基本の考え方となっている「統計学」と「確率」が、現代のデータサイエンスにおいては、便利かつ一般的なツールとなっているわけです。
 この統計学の分野でも「一次情報」大事です。ちなみに、「一次情報」とは、「いままさに現場で起きている当事者による正しい情報」のことです。

 ところで、今年10月1日付の日本経済新聞では、「物価高 追いつけぬ統計 2020年基準はもはや古く」という記事を一面トップで掲載されていました。

 この記事の概要は、最近の物価高を数字で表すために、日本では代表的な「消費者物価指数」を使うが、それは直近の数字で言うと、統計学上の消費者物価指数は、2023年4~6月期で、「3・3%」だそうです。

 ところが日銀の消費者へのアンケートなどによる「体感インフレ率」は、同時期の6月で「14・7%」です。消費者物価指数の差は何と「11・3%」もの差があるわけです。
 
 これは、結論から言えば、体感インフレ率の「14・7%」が近い数字でしょう。
 この大きな誤差の原因は一体何なのでしょうか?日本経済新聞は、「重み付けがない」と分析していますが、それより重要なのは、「一次情報」が加えられていないことです。

 統計で使用するデータの「重み付け」には、リアルタイムで起きている現場の「一次情報」を加えるべきであり、

 特にインフレ時の物価の移り変わりなどは その日の値段が翌日もそうであるとは限らず、刻々と動くものであるため、

 リアルタイムの「一次情報」にアップデートしなければ使い物にならないでしょう。

 データの集め方自体も、「いままさにそこで起きている一次情報」を私たち自身が取得しなければ、

 せっかくの統計学も、決して「最強の学問」ではなく、本当に幸福に繋がる良い結果を生むことがなくなる「弱い学問」になりかねないのです。

 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です