アドバイザーSの数理統計学ブログリスト

 弊社のアドバイザーS氏から、得意の数理統計学にビジネスをからめたユニークな話題をお届けします。

円周率π (パイ) のはなし

 ゆとり教育時代、小学校でπ(パイ)3として計算するよう指導されていると聞いて唖然とした記憶がある。

実際には2002年度の小学校学習指導要領の改訂にともなって簡略計算ではπ3として求めさせただけであり、円周率は3.14であると教えていたとのことだ。

 πは物理定数にも頻繁に登場する。

 例えば真空の透磁率μは4πx10-7 H/mと定義されており、電磁波の速度を求めるのに必要な定数だ。

 また標準正規分布(いわゆるガウス分布)の式は以下であり、品質管理、推計、検定の基礎となっている。

 

 

あるいは多くの研究者が美しい数式と呼ぶオイラーの等式は以下で表される。

続きを読む

イチローの打率成績の周期性もわかる自己相関関数マジック

 自己相関関数はある時系列データとそのデータ自身にタイムラグ(遅れ)を設けたデータとの相関を見るもので、データに含まれる周期性を検出すのに有効です。

 自己相関関数は次式で表されます。

自己相関関数の式

 Excelで演算する場合はラグ(遅れ時間)をずらしながら、元データとの相関係数を演算し、横軸をラグ(遅れ時間)、縦軸を相関係数としてグラフ化します。

 一例として、日本が誇る大リーグプレーヤーであるイチローの打率成績を分析してみました。

 

続きを読む

似た者同士を集めるクラスター分析


 私たちは日常膨大な情報に接し、その中で何となく似た者同士をグループにする傾向があります。

 その方が頭脳にとって負担が軽くなり、何かの選別や決定をするのが楽になるからです。

 学問的には、生物学、考古学、博物学などで進化の過程を調べる場合に、類似度を定量的に分析することが行われてきました。

統計学の発達とパソコンが身近になって、この類似度を調べるためにクラスター分析が用いられます。

 

クラスターとは「花やブドウの房」のことで、産業クラスタークラスター分析という言葉で耳にすることがあります。 または細かく破裂して殺傷能力を高めたクラスター爆弾が思い浮かびます。

 

 計算方法としては、できるだけ多くの数値パラメータを用いて、各データ間の類似度としてユークリッド距離マハラノビス距離を計算してグループに分けます。

 また計算値そのままではわからないので、近い者同士をまとめるのにデンドログラム(樹形図)が結果の表現に用いられます。

続きを読む

Yes or No の集合からなにが読めるか? ~ロジスティック回帰分析の得意技~

 サムソンの最新スマホ「ギャラクシーノート7」の発火問題が大きく取り上げられています。

 

 当初はグループ会社のリチウムイオン電池の問題とされてきましたが、電池を交換しても発火は発生しており、セット側にも原因がある疑いが浮上し、結局サムソンはこの戦略商品の生産、販売を打ち切りました。

 充電容量が大きいリチウムイオン電池は内部のセパレータの不具合や金属粉の混入、あるいは回路の短絡で発熱、発火を引き起こしますが、原因を特定できない事例も多いようです。2006年にはソニーのパソコン用電池が発火事故を発生しましたが、真の原因を特定できないままソニーが回収をしました。

 

 スマホで世界占有率トップメーカの最新製品の打ち切りは各方面に影響を及ぼしていますが、唯一の救いは部品メーカに対して完成済だけでなく、仕掛り部品の費用も保証するとの発表です。

 

 2007年に登場したスマホは2016年の世界市場が15億台と急成長し、3億台を切るパソコンを大きく引き離し、情報通信の主役となっています。参入メーカも多く、中国では400社以上のスマホメーカが商品を生産しています。高度の技術製品を中小メーカが短期間で商品化できているのはターンキービジネスに拠るところが大きいのですが、ターンキーについては後日述べることにします。

 ところで、日本におけるスマホの2016年6月における普及率を世代別にまとめたデータが博報堂DYメディアパートナーズのメディア環境研究所より発表されています(「(株)博報堂DYメディアパートナーズ 「メディア定点調査・2016時系列分析 ~メディア環境の10年変化~」http://www.media-kankyo.jp/wordpress/wp-content/uploads/HDYmpnews20160620.pdf)。これを表形式にまとめてみました。

世代別スマホ保有率のグラフ

 

 想像通り、若者の保有率が高く、60歳以上ではまだガラケーを使っている人が多いのがよくわかるデータです。これは退職すると、家の外で頻繁にネットを見る必要性が低く、また使用料の負担が理由と思われます。

そのガラケーも11月2日にドコモは年内に出荷を終了すると発表し、いよいよスマホだけの世界に入ります。

続きを読む

バイオリズムのしくみ

 古代から人間のもつ何がしらの周期性は運勢などとして根付いてきました。中国で普及した易学は、自然界の物はすべて陰と陽で出来ており、この陰陽の組み合わせで過去、現在、未来を読み取れるとされてきました。

 日本では人生の節目を厄年として忌み慎む習わしがあり、数えで男性は25歳、42歳、61歳、女性は19歳、33歳、37歳が厄年に当たり、中でも男性の42歳と女性の33歳は大厄として体調的にも精神的にも危ない年とされ、厄払いのために祈祷を受けるなどの習慣があります。

 西洋においても、占星術は無数の星の一つ一つが個々の人間の運命と関連しているとされ普及しました。現代科学でも太陽の黒点活動が気象だけでなく経済活動にも影響を与えると言われます。

 男性の厄年の一つである数え61歳は満60歳であり、還暦としてお祝いをします。還暦は干支(えと)に基づいており、10種類の干と、12種類の支の組み合わせは60種類あり、10干12支の組み合わせが一巡する60歳が還暦の意味です。西洋においても60歳のお祝いとしてダイヤモンドを贈る習慣が一部にあるようです。

W フリース写真
 W フリース

 ところで、20世紀のはじめにドイツの耳鼻咽喉科・外科の医師W・フリース(写真)が、患者の容態変化から23日の身体周期と28日の感情周期を見出しました。1920年には、オーストリアのA・テルチャー工学教授が学生の成績変化に33日周期の相関があることを発見し、これにより生誕日を基点として異なる3つの周期(身体周期感情周期知性周期)からなるバイオリズムが提唱されました。

 各リズムは、生まれた日を基準とする同じ振幅の正弦波として表されます。

続きを読む

オリンピックのメダル数とGDPは累乗近似する

 リオのオリンピックが終わりました。

 始まるまではブラジルの政治混乱、治安の悪さ、会場やインフラ整備の遅れ、ドーピング問題、そしてジカ熱やテロの不安が言われましたが、テレビ中継で見る限りは、日本人選手の大活躍もあって、スポーツの祭典を楽しめました。

 オリンピックと言えばやはりメダルの争いが気になりますが、参加した205の国と地域の中で1個以上のメダルを獲得したのは87か国でした。ロシアの参加種目が限定された中で、あらゆる種目で活躍し、合計121個のメダルを獲得した米国が目立ちました。

 

 そこでメダルの獲得数はどの統計指標と相関があるか調べました。インド(2個)、インドネシア(3個)のように、人口や一人当たりGDPなどは相関が低く、調べた中で一番相関が強いのは名目GDPと分かりました。

 GDPはその国の経済規模を示し、経済規模の大きさがメダル獲得数に密接につながっているようです。IMFの2015年集計データ(米ドル換算)と2個以上のメダルを獲得した67国のメダル数を両対数グラフにしたのが下図です。

続きを読む

血液型をχ自乗検定する !?

 新都知事に小池百合子氏が選出された。

 前出しじゃんけんと後出しじゃんけんのどちらが有利かの議論はあったが、血液型で見ると

 A型の増田寛也氏・小池百合子氏とAB型の鳥越俊太郎氏の戦いであった。

 実は血液型のわかっている都知事としては、美濃部亮吉、鈴木俊一 、青島幸男 AB、石原慎太郎AB、猪瀬直樹AB、舛添要一 の中で、久しぶりのA型都知事となった。

 ところで、血液型と性格は関係がないというのが科学界の定説で、両者の関連性を根拠とする「血液型性格分類」は疑似科学とも呼ばれているようです。しかし多くの日本人は血液型と性格は関係が有りそうと思っているのではないでしょうか。 例えば・・ 

 A型は几帳面、きれい好き、安全運転、未練がましい、心配性。

 B型は楽天的、マイペース、自由奔放、変わり身が早い、遊び好き、恋多き人、浪費家。

 AB型は理想追求型・おおらか・社交的・負けず嫌い・繊細で複雑・趣味が広い。

 O型は現実的、逆境に強い、野心家、面倒見が良い、保守的で頑固、親方気質 などです。

続きを読む

Brexitにみるオッズと世論調査の信頼性

 欧州だけでなく、世界の経済、政治にまで影響を与える、英国のEU残留か離脱を選択する国民投票は6月23日7時~22時(日本時間の23日15時~24日6時)に実施されました。

 世論調査の状況はネットやTVニュースで頻繁に取り上げられていましたが、残留と離脱が投票前まで常に拮抗していました。筆者はブックメーカーのオッズを投票2週間前から見ていましたが、こちらは常に残留が優勢となっていました。

 

 次図は投票開始後の6月23日20時55分の時点でのオッズを画面キャプチャーしたものですが、残留が1/8、離脱が7/1となっています。

英国国民投票に関するオッズの画面
続きを読む

「何れ菖蒲か杜若」に決着を付けるマハラノビス距離

杜若(カキツバタ)の花
 クリック/タップで拡大表示されます。

 5月に上賀茂神社に近い大田神社に群生する美しい杜若(カキツバタ)を見てきました。(左写真)

  ところが、アヤメやショウブとの区別が園芸などの趣味のない筆者にはわかりません。

 

 ネットで見るとアヤメとショウブはどちらも漢字で書くと「菖蒲」、しかし漢字は同じでも菖蒲(アヤメ)と菖蒲(ショウブ)は別物。また菖蒲(ショウブ)と花菖蒲(ハナショウブ)も別物とのことで、ますますわかりません。 分類では、アヤメ(菖蒲)、ハナショウブ(花菖蒲)、カキツバタ(杜若)はすべてアヤメ科に属するとのことです。

 区別は咲く場所が乾燥地か、湿地か、または細かく観察して、葉に白い筋があればハナショウブ、筋が無くて葉が幅広であればカキツバタ、細長い葉であればアヤメらしいのですが、わかりにくいですよね!

 類似のデータの群分けには判別分析が一般に用いられます。例えば「フィッシャーのあやめ」という有名なデータで紹介される文献をよく見ます。

 この分析ではあやめの中でもIris setosaversicolorvirginica という3種類のあやめ各50個について、ガクの長さ、ガクの幅、花弁の長さ、花弁の幅から群の分類を試みています。

 この判別分析の計算は複雑で、またサンプル数がそれぞれの群で多くを必要とします。

続きを読む

馬に蹴られて待ち行列理論

 昔の数学理論が現在のビジネスに生きている例として、待ち行列理論があげられます。

 比較的ヒマなショップに今から1時間以内にお客が来る確率や、初めて走る地方の道路で、急にトイレに行きたくなった時に1km以内にパーキングが有る確率など、発生する確率が低く、かつそれが偶然に発生する事象は待ち行列理論として研究されています。

シメオン・ドニ・ポアソンの写真

「比較的ヒマなショップ」とか「初めて走る道路」と言っても、過去の実績から1時間の平均来客数や高速道路のパーキングやサービスエリアの平均的な間隔はわかっているとします。

このような「ある期間に平均してm回起こる現象が、ある期間にちょうどx回起きる確率」は、ポアソン分布として計算が可能であり、最新のビジネスにも生かされています。

 ちなみにポアソン分布は数学者であるシメオン・ドニ・ポアソン(左の写真)が1838年に発表したものですから、180年前の理論です。

 

 ある事象が起こる平均値をm、この事象がx回発生する確率をp(x)とすると、p(x)はポアソン分布として次式で求められます。ここでは自然対数の底、x!はxの階乗(1からxまでの範囲にある全ての整数の積)を表します。

続きを読む
知財よろず相談 ご案内ページへ
助っ人知財部 ご案内ページへ
パテントわっとへ

知財アシスト

CHIZAI ASSIST Inc. All Rights Reserved