SlideShare uma empresa Scribd logo
1 de 16
Baixar para ler offline
2013/03/10




WEB解析と意思決定
―統計的有意差の観点から―




株式会社アパマンショップネットワーク
             太田 博三
第7回 データマイニング+WEB 勉強会@東京


Agenda
1. 自己紹介

2.WEB解析への問題意識

3.WEB解析と統計的有意差の適用
  -Teassly社のStatistical Calculatorを用いて

4.参考・引用文献一覧

5.さいごに


                                         2
1.自己紹介 Hiromitsu OTA (1/3)
1.長年、文理融合を目指して、環境問題(廃棄物問題)を研究
 ・ 廃棄物の最終処分場の跡地利用に関する研究
 ・ 産業廃棄物の不法投棄の実証分析
 ・ 用いた手法:多変量解析(OD表を用いた重回帰分析)、
             ゲーム理論(Game theory)、
             契約理論(Contract theory)、
 ・場所: マレーシア: Kuala Lumper(KL)、Penang州、
      タイ: Bangkok, Cooperated with Asian Institute of
          Technology(AIT)
 ・ 用いたデータ:OD表(Origin-Destination Table)、
              フィールド調査データ(面接調査、紙面調査)

                                                        3
1.自己紹介 Hiromitsu OTA (2/3)
2.統計解析は文理の融合の共通の学問/分野として格別
  しかし、日本には統計学部がない。
3.2008年大学院後期博士課程を修了し、コンサルタントへ
  ・Business Intelligence(BI)の導入支援、
  ・Data Miningによるモデル構築
4.現在、専修大学大学院 商学研究科 大学院研究生として在
   籍
    ・江原先生、生田目先生に従事、
    ・OR学会のデータ解析コンペティションに参加




                                     4
1.自己紹介 Hiromitsu OTA (3/3)
5.現在、株式会社アパマンショップネットワ-ク システム部
   WEBチームにて、ログ解析等に従事。




                                  5
2.WEB解析への問題意識(1/2)
・問題意識: 学問領域ではWEB解析はどこに属するのか?

1.統計解析 ⇒統計学(R.A フィッシャーからT. ベイズへ)
  →実務では医薬品開発、品質管理で。

2.データマイニング ⇒情報工学(機械学習など電通大など)、
            一部、統計解析(統数研)
  →実務では、通信販売業、金融業で。

3.テキストマイニング ⇒多変量解析(林知己夫先生、
             大隅先生の取り組み)
  →実務では、コールセンターやWiki・ブログの解析(集合知)で。
                                   6
2.WEB解析への問題意識(2/2)
1.の統計解析も、2.のデータマイニングも、3. のテキストマイニングも、
   確たる「学問的背景」を持ち合わせている。

・「学問的背景とは、理論がありそれなりに堅確である」 と言える。

では、アクセスログ解析は?
   ⇒マーケティング・サイエンス?   ←データマイニング
     計量経済学(時系列分析)?   ←統計解析

・解(私の考え):間接的に関係があり、複合的な学問領域にまたが
         る分野と捉える事ができそうだ・・・。
         その正体を確かめたい。

→統計的有意差の事例(「Webアナリスト養成講座」 アビナッシュ・
 コーシック著、衣袋宏美監訳、内藤貴志訳,翔泳社, 2007,PP420-
 422)の事例を検討してみる。
                                        7
WEB解析と統計的有意差の適用事例の検討(1/6)
・検討事例1: メールによるキャンペーンの責任者とする。
       最新のキャンペーンの潜在顧客に2種類のメールを
       送った。結果は以下の2種類になった。
  提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87%
  提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06%

ここで、提案2より、提案1の方がよいと言えるだろうか?
統計的有意差からシミュレーションしてみよう。

  ※1 統計的有意差: 医薬品など生物統計学の分野では、統計的有意性は認可される際の
     重要な指標となっている。
  ※2 有意差とは統計データに基づいて観測された“差異”が誤差の範囲を超えている場合の
     差の事である。1%とか5%といった小さな値の有意水準を定めて、観測結果が「差がな
     い」という帰無仮説の棄却領域に入るときに「有意差がある」と表現する。
     しかし、有意差が認められたとしても、差の具体的な解釈は別個の問題であり、統計以
     外の知識を用いて解決すべきものである。
     *引用先:PP235-236,「現代統計学小辞典」鈴木義一郎著,講談社,1998
                                             8
WEB解析と統計的有意差の適用事例の検討(2/6)
提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87%
提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06%

・両提案のコンバージョン率の差異は0.19ポイント(=1.06-0.87)であ
    る。
・0.19ポイントの差が出ていることから、提案2は提案1に比べて、
サイト訪問者数も100多く、購入者数も9多い。

・では、統計的有意差の観点から、次のようにシミュレーションし検
  証してみる。
※ Teassly社のStatistical Calculatorを用いる。翻訳本と同じ条件である。


・提案2: サイト訪問者が5,100,購入者が64,としてシミュレートしてみ
      ると・・・、
※ Teassly社のStatistical Calculator URL: http://www.teasley.net/free_stuff.htm   9
WEB解析と統計的有意差の適用事例の検討(3/6)
  提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87%
  提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06%
・画面: Teassly社のStatistical Calculator(Excelで単に入力するだけで有意差が求められる)




               提案1                提案2




                                           有意差は80%
                                                            10
WEB解析と統計的有意差の適用事例の検討(4/6)
提案1: サイト訪問者が5,300,購入者
   が46,コンバージョン率は0.87%
提案2 : サイト訪問者が5,200,購入者
   が55,コンバージョン率が1.06%



ここで、提案2のみ、サイト訪問者数を100減らして5100に、購入者数を9人分多くして
   64にしてみると・・・


提案1: サイト訪問者が5,300,購入者
   が46,コンバージョン率は0.87%
提案2 : サイト訪問者が5,100,購入者
   が64,コンバージョン率が1.25%


ここから、有意差は0.995(5%の信頼区間にある)と言える。
つまり、0.87 < 1.06 < 1.25 の不等式が成立する。
                                              11
提案1と提案2ののコンバージョン率は誤差の範囲にあると言える。
WEB解析と統計的有意差の適用事例の検討(5/6)
・結論:提案2の数値を変えてシミュレーションしてみた結果 、有意差は
  0.995%で95%の信頼区間内にある。つまり、統計的には提案1も提案
  2も、誤差の範囲でしかない。どちらも優劣付けがたいと言える。

  ・ここで、再度、有意差の定義を確認してみると、
  有意差とは、統計データに基づいて観測された“差異”が誤差の範囲
    を超えている場合の差の事である。(中略)…しかし、有意差
    が認められたとしても差の具体的な解釈は別個の問題であり、
    統計以外の知識を用いて解決すべきものである。




 ・では、どう考えたらよいのか?
                                           12
※引用先:PP235-236,「現代統計学小辞典」鈴木義一郎著,講談社,1998
WEB解析と統計的有意差の適用事例の検討(6/6)
<結論>
・統計的有意差は一つの目安であり、どちらがより良いか否かは断
  言はできない。しかしシミュレーションできるのは悪くない。

・また別の要因とは、例えば、サイト訪問者数(サンプルサイズ)や、
  その分布(アクセスログのデータはロングテールになりやすいこ
  となど)も考慮して総合的に判断する必要があると言える。

・有意差はPDCAを実践する際の一つの意思決定の基準や目安とし
  て、注意して用いる事が必要と思われる。

⇒今後は、統計的有意差以外も、意思決定の一つの目安となるか
  検証してゆきたい。
                              13
参考・引用文献一覧
1.   「Webアナリスト養成講座」アビナッシュ・コーシック著、衣袋宏美監訳、
     内藤貴志訳,翔泳社, 2007,PP420-422
2.   Teassly社のStatistical Calculator http://www.teasley.net/free_stuff.htm

3 . 「現代統計学小辞典」 鈴木義一郎著,講談社,1998, PP235-236

4. 「WEB解析士 検定テキスト」 弊社編纂,6章, JWDA出版,2010年11月(予定)

5 . 「WEB解析士 問題集」 弊社編纂,6章, JWDA出版,2010年11月(予定)

6.「生物学を学ぶ人のための統計のはなし―きみにも出せる有意差」 粕谷
   英一著,文一総合出版,1998


                                                                         14
さいごに
•   ご拝聴ありがとうございます。

•   今後もWEB解析を軸に研究を行ってゆきたいと考えておりま
    す。

•   弊社のポリシーは、データ解析を行い、PDCAサイクルによる
    改善を行うことです。

•   アクセスログ解析のソフトウェア(Sibulla)等にご興味があり
    ましたら、気軽にお声掛けください。
    ⇒ http://www.kan-net.com/
                                       15
MEMO




       16

Mais conteúdo relacionado

Destaque

日経BP:アクセス解析勉強会
日経BP:アクセス解析勉強会日経BP:アクセス解析勉強会
日経BP:アクセス解析勉強会Makoto Shimizu
 
20130928 ゼロディレ運用編スライド
20130928 ゼロディレ運用編スライド20130928 ゼロディレ運用編スライド
20130928 ゼロディレ運用編スライドKenta Nakamura
 
VMware ESXi トラブルシューティング
VMware ESXi トラブルシューティングVMware ESXi トラブルシューティング
VMware ESXi トラブルシューティングKazuhito Ohkawa
 
統計と会計 - Zansa#19
統計と会計 - Zansa#19統計と会計 - Zansa#19
統計と会計 - Zansa#19horihorio
 
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」Nanae Hibino
 
アクセス解析システムの裏側 (公開用)
アクセス解析システムの裏側 (公開用)アクセス解析システムの裏側 (公開用)
アクセス解析システムの裏側 (公開用)shunsuke Mikami
 
Nutanixを導入してみて思ったこと(仮)
Nutanixを導入してみて思ったこと(仮)Nutanixを導入してみて思ったこと(仮)
Nutanixを導入してみて思ったこと(仮)Kazuhito Ohkawa
 
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日月間10,000PVのブログになるまでに学んだSEO 2014年12月7日
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日Nanae Hibino
 
脱・初心者!Googleアナリティクス活用テクニック
脱・初心者!Googleアナリティクス活用テクニック脱・初心者!Googleアナリティクス活用テクニック
脱・初心者!Googleアナリティクス活用テクニックNanae Hibino
 
DeNAの報告書を可視化して雰囲気をつかむ
DeNAの報告書を可視化して雰囲気をつかむDeNAの報告書を可視化して雰囲気をつかむ
DeNAの報告書を可視化して雰囲気をつかむYusuke Fukasawa
 
Social media strategy essentials
Social media strategy essentialsSocial media strategy essentials
Social media strategy essentialsRather Inventive
 
Mba724 s3 w2 central tendency & dispersion (chung)
Mba724 s3 w2   central tendency & dispersion (chung)Mba724 s3 w2   central tendency & dispersion (chung)
Mba724 s3 w2 central tendency & dispersion (chung)Rachel Chung
 
Government - recommendations from AIGLIA2014
Government - recommendations from AIGLIA2014Government - recommendations from AIGLIA2014
Government - recommendations from AIGLIA2014futureagricultures
 
Lorenita
LorenitaLorenita
Lorenitalora18
 
Mal ppt 2013
Mal ppt 2013Mal ppt 2013
Mal ppt 2013shineasso
 

Destaque (20)

日経BP:アクセス解析勉強会
日経BP:アクセス解析勉強会日経BP:アクセス解析勉強会
日経BP:アクセス解析勉強会
 
20130928 ゼロディレ運用編スライド
20130928 ゼロディレ運用編スライド20130928 ゼロディレ運用編スライド
20130928 ゼロディレ運用編スライド
 
VMware ESXi トラブルシューティング
VMware ESXi トラブルシューティングVMware ESXi トラブルシューティング
VMware ESXi トラブルシューティング
 
統計と会計 - Zansa#19
統計と会計 - Zansa#19統計と会計 - Zansa#19
統計と会計 - Zansa#19
 
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」
CSS Nite in KOBE, Vol.6 「月間10,000PVのブログになるまでに学んだSEO」
 
アクセス解析システムの裏側 (公開用)
アクセス解析システムの裏側 (公開用)アクセス解析システムの裏側 (公開用)
アクセス解析システムの裏側 (公開用)
 
Nutanixを導入してみて思ったこと(仮)
Nutanixを導入してみて思ったこと(仮)Nutanixを導入してみて思ったこと(仮)
Nutanixを導入してみて思ったこと(仮)
 
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日月間10,000PVのブログになるまでに学んだSEO 2014年12月7日
月間10,000PVのブログになるまでに学んだSEO 2014年12月7日
 
UX流Web解析
UX流Web解析UX流Web解析
UX流Web解析
 
脱・初心者!Googleアナリティクス活用テクニック
脱・初心者!Googleアナリティクス活用テクニック脱・初心者!Googleアナリティクス活用テクニック
脱・初心者!Googleアナリティクス活用テクニック
 
DeNAの報告書を可視化して雰囲気をつかむ
DeNAの報告書を可視化して雰囲気をつかむDeNAの報告書を可視化して雰囲気をつかむ
DeNAの報告書を可視化して雰囲気をつかむ
 
Social media strategy essentials
Social media strategy essentialsSocial media strategy essentials
Social media strategy essentials
 
Filmografia
FilmografiaFilmografia
Filmografia
 
Purely practical data structures
Purely practical data structuresPurely practical data structures
Purely practical data structures
 
Mba724 s3 w2 central tendency & dispersion (chung)
Mba724 s3 w2   central tendency & dispersion (chung)Mba724 s3 w2   central tendency & dispersion (chung)
Mba724 s3 w2 central tendency & dispersion (chung)
 
Government - recommendations from AIGLIA2014
Government - recommendations from AIGLIA2014Government - recommendations from AIGLIA2014
Government - recommendations from AIGLIA2014
 
25martiou2013
25martiou201325martiou2013
25martiou2013
 
Lorenita
LorenitaLorenita
Lorenita
 
Ace2011 1
Ace2011 1Ace2011 1
Ace2011 1
 
Mal ppt 2013
Mal ppt 2013Mal ppt 2013
Mal ppt 2013
 

Semelhante a Web解析と意思決定20130311 太田

Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方Hikaru GOTO
 
Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]Shigeru Kishikawa
 
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一schoowebcampus
 
Heart coreクラウドday講演20110708 fin
Heart coreクラウドday講演20110708 finHeart coreクラウドday講演20110708 fin
Heart coreクラウドday講演20110708 finYukiyasu Hirose
 
IT活用のご提案〜ペットライフ〜
IT活用のご提案〜ペットライフ〜IT活用のご提案〜ペットライフ〜
IT活用のご提案〜ペットライフ〜Ryota Aoki
 
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方Shohei Hido
 
Marketing 04 客観的に状況を把握する市場調査
Marketing 04 客観的に状況を把握する市場調査Marketing 04 客観的に状況を把握する市場調査
Marketing 04 客観的に状況を把握する市場調査Meiji University / 明治大学
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016Tokoroten Nakayama
 
「実践的」カスタマージャーニー分析のすすめ
「実践的」カスタマージャーニー分析のすすめ「実践的」カスタマージャーニー分析のすすめ
「実践的」カスタマージャーニー分析のすすめAkihiko Uchino
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~株式会社Consumer first
 
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜Takafumi Nakanishi
 
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回LABO ASIA
 
Tokyo webmining発表資料 20111127
Tokyo webmining発表資料 20111127Tokyo webmining発表資料 20111127
Tokyo webmining発表資料 20111127kan_yukiko
 
確率統計-機械学習その前に v2.0
確率統計-機械学習その前に v2.0確率統計-機械学習その前に v2.0
確率統計-機械学習その前に v2.0Hidekatsu Izuno
 
【お手元資料】20141126 wab月例セミナー
【お手元資料】20141126 wab月例セミナー【お手元資料】20141126 wab月例セミナー
【お手元資料】20141126 wab月例セミナーDennis Sugahara
 
ライフエンジンを支える検索エンジンの作り方
ライフエンジンを支える検索エンジンの作り方ライフエンジンを支える検索エンジンの作り方
ライフエンジンを支える検索エンジンの作り方Chiaki Hatanaka
 
アクセスデータ収集と解析
アクセスデータ収集と解析アクセスデータ収集と解析
アクセスデータ収集と解析Yoichi Tomi
 

Semelhante a Web解析と意思決定20130311 太田 (20)

Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方Rによるノンパラメトリック検定と効果量の出し方
Rによるノンパラメトリック検定と効果量の出し方
 
Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]Jmrx講演資料0723(配布用)[1]
Jmrx講演資料0723(配布用)[1]
 
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
 
おしゃスタat銀座
おしゃスタat銀座おしゃスタat銀座
おしゃスタat銀座
 
Heart coreクラウドday講演20110708 fin
Heart coreクラウドday講演20110708 finHeart coreクラウドday講演20110708 fin
Heart coreクラウドday講演20110708 fin
 
tut_pfi_2012
tut_pfi_2012tut_pfi_2012
tut_pfi_2012
 
IT活用のご提案〜ペットライフ〜
IT活用のご提案〜ペットライフ〜IT活用のご提案〜ペットライフ〜
IT活用のご提案〜ペットライフ〜
 
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
 
Marketing 04 客観的に状況を把握する市場調査
Marketing 04 客観的に状況を把握する市場調査Marketing 04 客観的に状況を把握する市場調査
Marketing 04 客観的に状況を把握する市場調査
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
 
「実践的」カスタマージャーニー分析のすすめ
「実践的」カスタマージャーニー分析のすすめ「実践的」カスタマージャーニー分析のすすめ
「実践的」カスタマージャーニー分析のすすめ
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
 
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
 
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回
プロのコンサルタントとビジネスプランを作る! 「LABO ASIA」第2ターム第2回
 
120801発会式概要
120801発会式概要120801発会式概要
120801発会式概要
 
Tokyo webmining発表資料 20111127
Tokyo webmining発表資料 20111127Tokyo webmining発表資料 20111127
Tokyo webmining発表資料 20111127
 
確率統計-機械学習その前に v2.0
確率統計-機械学習その前に v2.0確率統計-機械学習その前に v2.0
確率統計-機械学習その前に v2.0
 
【お手元資料】20141126 wab月例セミナー
【お手元資料】20141126 wab月例セミナー【お手元資料】20141126 wab月例セミナー
【お手元資料】20141126 wab月例セミナー
 
ライフエンジンを支える検索エンジンの作り方
ライフエンジンを支える検索エンジンの作り方ライフエンジンを支える検索エンジンの作り方
ライフエンジンを支える検索エンジンの作り方
 
アクセスデータ収集と解析
アクセスデータ収集と解析アクセスデータ収集と解析
アクセスデータ収集と解析
 

Mais de 博三 太田

「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」博三 太田
 
slide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdfslide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdf博三 太田
 
LT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdfLT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdf博三 太田
 
LanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdfLanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdf博三 太田
 
image_video_instagram_202212.pdf
image_video_instagram_202212.pdfimage_video_instagram_202212.pdf
image_video_instagram_202212.pdf博三 太田
 
EC_intro_ota_202212.pdf
EC_intro_ota_202212.pdfEC_intro_ota_202212.pdf
EC_intro_ota_202212.pdf博三 太田
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf博三 太田
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf博三 太田
 
Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5博三 太田
 
LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355博三 太田
 
Logics 18th ota_20211201
Logics 18th ota_20211201Logics 18th ota_20211201
Logics 18th ota_20211201博三 太田
 
Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127博三 太田
 
2021年度 人工知能学会全国大会 第35回
2021年度 人工知能学会全国大会 第35回2021年度 人工知能学会全国大会 第35回
2021年度 人工知能学会全国大会 第35回博三 太田
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota博三 太田
 
Seattle consultion 20200822
Seattle consultion 20200822Seattle consultion 20200822
Seattle consultion 20200822博三 太田
 
Syumai lt_mokumoku__20200807_ota
Syumai  lt_mokumoku__20200807_otaSyumai  lt_mokumoku__20200807_ota
Syumai lt_mokumoku__20200807_ota博三 太田
 
Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613博三 太田
 
Online python data_analysis19th_20200516
Online python data_analysis19th_20200516Online python data_analysis19th_20200516
Online python data_analysis19th_20200516博三 太田
 
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -博三 太田
 
Thesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.otaThesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.ota博三 太田
 

Mais de 博三 太田 (20)

「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
 
slide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdfslide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdf
 
LT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdfLT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdf
 
LanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdfLanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdf
 
image_video_instagram_202212.pdf
image_video_instagram_202212.pdfimage_video_instagram_202212.pdf
image_video_instagram_202212.pdf
 
EC_intro_ota_202212.pdf
EC_intro_ota_202212.pdfEC_intro_ota_202212.pdf
EC_intro_ota_202212.pdf
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf
 
Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5
 
LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355
 
Logics 18th ota_20211201
Logics 18th ota_20211201Logics 18th ota_20211201
Logics 18th ota_20211201
 
Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127
 
2021年度 人工知能学会全国大会 第35回
2021年度 人工知能学会全国大会 第35回2021年度 人工知能学会全国大会 第35回
2021年度 人工知能学会全国大会 第35回
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota
 
Seattle consultion 20200822
Seattle consultion 20200822Seattle consultion 20200822
Seattle consultion 20200822
 
Syumai lt_mokumoku__20200807_ota
Syumai  lt_mokumoku__20200807_otaSyumai  lt_mokumoku__20200807_ota
Syumai lt_mokumoku__20200807_ota
 
Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613
 
Online python data_analysis19th_20200516
Online python data_analysis19th_20200516Online python data_analysis19th_20200516
Online python data_analysis19th_20200516
 
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
 
Thesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.otaThesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.ota
 

Web解析と意思決定20130311 太田

  • 2. 第7回 データマイニング+WEB 勉強会@東京 Agenda 1. 自己紹介 2.WEB解析への問題意識 3.WEB解析と統計的有意差の適用 -Teassly社のStatistical Calculatorを用いて 4.参考・引用文献一覧 5.さいごに 2
  • 3. 1.自己紹介 Hiromitsu OTA (1/3) 1.長年、文理融合を目指して、環境問題(廃棄物問題)を研究 ・ 廃棄物の最終処分場の跡地利用に関する研究 ・ 産業廃棄物の不法投棄の実証分析 ・ 用いた手法:多変量解析(OD表を用いた重回帰分析)、 ゲーム理論(Game theory)、 契約理論(Contract theory)、 ・場所: マレーシア: Kuala Lumper(KL)、Penang州、 タイ: Bangkok, Cooperated with Asian Institute of Technology(AIT) ・ 用いたデータ:OD表(Origin-Destination Table)、 フィールド調査データ(面接調査、紙面調査) 3
  • 4. 1.自己紹介 Hiromitsu OTA (2/3) 2.統計解析は文理の融合の共通の学問/分野として格別 しかし、日本には統計学部がない。 3.2008年大学院後期博士課程を修了し、コンサルタントへ ・Business Intelligence(BI)の導入支援、 ・Data Miningによるモデル構築 4.現在、専修大学大学院 商学研究科 大学院研究生として在 籍 ・江原先生、生田目先生に従事、 ・OR学会のデータ解析コンペティションに参加 4
  • 5. 1.自己紹介 Hiromitsu OTA (3/3) 5.現在、株式会社アパマンショップネットワ-ク システム部 WEBチームにて、ログ解析等に従事。 5
  • 6. 2.WEB解析への問題意識(1/2) ・問題意識: 学問領域ではWEB解析はどこに属するのか? 1.統計解析 ⇒統計学(R.A フィッシャーからT. ベイズへ) →実務では医薬品開発、品質管理で。 2.データマイニング ⇒情報工学(機械学習など電通大など)、 一部、統計解析(統数研) →実務では、通信販売業、金融業で。 3.テキストマイニング ⇒多変量解析(林知己夫先生、 大隅先生の取り組み) →実務では、コールセンターやWiki・ブログの解析(集合知)で。 6
  • 7. 2.WEB解析への問題意識(2/2) 1.の統計解析も、2.のデータマイニングも、3. のテキストマイニングも、 確たる「学問的背景」を持ち合わせている。 ・「学問的背景とは、理論がありそれなりに堅確である」 と言える。 では、アクセスログ解析は? ⇒マーケティング・サイエンス? ←データマイニング 計量経済学(時系列分析)? ←統計解析 ・解(私の考え):間接的に関係があり、複合的な学問領域にまたが る分野と捉える事ができそうだ・・・。 その正体を確かめたい。 →統計的有意差の事例(「Webアナリスト養成講座」 アビナッシュ・ コーシック著、衣袋宏美監訳、内藤貴志訳,翔泳社, 2007,PP420- 422)の事例を検討してみる。 7
  • 8. WEB解析と統計的有意差の適用事例の検討(1/6) ・検討事例1: メールによるキャンペーンの責任者とする。 最新のキャンペーンの潜在顧客に2種類のメールを 送った。結果は以下の2種類になった。 提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87% 提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06% ここで、提案2より、提案1の方がよいと言えるだろうか? 統計的有意差からシミュレーションしてみよう。 ※1 統計的有意差: 医薬品など生物統計学の分野では、統計的有意性は認可される際の 重要な指標となっている。 ※2 有意差とは統計データに基づいて観測された“差異”が誤差の範囲を超えている場合の 差の事である。1%とか5%といった小さな値の有意水準を定めて、観測結果が「差がな い」という帰無仮説の棄却領域に入るときに「有意差がある」と表現する。 しかし、有意差が認められたとしても、差の具体的な解釈は別個の問題であり、統計以 外の知識を用いて解決すべきものである。 *引用先:PP235-236,「現代統計学小辞典」鈴木義一郎著,講談社,1998 8
  • 9. WEB解析と統計的有意差の適用事例の検討(2/6) 提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87% 提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06% ・両提案のコンバージョン率の差異は0.19ポイント(=1.06-0.87)であ る。 ・0.19ポイントの差が出ていることから、提案2は提案1に比べて、 サイト訪問者数も100多く、購入者数も9多い。 ・では、統計的有意差の観点から、次のようにシミュレーションし検 証してみる。 ※ Teassly社のStatistical Calculatorを用いる。翻訳本と同じ条件である。 ・提案2: サイト訪問者が5,100,購入者が64,としてシミュレートしてみ ると・・・、 ※ Teassly社のStatistical Calculator URL: http://www.teasley.net/free_stuff.htm 9
  • 10. WEB解析と統計的有意差の適用事例の検討(3/6) 提案1: サイト訪問者が5,300,購入者が46,コンバージョン率は0.87% 提案2 : サイト訪問者が5,200,購入者が55,コンバージョン率が1.06% ・画面: Teassly社のStatistical Calculator(Excelで単に入力するだけで有意差が求められる) 提案1 提案2 有意差は80% 10
  • 11. WEB解析と統計的有意差の適用事例の検討(4/6) 提案1: サイト訪問者が5,300,購入者 が46,コンバージョン率は0.87% 提案2 : サイト訪問者が5,200,購入者 が55,コンバージョン率が1.06% ここで、提案2のみ、サイト訪問者数を100減らして5100に、購入者数を9人分多くして 64にしてみると・・・ 提案1: サイト訪問者が5,300,購入者 が46,コンバージョン率は0.87% 提案2 : サイト訪問者が5,100,購入者 が64,コンバージョン率が1.25% ここから、有意差は0.995(5%の信頼区間にある)と言える。 つまり、0.87 < 1.06 < 1.25 の不等式が成立する。 11 提案1と提案2ののコンバージョン率は誤差の範囲にあると言える。
  • 12. WEB解析と統計的有意差の適用事例の検討(5/6) ・結論:提案2の数値を変えてシミュレーションしてみた結果 、有意差は 0.995%で95%の信頼区間内にある。つまり、統計的には提案1も提案 2も、誤差の範囲でしかない。どちらも優劣付けがたいと言える。 ・ここで、再度、有意差の定義を確認してみると、 有意差とは、統計データに基づいて観測された“差異”が誤差の範囲 を超えている場合の差の事である。(中略)…しかし、有意差 が認められたとしても差の具体的な解釈は別個の問題であり、 統計以外の知識を用いて解決すべきものである。 ・では、どう考えたらよいのか? 12 ※引用先:PP235-236,「現代統計学小辞典」鈴木義一郎著,講談社,1998
  • 13. WEB解析と統計的有意差の適用事例の検討(6/6) <結論> ・統計的有意差は一つの目安であり、どちらがより良いか否かは断 言はできない。しかしシミュレーションできるのは悪くない。 ・また別の要因とは、例えば、サイト訪問者数(サンプルサイズ)や、 その分布(アクセスログのデータはロングテールになりやすいこ となど)も考慮して総合的に判断する必要があると言える。 ・有意差はPDCAを実践する際の一つの意思決定の基準や目安とし て、注意して用いる事が必要と思われる。 ⇒今後は、統計的有意差以外も、意思決定の一つの目安となるか 検証してゆきたい。 13
  • 14. 参考・引用文献一覧 1. 「Webアナリスト養成講座」アビナッシュ・コーシック著、衣袋宏美監訳、 内藤貴志訳,翔泳社, 2007,PP420-422 2. Teassly社のStatistical Calculator http://www.teasley.net/free_stuff.htm 3 . 「現代統計学小辞典」 鈴木義一郎著,講談社,1998, PP235-236 4. 「WEB解析士 検定テキスト」 弊社編纂,6章, JWDA出版,2010年11月(予定) 5 . 「WEB解析士 問題集」 弊社編纂,6章, JWDA出版,2010年11月(予定) 6.「生物学を学ぶ人のための統計のはなし―きみにも出せる有意差」 粕谷 英一著,文一総合出版,1998 14
  • 15. さいごに • ご拝聴ありがとうございます。 • 今後もWEB解析を軸に研究を行ってゆきたいと考えておりま す。 • 弊社のポリシーは、データ解析を行い、PDCAサイクルによる 改善を行うことです。 • アクセスログ解析のソフトウェア(Sibulla)等にご興味があり ましたら、気軽にお声掛けください。 ⇒ http://www.kan-net.com/ 15
  • 16. MEMO 16