Submit Search
Upload
Deep learningの世界に飛び込む前の命綱
•
12 likes
•
7,014 views
J
Junya Kamura
Follow
Deep Learningオールスターズ2017 発表資料
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 33
Download Now
Download to read offline
Recommended
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
Takahiro Kubo
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI Gymトレーニング
Takahiro Kubo
「人工知能」との正しい付き合い方
「人工知能」との正しい付き合い方
Takahiro Kubo
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
Takahiro Kubo
機械学習を用いた会議診断システムの開発
機械学習を用いた会議診断システムの開発
Takahiro Kubo
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
Hideto Masuoka
TIS 戦略技術センター AI技術推進室紹介
TIS 戦略技術センター AI技術推進室紹介
Takahiro Kubo
Machine learningbootstrap For Business
Machine learningbootstrap For Business
Takahiro Kubo
More Related Content
What's hot
TIS INTERNSHIP 2016 SUMMER
TIS INTERNSHIP 2016 SUMMER
Takahiro Kubo
良い原稿を作る3つの要素、読み易い文章を作る5つのコツ、SQiPシンポジウムアブストラクト作成のポイント
良い原稿を作る3つの要素、読み易い文章を作る5つのコツ、SQiPシンポジウムアブストラクト作成のポイント
Naoki Ohsugi
ディープに作る固有表現認識
ディープに作る固有表現認識
Hiroki Nakayama
TISにおける、研究開発のメソッド
TISにおける、研究開発のメソッド
Takahiro Kubo
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
Takahiro Kubo
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
Takahiro Kubo
機械学習技術の紹介
機械学習技術の紹介
Takahiro Kubo
実戦投入する機械学習
実戦投入する機械学習
Takahiro Kubo
SQiPシンポジウムアブストラクト作成のポイント
SQiPシンポジウムアブストラクト作成のポイント
ソフトウェア品質シンポジウム
Dll講演資料 2017616
Dll講演資料 2017616
NORIKO HOSAKA
深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例
Hirono Jumpei
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
Recruit Technologies
ACL2018の歩き方
ACL2018の歩き方
Takahiro Kubo
EMNLP2018 Overview
EMNLP2018 Overview
Takahiro Kubo
Chainerのcommunity活動の今までとこれから
Chainerのcommunity活動の今までとこれから
Hideto Masuoka
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
Ridge-i
DLL Community Update 10月版
DLL Community Update 10月版
Hirono Jumpei
20171201_02_idb_security_wg発表_p
20171201_02_idb_security_wg発表_p
ID-Based Security イニシアティブ
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
Recruit Technologies
【A-1】すべてがつながるIoT時代の共創のあり方
【A-1】すべてがつながるIoT時代の共創のあり方
Developers Summit
What's hot
(20)
TIS INTERNSHIP 2016 SUMMER
TIS INTERNSHIP 2016 SUMMER
良い原稿を作る3つの要素、読み易い文章を作る5つのコツ、SQiPシンポジウムアブストラクト作成のポイント
良い原稿を作る3つの要素、読み易い文章を作る5つのコツ、SQiPシンポジウムアブストラクト作成のポイント
ディープに作る固有表現認識
ディープに作る固有表現認識
TISにおける、研究開発のメソッド
TISにおける、研究開発のメソッド
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
機械学習技術の紹介
機械学習技術の紹介
実戦投入する機械学習
実戦投入する機械学習
SQiPシンポジウムアブストラクト作成のポイント
SQiPシンポジウムアブストラクト作成のポイント
Dll講演資料 2017616
Dll講演資料 2017616
深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
ACL2018の歩き方
ACL2018の歩き方
EMNLP2018 Overview
EMNLP2018 Overview
Chainerのcommunity活動の今までとこれから
Chainerのcommunity活動の今までとこれから
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
DLL Community Update 10月版
DLL Community Update 10月版
20171201_02_idb_security_wg発表_p
20171201_02_idb_security_wg発表_p
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
【A-1】すべてがつながるIoT時代の共創のあり方
【A-1】すべてがつながるIoT時代の共創のあり方
Viewers also liked
論文輪講 Initializing convolutional filters with semantic features for text class...
論文輪講 Initializing convolutional filters with semantic features for text class...
Junya Kamura
オイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンド
Keisho Suzuki
kintone Café 東京 Vol.4 ハンズオン資料(kintone & AWS API Gateway/Lambda/Machine Learning)
kintone Café 東京 Vol.4 ハンズオン資料(kintone & AWS API Gateway/Lambda/Machine Learning)
JOYZO
kintone Café 大阪 Vol.13 〜karuraで学ぶ、機械学習の活かし方〜
kintone Café 大阪 Vol.13 〜karuraで学ぶ、機械学習の活かし方〜
Takahiro Kubo
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
Tokoroten Nakayama
Timestamp for kintone
Timestamp for kintone
トヨクモ株式会社
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
Takahiro Kubo
激アツ!GPUパワーとインフラの戦い
激アツ!GPUパワーとインフラの戦い
IDC Frontier
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
Toshihiko Yamakami
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
Takahiro Kubo
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
Ryota Kamoshida
Viewers also liked
(12)
論文輪講 Initializing convolutional filters with semantic features for text class...
論文輪講 Initializing convolutional filters with semantic features for text class...
オイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンド
kintone Café 東京 Vol.4 ハンズオン資料(kintone & AWS API Gateway/Lambda/Machine Learning)
kintone Café 東京 Vol.4 ハンズオン資料(kintone & AWS API Gateway/Lambda/Machine Learning)
kintone Café 大阪 Vol.13 〜karuraで学ぶ、機械学習の活かし方〜
kintone Café 大阪 Vol.13 〜karuraで学ぶ、機械学習の活かし方〜
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
Timestamp for kintone
Timestamp for kintone
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
激アツ!GPUパワーとインフラの戦い
激アツ!GPUパワーとインフラの戦い
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
Similar to Deep learningの世界に飛び込む前の命綱
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
Takahiro Kubo
Machine learning 15min TensorFlow hub
Machine learning 15min TensorFlow hub
Junya Kamura
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
Yahoo!デベロッパーネットワーク
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
Fumihiko Takahashi
【IVS CTO Night & Day】AI / Machine Learning on AWS
【IVS CTO Night & Day】AI / Machine Learning on AWS
Amazon Web Services Japan
セキュリティ教育とUX ~結ばれていた赤い糸~
セキュリティ教育とUX ~結ばれていた赤い糸~
Yahoo!デベロッパーネットワーク
Ibm watson api サービス
Ibm watson api サービス
Hiroaki Komine
20151204 bmxug watson_j_v1.1
20151204 bmxug watson_j_v1.1
inadaf
Pmaj産学連携pmセミナー 171216
Pmaj産学連携pmセミナー 171216
Miki Yutani
プロが教える Rails 教え方ワンポイントとキャリア情報
プロが教える Rails 教え方ワンポイントとキャリア情報
DIVE INTO CODE Corp.
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
SAS Institute Japan
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例
Atsushi Hara
内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニング
Ko Kikuta
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
Koichiro Mori
広告における機械学習の適用例とシステムについて
広告における機械学習の適用例とシステムについて
Yahoo!デベロッパーネットワーク
DeNAのプログラミング教育の取り組み #denatechcon
DeNAのプログラミング教育の取り組み #denatechcon
DeNA
Interop2017
Interop2017
tak9029
エウレカBIチームの時間の使い方
エウレカBIチームの時間の使い方
Shinnosuke Ohkubo
[Ridge-i] Dll講演資料 2017616
[Ridge-i] Dll講演資料 2017616
Ridge-i
事例から見る人工知能の現在と、企業における活用方法
事例から見る人工知能の現在と、企業における活用方法
Junya Kamura
Similar to Deep learningの世界に飛び込む前の命綱
(20)
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
Machine learning 15min TensorFlow hub
Machine learning 15min TensorFlow hub
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
【IVS CTO Night & Day】AI / Machine Learning on AWS
【IVS CTO Night & Day】AI / Machine Learning on AWS
セキュリティ教育とUX ~結ばれていた赤い糸~
セキュリティ教育とUX ~結ばれていた赤い糸~
Ibm watson api サービス
Ibm watson api サービス
20151204 bmxug watson_j_v1.1
20151204 bmxug watson_j_v1.1
Pmaj産学連携pmセミナー 171216
Pmaj産学連携pmセミナー 171216
プロが教える Rails 教え方ワンポイントとキャリア情報
プロが教える Rails 教え方ワンポイントとキャリア情報
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例
内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニング
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
広告における機械学習の適用例とシステムについて
広告における機械学習の適用例とシステムについて
DeNAのプログラミング教育の取り組み #denatechcon
DeNAのプログラミング教育の取り組み #denatechcon
Interop2017
Interop2017
エウレカBIチームの時間の使い方
エウレカBIチームの時間の使い方
[Ridge-i] Dll講演資料 2017616
[Ridge-i] Dll講演資料 2017616
事例から見る人工知能の現在と、企業における活用方法
事例から見る人工知能の現在と、企業における活用方法
More from Junya Kamura
Coursera Machine Learning week1
Coursera Machine Learning week1
Junya Kamura
Derivative models from BERT
Derivative models from BERT
Junya Kamura
Parameterized convolutional neural networks for aspect level classification
Parameterized convolutional neural networks for aspect level classification
Junya Kamura
Deep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classification
Junya Kamura
Deep contextualized word representations
Deep contextualized word representations
Junya Kamura
Reasoning with neural tensor networks for knowledge base completion
Reasoning with neural tensor networks for knowledge base completion
Junya Kamura
More from Junya Kamura
(6)
Coursera Machine Learning week1
Coursera Machine Learning week1
Derivative models from BERT
Derivative models from BERT
Parameterized convolutional neural networks for aspect level classification
Parameterized convolutional neural networks for aspect level classification
Deep learning for_extreme_multi-label_text_classification
Deep learning for_extreme_multi-label_text_classification
Deep contextualized word representations
Deep contextualized word representations
Reasoning with neural tensor networks for knowledge base completion
Reasoning with neural tensor networks for knowledge base completion
Deep learningの世界に飛び込む前の命綱
1.
Copyright © 2017
TIS Inc. All rights reserved. Deep Learningの世界に飛び込む前の命綱 戦略技術センター 嘉村準弥
2.
Copyright © 2017
TIS Inc. All rights reserved. 2 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
3.
Copyright © 2017
TIS Inc. All rights reserved. 3 嘉村準弥 TIS株式会社 戦略技術センター 旅行会社Webアプリ開発の要件定義~開発~保守運用に従事 システム開発の現場をこれまで用いてこなかった技術によって改善し たいとの思いから戦略技術センターへ異動 現在は機械学習や自然言語処理についての研究を行いながら、プロト タイプの開発を行う 自己紹介 今一番気になってる書籍です→ kamujun @kamujun18
4.
Copyright © 2017
TIS Inc. All rights reserved. 4 所属するチームのミッション chakki すべての人が、ティータイムに帰れるようにする すべての人が、ティータイム(15:00)に帰れる(茶帰) 社会の実現を目指します。 この実現には、既存の仕事を効率化するのでなく、 根本的に「仕事の仕方」を変える必要があります。 しかし、慣れた仕事の仕方というのは簡単には変わ りません。だからこそ、実際に「体験」をし、効果 を「実感」してもらうことが重要になります。 そのため、私たちは先進的技術を用い、仕事の仕方 が変わる体験を提供していきます。
5.
Copyright © 2017
TIS Inc. All rights reserved. 5 chakki まずは自分たち(システム開発者)が帰れるように 自然言語処理/機械学習を活用する Elephant Sense 「質の高い」文章を検索するための試み。ビュー数やいい ね数だけでなく、コンテンツの品質の評価も行う。 karura 業務に機械学習をさくっと組み込むための試み。 kintone/Slackのプラグインとなり、予測したい項目/予 測に使う項目の指定のみでモデルを自動作成する。 chazutsu NEW! 自然言語で使うデータを簡単に手に入れるための仕組み。 データのダウンロードからpandasまでを一行で。
6.
Copyright © 2017
TIS Inc. All rights reserved. 6Copyright © 2016 TIS Inc. All rights reserved. 22 論文輪講を行っています。 論文のまとめ情報は、以下リポジトリで公開しています。 https://github.com/arXivTimes/arXivTimes もちろん、まとめの投稿 もお待ちしています。 chakki
7.
Copyright © 2017
TIS Inc. All rights reserved. 7 本日の発表では、 Deep Learning適用前に命綱(=既存の機械学習)を用意しておく有効性 を紹介します。 Deep Learningと他の手法の性能について、同一の問題に適用することに より比較を行いました。 その中で、Deep Learningを用いるのは既存の機械学習手法で試した後が 良いのではないかと感じました。 これからDeep Learningに携わるエンジニアの方や、導入を検討している 方の参考になればと思います。 本日のテーマ
8.
Copyright © 2017
TIS Inc. All rights reserved. 8 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
9.
Copyright © 2017
TIS Inc. All rights reserved. 9 評判分析 文書が肯定的か否定的かを推定する極性判定を行いました。 公開データセットであるIMDB(映画レビューデータ)を対象とします。 取り組み方針 既存の機械学習(非ニューラルネット)による検証ののち、Deep Learningに取り組む →しっかりと基礎を踏まえながら挑戦する 取り組むタスク(1/2) データ数 訓練データ 25,000件 (肯定:否定=1:1) テストデータ 25,000件 (肯定:否定=1:1) 文書中平均単語数 231単語 単語種類総数 392,000単語
10.
Copyright © 2017
TIS Inc. All rights reserved. 10 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
11.
Copyright © 2017
TIS Inc. All rights reserved. 11 手法 Naive Bayes 利用理由 分類問題のベースラインとして多く用いられているため。シンプルな 手法であるものの、一定の性能が出ることが知られています。 既存の機械学習手法(1/5) 否定肯定 学習 Naive Bayes 肯定 A B C D E F 否定 A B C D E F 肯定と否定それぞれの 文書と単語の 出現確率を学習 推定 学習結果から 文書のカテゴリを推定 ? A B C D E F
12.
Copyright © 2017
TIS Inc. All rights reserved. 12 ベースライン手法の性能に関する論文 Baselines and Bigrams: Simple, Good Sentiment and Topic Classification [Sida Wang and Christopher D. Manning, 2012] 既存の機械学習手法(2/5) Naive BayesやSVMなどの手法で 感情分析の性能比較を行った研究。 7種類の文書データセットを用いる。 パラメータ設定や特徴設定によっ ては、最先端手法(state-of-the- art)と同等のパフォーマンスを示 すことができることを示す。
13.
Copyright © 2017
TIS Inc. All rights reserved. 13 ベースライン手法の性能に関する論文 IMDBのデータセットにおいてNaive Bayesを用いたところ、 accuracy(正解率)は86.59%を示すことができている。 既存の機械学習手法(3/5) ※補足(発表者追記) MNB=Multinomial Naive Bayes SVM=Support Vector Machine NBSVM=SVM with NB features uni =unigram bi =bigram ※ Baselines and Bigrams: Simple, Good Sentiment and Topic Classification [Sida Wang and Christopher D. Manning, 2012]
14.
Copyright © 2017
TIS Inc. All rights reserved. 14 実装 scikit-learnを用いて実装を行いました。論文を参考に、文章の特徴を Bag of BigramsとしてNaive Bayesを実装。 既存の機械学習手法(4/5) I thislike movie I like this movie like this Bag of Words Bag of Bigrams don’t 例 : I like this movie
15.
Copyright © 2017
TIS Inc. All rights reserved. 15 結果 正解率(accuracy)において、論文と同等の性能を示すことができた。 既存の機械学習手法(5/5) accuracy 87.9 precision recall f1-score support positive 0.85 0.91 0.88 12500 negative 0.91 0.84 0.87 12500 avg/total 0.88 0.88 0.88 25000
16.
出た!! いいやん!
17.
自己紹介 本日のテーマ
取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
18.
Copyright © 2017
TIS Inc. All rights reserved. 18 手法 LSTM(Long short-term memory) 利用理由 文章(単語の連続)のような不定長な連続データについて、勾配消失・発 散問題を軽減して学習することができるため。 Deep Learning(1/3) http://deeplearning.net/tutorial/lstm.html
19.
Copyright © 2017
TIS Inc. All rights reserved. 19 実装 Keras(バックエンドはTensorflow)を用いた。フレームワークに含まれ るサンプルコードをベースに実装。 結果 accuracyにおいてNaive Bayesに及ばず。 Deep Learning(2/3) accuracy 80.8 Naive Bayesと同程度は示せると思っていたのに。 初めて実装したけどこんなものなの…? LSTM Naive Bayes accuracy 87.9
20.
Copyright © 2017
TIS Inc. All rights reserved. 20 なぜ性能が悪いのか? Accuracyやlossをプロットしたところ、過学習が発生していた。 Deep Learning(3/3) 訓練データに対する損失は減少しているが、 テストデータに対する損失が減少しない テストデータに対する 正解率が増加しない
21.
出た!! これが噂の過学習や!
22.
Copyright © 2017
TIS Inc. All rights reserved. 22 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
23.
Copyright © 2017
TIS Inc. All rights reserved. 23 LSTMにおける過学習の解決手段 データを増やす 次元を減らす 正則化項を用いる ドロップアウトを用いる 早期打ち切り(early stopping)を行う モデルを変更する などなど… パラメータチューニング(1/5) 今回はパラメータチューニングを行おう。 腕の見せ所だ!
24.
Copyright © 2017
TIS Inc. All rights reserved. 24 調整を重ねても思うように性能が上がらない ドロップアウトを調整 L2正則化を利用 次元を削減 この他数多く実施。 →行った計算時間は 30時間 以上… パラメータチューニング(2/5) accuracy 80.6(-0.2) accuracy 78.8(-2.0) accuracy 81.7(+0.9) ※カッコ内はチューニング前との差
26.
出ない… こんなはずでは…
27.
Copyright © 2017
TIS Inc. All rights reserved. 27 他の実装のパラメータなどを参考に性能は上がった パラメータチューニング(3/4) accuracy 84.7 パラメータ 設定値 単語種類数 10,000 入力単語数 100 ドロップアウト 0.8 エポック数 14 性能が上がってホッとした。が、なぜこのパラメータが良い のか?そんなものなのか? しかもNaive Bayesに負けてるし、労力に見合っていない… Deep Learningの沼にはまった…
28.
Copyright © 2017
TIS Inc. All rights reserved. 28 実施後調査 もちろんLSTMでもチューニング次第で性能が出る パラメータチューニング(4/5) Sentiment Analysis with Deeply Learned Distributed Representations of Variable Length Texts [James Hong and Michael Fang , 2015]
29.
Copyright © 2017
TIS Inc. All rights reserved. 29 振り返り ベースラインに近づけるのも難しかった 現状の知識ではDeep Learningを既存の機械学習に匹敵させるのも 難しかった。すぐに性能が出る(正答率90%弱位)と思い込んでいた がその通りにはならなかった。 延々とパラメータ調整に取り組むことの危険性 真っ先にDeep Learningを用いていたらずっと調整を繰り返してい たかもしれない。既存の機械学習手法の結果があれば客観的に取り 組み方を見直す事ができる。 パラメータチューニング(5/5)
30.
Copyright © 2017
TIS Inc. All rights reserved. 30 自己紹介 本日のテーマ 取り組むタスク 既存の機械学習手法(Naive Bayes) Deep Learning(LSTM) パラメータチューニング おわりに 目次
31.
Copyright © 2017
TIS Inc. All rights reserved. 31 今回の取り組みを通じて、自然言語処理においては他の手法を差し置 いて真っ先にDeep Learningの世界に飛び込むのは得策でないと感じ た。 Deep Learningを用いる際には以下があると良い。 性能向上をどこまで行うかの目安 うまくいかないときの保険・代替案 おわりに 既存の機械学習手法でベースラインを用意しておく!
32.
命綱を用意して、いざDeep Learningの世界へ!
33.
ご清聴ありがとうございました
Editor's Notes
・はりねずみとともに歩んだ1年間です
・15時に必要な業務が完了できるように ・これまでの習慣を、体験によって実感し変化を促す
・現在プロダクトはgithubで公開されている ・chazutsuやtypotを紹介
・技術を習得するため、既存の機械学習とDeep Learningを実装し性能を確認した。学習は行っていたが個人的に初めてのDeep Learning実装であった。 ・機械学習→Deepで取り組むべき。Deep→機械学習ではよくない。
想定疑問:本当に一定の性能が出るの
・これから実装するMNB-biでは86%の正解率が出ることを述べている ・またIMDBで最高値としては下段のNBSVM-biで91%を示している。これは後で紹介するLSTMを上回っている値である。 ・今回は論文にならいシンプルなMNB-biを実装してみる
・機械学習ライブラリscikitlearnを利用 ・論文を参考に実装した。特にBag of Bigramsを用いている。 -----
・正答率87%を示すことができた。 ・その他の指標もおおむね良さそうな結果。
でた
・DeepLearningではLSTMを用います。これはRNNの発展モデルです。 ・理由としては文章のような長さが決まっていないデータに対して、うまく学習することができるためです。 ・
・原因調査のため学習過程におけるaccとlossをグラフ化した。 ・事前に勉強して学んでいた。 ・その結果過学習であることが分かった。 ・過学習は訓練データに特化しすぎて、未知データで推測失敗する汎化性能が悪いことを言います。
でた
正解率を上げるため次にパラメータチューニングを行いました。
過学習を解決するためには様々あります。 今回は
しかし、やれどもやれども性能が上がりません。 時間がただただ過ぎるばかり…
その時の状態を表したのがこの例です。 ・一回回すのに1時間 ・パラメータを変えて実行しては一喜一憂 まさに…
でた
・最終的には他の実装のパラメータを参考にしました。 ・正解率は84.7%になった ・こんなもん
・最終的には他の実装のパラメータを参考にしました。 ・正解率は84.7%になった ・こんなもん
Download Now