SlideShare uma empresa Scribd logo
1 de 79
Baixar para ler offline
可視化法学(studycode編)
可視化法学の紹介
あるいはcode(コード)≒
code(法令)について
芝尾幸一郎(ソフトウェアエンジニア)
自己紹介
芝尾幸一郎
• Aiming(ソーシャルゲーム会社)でデータ分析の仕事をして
いる。
• 教育のバックグラウンドはメディアアート
• ドワンゴで、ニコニコ動画for iphoneの開発をしていた。
• 趣味でデータ分析をしている。
• 趣味で動画サイトの分析やランキングサイトを作ってい
る
今回の目的
• 可視化法学の紹介(12分)
• Codo = Codeの紹介(3分)
• プログラマと法曹の気質?(5分)
可視化法学とは
可視化法学
• 概要
「可視化法学-法教育に役立てるためにICT
を活用して法律の構造を解析して可視化す
る個人のプロジェクト」
可視化法学(studycode編)
可視化法学(studycode編)
可視化法学(studycode編)
法律の参照構造を解釈
してその繋がりを可視
化
作り方
法令データ収集
• 総務省法令データベースから
データを取得。
• 今はzipがありますが、昔は
webからスクレイプしてまし
た。
全ての参照構造を抜き出
す。
• 救急救命士法の中に刑
法へのリンクが有る
刑法
救急救命士法
刑法 売春防止法
刑法
労働者派遣事業の適正な運営の確保及び派遣労
働者の保護等に関する法律
刑法
育児休業、介護休業等育児又は家族介護を行う
労働者の福祉に関する法律
刑法
特定機器に係る適合性評価手続の結果の外国と
の相互承認の実施に関する法律
グラフ理論に基づいて描画
胡一凡さんの考えたアルゴリズム
可視化法学(studycode編)
グラフ理論の基づいて描画
• 多くの法律から参照される法律のサイズは大きくした。
• eg刑法、刑事訴訟法
• 点の色は、その法律が、どの分野に属するか?
• 刑事、民事、教育、厚生、労働etc
• 色々な分野から参照される法律は鮮やか
描画の様子
色んな法律を見てみる
可視化法学(studycode編)
似たものは近くに配置される
人間が手動で配置しているのではなく、参照し
ている法が近くにあれば機械的に自然と集まる
憲法分野
• 憲法には、基本法が良くくっ
付く。
• 憲法に並んで、沖縄の復帰に
関する法案が大きなウェイト
を占めており、占領されて復
帰するのは一つ国作るみたい
な大変さがあるようだ。
26
教育法分野
• 学校教育法が超大きなウェイ
トを占めている。
• 地味に、放送大学学園法、私
立学校教職員共済法が多くの
リンクを得ている。
27
税制分野
• 所得税、法人税、関税法が大
きい。
• 租税特別措置法は多くの法か
ら参照され、実はあんまり特
別措置じゃなかった。
28
河川分野
• シンプル
• 河川法だけ覚えれば後はそれ
の派生でなんとかなるんじゃ
ないか?
• 法の修正もまだ容易だろう
• バグも入り込みにくい
29
社会保険分野
• 死ぬほど複雑で相互依存が激し
い。
• 社会保障は利害関係者が多くて
、なかなか難しいのだろう。
• 何か法改正や追加の度にバグる
だろう。
• リファクタリング( コードをシンプル
にするプログラミング用語)出来るとい
いな。
30
今後作りたい物
インタラクティブな
web版可視化法学
web版DEMO(作りかけ版)
http://graph.lawvis.info/
basic認証id:test,pass:test
止まっていることもあります
33
法分野の時系列変化
可視化法学(studycode編)
法律がいつ出来ていつ
繋がったかを可視化
国別の比較
などをやりたい
その他の取り組み
法令要約(テスト版)
貸金業法
法令要約
• 機械学習(自然言語処理)
• トピックモデルを使って、法令を一枚の画像に要約でき
ないか?
• その法令に特徴的な用語を抜き出す。
• ガウス過程に基づく連続空間トピックモデル
可視化法学(studycode編)
可視化法学(studycode編)
宣伝
可視化法学(studycode編)
冊子を売ってます。
1号、2号、800円
技術書典3 き27
10/22(日)アキバUDX
法律の専門家の助力を
求めます。
@lawvis をフォロー
ブログも有るよ。「可視化法学」で検索
モチベーション
法は複雑すぎる
• 市民は理解できない。
• 複雑になっていくばかりで、誰もリフ
ァクタリングしない。
エンジニアは複雑さが嫌い
• プログラムのコードは、複雑であるが、シンプルにする
努力を、日々続けている。
• プログラム言語の進化やシステムを利用することで、シ
ンプルにしている。
• アセンブラからスクリプト言語へ。
• 継続的テストとリファクタリング
Code(法令)≒
Code(プログラミング)
code(法令)もcode(ソース
コード)もcodeである。
類似点
• 構造を持ち、他者(人、CPU)の理解可能な形で書かれてい
る。
• 複雑な(社会、事象)を制御する為に用いられる。
• しばしばバグが有るw
川上会長の著作権
• 著作権法をjavascriptで書き直
して複雑さを測定する。
• http://bizzine.jp/article/detail/63
7
コードを書く経営者ドワン
ゴ川上会長「プログラミン
グこそが基礎教養」
川上会長の著作権
これ、構造化するとわかるん
ですけど、実はこの中にコピ
ペされている部分がある。(会
場笑) JavaScriptの形式に直
してコンパイルしたら、複雑
度の合計が103になりました。
通常70以上はメンテ不可能と
いう先ほどの循環的複雑度か
らいえば、この法律は、いか
なる変更をしてもバグを生む
ということが判明したわけで
す。
論理憲法
https://twitter.com/bitlawjp
憲法をprologでリライト
プログラマー気質
• Code = Codeで先に考えるべきこと
• 法曹とプログラマーで気質に違いがありそう
プログラマー三大美徳
•怠惰
•短気
•散漫
怠惰
• 全体の労力を減らすために手間を惜しまない気質。
• この気質の持ち主は、役立つプログラムを書いてみんな
の苦労を減らしたり、同じ質問に何度も答えなくてもい
いように文書を書いたりする。
• よって、プログラマーの第一の美徳である。
短気
• コンピューターが怠慢な時に感じる怒り。
• この怒りの持ち主は、今ある問題に対応するプログラム
にとどまらず、今後起こりうる問題を想定したプログラ
ムを書く。少なくともそうしようとする。
• よって、プログラマーの第二の美徳である。
散漫
• 神罰が下るほどの過剰な自尊心。
• または人様に対して恥ずかしくないプログラムを書き、
また保守しようとする気質。
• よって、プログラマーの第三の美徳である。
怠惰であるために
• DRY(Don’t Repeat Yourself)
• 単純作業の繰り返しは悪
新旧改め文を10秒で
• 法制執務業務支援システム(e-laws)
• 法改正のための、新旧改め文を、人手ではなく、プログラミ
ングで行なう。
• 作業時間は、30時間から10秒へ
• 人間が楽するために、機械に頑張らせる
• 働くママが終止符を打った霞が関の“伝統芸能”
ある人のツィート
大量の情報処理(人力)
• 法曹は大量の情報処理をしなければならない。
• ファイリング資料2冊、DVD
エンジニアは怠惰
• エンジニアは怠惰なのでこう考える
• この資料の内、重要な箇所はどこだろう?
• 過去の交通事故と比べて、この事故に特徴的なことは
なんだろう。
• 法的事実をこの資料から自動生成出来ないか?
コードの活用
人力で行わず、機械で要約出来ないか?
コンピュータを使って迅速化、楽に出来ないか?
怠惰であるために今日頑張る
気質の違いを理解
•法曹とエンジニアで気質
がだいぶ違うので、互い
の気質を理解して付き合
おう。
まとめ
• 可視化法学をやっています。
• ICTを利用して法律を分かりやすくする試みです
• Code(法)=Code(コード)には類似点がある。
• プログラミングで、法は楽にならないか?
• 同じCodeを扱っても気質はだいぶ違う
• 仲良くやっていきましょう
最後にお願い
法律の専門家の助力を求めま
す。
速いマシンを使わせてくださ
い。
@lawvis をフォロー
ブログも有るよ。「可視化法学」で検索
時間が余ればや
るスライド
DOC2VECで
法令理解
DOC2VEC(曖昧な理解)
➤ Word2Vecをパラグラフへ応用したもの。
➤ Paragraph2Vecが元論文の名前
➤ Word2Vec
➤ 文章における各単語間の関連を元に、単語の重みを
付けたもの
➤ 詳しくはこちら
➤ https://deepage.net/machine_learning/2017/01/08/do
c2vec.html
法令の類似度を測るには
➤ 単語の抜き出し(形態素解析)
➤ MeCab
% mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
➤ Doc2Vec
➤ Gensim https://radimrehurek.com/gensim/models/doc2vec.html
WEBサイト作ってみた
➤ Doc2Vecを利用して法令の類似性を測るサイトを作っ
た
➤ http://54.238.251.57:5000/ (現在停止中)
➤ 出来ること
➤ 法律用語のにた単語を調べる(死刑ににた単語)
➤ ランダムに選んだカテゴリと近いカテゴリを列挙
➤ ランダムに選んだ法令と近い法令を列挙
作り方
➤ 法令を集める
➤ 法令データをmecabを使って、名詞だけ抽出
➤ name=未成年者飲酒禁止法(大正十一年三月三十日法律第二十号) word=['未成年', '者', '飲酒', '禁止', '法', '大正
', '年', '三月', '日', '法律', '号', '最終', '改正', '平成', '年', '二月', '日', '法律', '号', ‘条']
➤ gensim.doc2vecを利用して、単語間の繋がりを学習。
model = models.Doc2Vec(size=400, alpha=0.0015, sample=1e-4, min_count=10, workers=4)
model.build_vocab(sentences)
for x in range(30):
model.train(sentences)
学習パラメータの調整
➤ 名詞だけを含めるか?動詞や形容詞も含めるか?
➤ 多くの法律に共有する単語は無視するか?
➤ どの程度の頻度で出たらその法令を特徴づける単語だ
と認識するか?
パラメータを色々いじる
➤ law(名詞、形容詞、動詞)
➤ law2 min_count=1 最低1回以上出た単語を学習に使用
➤ law3 min_count=10
➤ law4 min_count=40
➤ law5 min_count=100
➤ law7 tagを法令名ではなく、カテゴリ名に変更

Mais conteúdo relacionado

Semelhante a 可視化法学(studycode編)

EXE #3: AIを協力して作成するDapp
EXE #3: AIを協力して作成するDappEXE #3: AIを協力して作成するDapp
EXE #3: AIを協力して作成するDappblockchainexe
 
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Hiroko Onari
 
データドリブンな動画コンテンツ制作の裏側
データドリブンな動画コンテンツ制作の裏側データドリブンな動画コンテンツ制作の裏側
データドリブンな動画コンテンツ制作の裏側TatsuyaAkasaka
 
子供達と プログラミングをはじめよう
子供達と プログラミングをはじめよう子供達と プログラミングをはじめよう
子供達と プログラミングをはじめようMasao Niizuma
 
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハントHiroyuki Ishikawa
 
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...Naoki (Neo) SATO
 
Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119Keiichiro Nabeno
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜Naoki Fujiwara
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知Core Concept Technologies
 
Watanabe civictechforum
Watanabe civictechforumWatanabe civictechforum
Watanabe civictechforumsiramatu-lab
 
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法「俺の背中について来い」アジャイルチームを一気に立ち上げる方法
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法Hiromasa Oka
 
2020/05/18 Alibaba cloud AIソリューションセミナー
2020/05/18 Alibaba cloud  AIソリューションセミナー2020/05/18 Alibaba cloud  AIソリューションセミナー
2020/05/18 Alibaba cloud AIソリューションセミナー寛之 松浦
 
2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network ConsoleSony Network Communications Inc.
 
自社取り組み紹介(BetaComputing)
自社取り組み紹介(BetaComputing)自社取り組み紹介(BetaComputing)
自社取り組み紹介(BetaComputing)Yasuhiro Kobayashi
 
Project 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdfProject 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdfYasuhiroHanda2
 
【IoT World 2016】IoT案件を90件やってみて分かった事
【IoT World 2016】IoT案件を90件やってみて分かった事【IoT World 2016】IoT案件を90件やってみて分かった事
【IoT World 2016】IoT案件を90件やってみて分かった事iot_nifty
 

Semelhante a 可視化法学(studycode編) (20)

EXE #3: AIを協力して作成するDapp
EXE #3: AIを協力して作成するDappEXE #3: AIを協力して作成するDapp
EXE #3: AIを協力して作成するDapp
 
What is tmcn for isit
What is tmcn for isitWhat is tmcn for isit
What is tmcn for isit
 
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台Data scientist casual talk in 白金台
Data scientist casual talk in 白金台
 
データドリブンな動画コンテンツ制作の裏側
データドリブンな動画コンテンツ制作の裏側データドリブンな動画コンテンツ制作の裏側
データドリブンな動画コンテンツ制作の裏側
 
子供達と プログラミングをはじめよう
子供達と プログラミングをはじめよう子供達と プログラミングをはじめよう
子供達と プログラミングをはじめよう
 
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
 
What's TMCN?
What's TMCN?What's TMCN?
What's TMCN?
 
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
 
Code for toyama city 201908
Code for toyama city 201908Code for toyama city 201908
Code for toyama city 201908
 
Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119Io tビジネスモデルに関する考察20161119
Io tビジネスモデルに関する考察20161119
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
 
Build 2018 - Cognitive Services updates summary
Build 2018 - Cognitive Services updates summaryBuild 2018 - Cognitive Services updates summary
Build 2018 - Cognitive Services updates summary
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
 
Watanabe civictechforum
Watanabe civictechforumWatanabe civictechforum
Watanabe civictechforum
 
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法「俺の背中について来い」アジャイルチームを一気に立ち上げる方法
「俺の背中について来い」アジャイルチームを一気に立ち上げる方法
 
2020/05/18 Alibaba cloud AIソリューションセミナー
2020/05/18 Alibaba cloud  AIソリューションセミナー2020/05/18 Alibaba cloud  AIソリューションセミナー
2020/05/18 Alibaba cloud AIソリューションセミナー
 
2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console
 
自社取り組み紹介(BetaComputing)
自社取り組み紹介(BetaComputing)自社取り組み紹介(BetaComputing)
自社取り組み紹介(BetaComputing)
 
Project 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdfProject 15 - Algyan May 2022.pdf
Project 15 - Algyan May 2022.pdf
 
【IoT World 2016】IoT案件を90件やってみて分かった事
【IoT World 2016】IoT案件を90件やってみて分かった事【IoT World 2016】IoT案件を90件やってみて分かった事
【IoT World 2016】IoT案件を90件やってみて分かった事
 

Mais de (shibao)芝尾 (kouichiro)幸一郎

可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン
可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン
可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン(shibao)芝尾 (kouichiro)幸一郎
 
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成(shibao)芝尾 (kouichiro)幸一郎
 
Re dashで作るニコニコデータセット分析環境
Re dashで作るニコニコデータセット分析環境Re dashで作るニコニコデータセット分析環境
Re dashで作るニコニコデータセット分析環境(shibao)芝尾 (kouichiro)幸一郎
 
ニコニコ動画データセット分析環境作ってみたその後
ニコニコ動画データセット分析環境作ってみたその後ニコニコ動画データセット分析環境作ってみたその後
ニコニコ動画データセット分析環境作ってみたその後(shibao)芝尾 (kouichiro)幸一郎
 
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会(shibao)芝尾 (kouichiro)幸一郎
 
第一回ニコニコデータ分析研究会発表資料-世界のYoutube
第一回ニコニコデータ分析研究会発表資料-世界のYoutube第一回ニコニコデータ分析研究会発表資料-世界のYoutube
第一回ニコニコデータ分析研究会発表資料-世界のYoutube(shibao)芝尾 (kouichiro)幸一郎
 

Mais de (shibao)芝尾 (kouichiro)幸一郎 (16)

DXとはなにか?
DXとはなにか?DXとはなにか?
DXとはなにか?
 
可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン
可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン
可視化法学(Linked Open Data Challenge 2016)授賞式プレゼン
 
可視化法学c91紹介リーフレット
可視化法学c91紹介リーフレット可視化法学c91紹介リーフレット
可視化法学c91紹介リーフレット
 
可視化法学ポスター超会議2016 チラシ
可視化法学ポスター超会議2016 チラシ可視化法学ポスター超会議2016 チラシ
可視化法学ポスター超会議2016 チラシ
 
Bq sushi(BigQuery lessons learned)
Bq sushi(BigQuery lessons learned)Bq sushi(BigQuery lessons learned)
Bq sushi(BigQuery lessons learned)
 
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
 
Re dashで作るニコニコデータセット分析環境
Re dashで作るニコニコデータセット分析環境Re dashで作るニコニコデータセット分析環境
Re dashで作るニコニコデータセット分析環境
 
AimingでGoogle Cloud Platformの利用について
AimingでGoogle Cloud Platformの利用についてAimingでGoogle Cloud Platformの利用について
AimingでGoogle Cloud Platformの利用について
 
ニコニコデータビューアー・改
ニコニコデータビューアー・改ニコニコデータビューアー・改
ニコニコデータビューアー・改
 
ニコニコ動画データセット分析環境作ってみたその後
ニコニコ動画データセット分析環境作ってみたその後ニコニコ動画データセット分析環境作ってみたその後
ニコニコ動画データセット分析環境作ってみたその後
 
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会
ニコニコデータセット 分析環境作ってみた-ニコニコデータデータ分析研究会
 
世界のiPhoneアプリランキング比較してみた
世界のiPhoneアプリランキング比較してみた世界のiPhoneアプリランキング比較してみた
世界のiPhoneアプリランキング比較してみた
 
第一回ニコニコデータ分析研究会発表資料-世界のYoutube
第一回ニコニコデータ分析研究会発表資料-世界のYoutube第一回ニコニコデータ分析研究会発表資料-世界のYoutube
第一回ニコニコデータ分析研究会発表資料-世界のYoutube
 
ニコニコ学会β発表資料
ニコニコ学会β発表資料ニコニコ学会β発表資料
ニコニコ学会β発表資料
 
Seeing is Believing
Seeing is BelievingSeeing is Believing
Seeing is Believing
 
Introduction Pycon2010
Introduction Pycon2010Introduction Pycon2010
Introduction Pycon2010
 

可視化法学(studycode編)