条件付き確率を理解して弁護団の詭弁を暴け! …2018年に読んだ本まとめ (1/3)

僕は2018年の始めにこんなことを目標に掲げていた.

本を読んだら,ただひとつのtakeawayについてまとめる.
だた一つという点が重要だ.もちろんゼロ個じゃ何にもなってないから論外としても,それでも1つ.2つじゃだめだ.読んでる時にもまとめるときにもまとめ終わっても覚えれてられないからだ.
https://lookbackmargin.home.blog/2018/02/05/52200519

目標はどれほど達成された?

これを僕が2018年にどれくらい実践したのかと言うと,5回.僕は2018年に5個のtakeawayまとめ記事を書いてる.

まぁよくやったよねと言わないでもない.5冊本読んだんだもんね,5個の記事を書いたら良いじゃないか.…というのは違ってて,実はもう少し本を読んでた.でもtakeawayまとめ記事を書いてなかったのでした.
僕にとって「読書をもっと実のあるものにする」という目標が蔑ろにされてしまってもったいない.なのでここで2018年に読んだ (と思われる) 本のtakeawayを1つずつまとめます!たぶん13冊,たぶんまだブログに書いてないけど読んでます.この記事では4冊紹介します.
…「読んだと思われる」と言ってるのは,本当に2018年に読んだのかどうかについて確証がないからです…Kindleに読了マークとかつけたいんだけどできないよね…

強い力と弱い力


この本で僕が「ほえ~」と感心したのは次の部分.

しかし実際には,それ以外に4種類,合計6種類のクォークが存在することが分かりました.…この分類法は,小学校のクラス分けに例えると分かりやすいでしょう.
クォーク
(上の絵は私が描きました…)

素粒子ってすごくいっぱいある.17種類もある.そのうちの6つの粒子のグループ (クォーク) について,比喩的に説明してくれた図が僕の印象に残っている.で,この本のタイトルでもある「強い力と弱い力」の区別もここに現れてるね (これらの力の働きはこれだけじゃないけど).
400020910
上の絵 (素粒子の一覧) の「レプトン」のグループに対しても弱い力は働く.upクォークをdownクォークに変えるのに似て,弱い力はeをνeに変えたり,μをνμに変えたりたりするらしい.でもレプトンに色はないので,強い力はレプトンには効かないらしい.
もう1つ,面白い箇所があったので引用!現代物理の最先端である相対論と標準模型がどのように異なっているのかに関する分かりやすい比喩.

一般相対論は,アイシュタインという飛び抜けた才能を持つ科学者がほぼ1人で築き上げました.これは実にシンプルかつ壮麗な美しさを持つ理論です.…
それに対して標準模型は,40名以上のノーベル賞受賞者を含む数多くの物理学者たちが,さまざまなアイデアを出し合って作り上げたものです.何か辻褄の合わないことが見つかるたびに別の理論を継ぎ接ぎして,苦労した織り上げたパッチワークのようなものです.

ファイナンス思考


本の趣旨にすごく賛成できる内容だった.最重要な箇所を引用しようか.

会社は将来にわたって稼ぎ出すキャッシュフローの最大化をめざしているのです.
ファイナンス思考では,会社の施策の意義を「その施策が将来にわたって生み出すキャッシュフローの最大化に貢献するのか」という観点から評価します.

財務諸表 (損益計算書・貸借対照表・キャッシュフロー計算書) を公開せねばならない上場企業は,ともするとこの書類の見栄えを良くすることにココロを奪われがちだ.でもそれは本質的ではない.この本は会社の意義を「将来にわたって生み出すキャッシュフローの最大化」だと断言している.
この当否を判断できるほど僕は経営に詳しくないけど,これくらい単純化して物事を考えることはすごく重要だと思う.僕も会社に務めてるけど,この会社のやってることに全然賛成できないことがある.それは実は「将来にわたって生み出すキャッシュフローの最大化」に貢献しない施策をやってると,僕が感じてたからなんだね.

自然言語処理の基本と技術


この本は,目次を見て分かるとおり,「自然言語処理」という広大な分野を横断的に,広く浅く解説してくれる良書.たくさんの独立なトピックがあるから1つに絞ってtakeawayを書き出すのは難しいけど,僕が「なるほど」と思った箇所の1つは「5-5 ベクトル空間モデル」という箇所.
ここで詳細を説明したら紙幅を取りすぎるし,かと言って簡潔な説明も本文中になかったので,僕なりの説明をざっくりと書き残しておこう.これは文書をキーワードで検索するときに使われるテクニック.

  1. まず検索対象の文書のTF-IDFを計算して,文書ベクトルを作っておく (要 正規化).各次元 (?) にどんな単語を選ぶのかに任意性があるから,ここも1つの重要なポイントだね.
  2. 次に検索キーワードのベクトルを,同じようにTF-IDFを使って作る (要 正規化)(ここでのIDFは検索対象の文書のなかでのIDF).
  3. 最後に,文書ベクトルとキーワードベクトルの内積を取って,コサイン類似度を計算する.

まさに「アルゴリズムだなぁ!」という感じ.人間の知性が働いて,いかに文書の類似度を計測するのかについて知恵を絞った結晶がこれという印象.実はTF-IDFについては2017年に聞いたことだけあったから,この本を読んだときに理解しやすかったのかも.初めての概念って理解するの大変だしね,2度めだったからよくわかった.

https://platform.twitter.com/widgets.js
…というのも,こういうことって深層学習でもできそうだなと読んでるときに思ったんだよね.こうやって職人が文書の特徴量を定式化して仕事するのって,以下にも旧態依然な職人的機械学習のやり方に似てるんじゃないかな?とか,この辺を読みながら考えてた.という点でも僕にとって印象的だったのかも!

数学の言葉で世界を見たら


僕の好きな大栗先生の本,2018年には2冊も読んでたのか.この本は最初から面白い.全部で9章で構成されてるけど,最初の話は条件付き確率の話だ.

https://platform.twitter.com/widgets.js
引用するとこんな感じ.

検察側は,シンプソンが長年にわたってブラウンに暴力を奮ってきた証拠を提出した.家庭内暴力が殺人に繋がったという筋書きを立証しようとしたのだ.
ところが,弁護団の1人,ハーバード大学法科大学院のアラン・ダーショビッツ教授は,妻を虐待していた夫の中で妻を殺してしまうのは2500人に1人しかいないという米国連邦捜査局の統計を引用して,家庭内暴力の証拠は無視すべきだと主張した.検察側はこれにうまく反論できず,シンプソンが暴力を奮っていた証拠で殺人についての陪審員の心証を得ることができなかった.
しかし,ダーショビッツ教授の主張は詭弁だ.そして,これをきっぱりと論破できるのが,数学の言葉なんだ.

改行は僕が適当につけてる.ちょっと長い引用だけど,僕はここの部分の最後の「しかし,ダーショビッツ教授の主張は詭弁だ」という文章を読んで,文字通り鳥肌が立った.この展開に,僕は本当に最高に興奮した.めちゃめちゃ面白い!
ちなみに,ここの本当に面白い箇所がなぜ面白いのかについての開設も当然書かれてるから,分からなかった人も安心してほしい.
殺人

  • 事実A: 家庭内暴力を受けている既婚女性が夫に殺される割合は \( \displaystyle\frac{1}{2,500}\) (ダーショビッツ教授が引用したもの)
  • 事実B: 家庭内暴力を受けている既婚女性が夫以外に殺される割合は \( \displaystyle\frac{1}{20,000}\) (ダーショビッツ教授が看過していたもの)
  • 既ににブラウン氏が殺されていることは分かっているので,誰に殺されたのかが議論の焦点
  • 家庭内暴力を受けていて殺された既婚女性が,夫に殺された割合は \(\displaystyle \frac{40}{45}\sim90\%\)

ダーショビッツ教授の詭弁はまさに,この点をごまかしていたんだね.前提が異なるなら,確率を考えなさなければいけないんだ.もう少し分かりやすく,数学的に書くならこうだ.これならもっと見通しが良い.こういった面白い話が9つもあるこの本はとってもお買い得だ!

  • \(\displaystyle P(夫による殺人|家庭内暴力)=\frac{1}{2,500}\sim0.04\%\)
  • \(\displaystyle P(夫による殺人|家庭内暴力\land他殺)=\frac{40}{45}\sim90\%\)

//platform.twitter.com/widgets.js

コメントを残す

Powered by WordPress.com. テーマ: Baskerville 2 by Anders Noren

ページ先頭へ ↑

%d人のブロガーが「いいね」をつけました。