名前はまだない

データ分析とかの備忘録か, 趣味の話か, はたまた

CATEを推定するMeta-Learnersの特徴と比較

はじめに 前にCATEを求めるCausal Treeについての記事を書きました。 saltcooky.hatenablog.com そうなるとMeta-Learnerも気になってきたので、こちらを読みました。 arxiv.org 簡単に内容をまとめます。 事前知識 因果推論 因果推論における詳しい話はこち…

粒子フィルターと粒子スムージングについて簡単に

はじめに 共立出版のOne point シリーズの野村俊一(著)「カルマンフィルタ」を読みました。 カルマンフィルタ ―Rを使った時系列予測と状態空間モデル― (統計学One Point 2)作者:野村 俊一発売日: 2016/09/08メディア: 単行本 最後に粒子フィルタに触れていま…

ベイジアンABテストと停止基準について

はじめに 仕事で、ベイジアンABテストを利用するのが良さそうだなと思い、調べてみましたのでまとめてみます。 ベイジアンABテスト 通常のABテストの懸念点 頻度論に基づく仮説検定では、帰無仮説における母数に対して得られた標本のがどの程度起こりうるか…

基本的な逐次的仮説検定について

はじめに 逐次検定を仕事で使えないかなと思って少し調べてみましたよ。 ちなみに歴史的にみると、ドイツ軍のエニグマ暗号解読の進め方の決定にも用いられていたようです。 en.wikipedia.org 逐次的に検定を行うことの問題点 通常の統計的仮説検定では、事前…

調査観測データの統計科学(傾向スコアのモデリングにおける共変量選択)

前書き 二年前ぐらいに前に、Qiita上で書いて公開していなかった内容を、今更ですがこちらであげます。 はじめに 岩波書店の確率と情報の科学シリーズの星野崇宏 著「調査観測データの統計科学」を読んでいき、まとめていってます。 調査観察データの統計科…

ゼロ過剰ポアソン非負値行列因子分解をRstanで

はじめに こちらの本を読みました。 機械学習スタートアップシリーズ ベイズ推論による機械学習入門作者:須山敦志発売日: 2018/12/07メディア: Kindle版 こちらには非負値行列因子分解(NMF)の話も出てきます。 前から、各要素がガウス分布やポアソン分布に従…

dplyr ver.1.0.0に追加された関数 + α

R

はじめに dplyr ver.1.0.0が公開されました。 dplyr 1.0.0 out now: https://t.co/NDMJmxwllZ. This is the culmination of months of work and we're very excited that it's now available to the world! #rstats— Hadley Wickham (@hadleywickham) 2020年…

TokyoR#85のLTで発表しました。

はじめに 今日、オンラインで開催されたTokyoR#85のLTの枠で少しお話をしました。 お話しした内容は、階層クラスタリングにおける仮説検定の方法を紹介しました。 スライドはこちらです。 speakerdeck.com (いつも通り詰め込みすぎて5分じゃ収まらんだろって…

LiNGAMで因果グラフを探索してみる with R

はじめに Pearl, Raubinときたので、LiNGAMについて知っておこうと思い以下の書籍を読みました。 統計的因果探索 (機械学習プロフェッショナルシリーズ)作者:清水 昌平発売日: 2017/05/25メディア: 単行本(ソフトカバー) いつも通り簡単にまとめて、Rで実…

パネルデータ分析についてのメモ

はじめに パネルデータ分析について興味があり少し調べてみました。 パネルデータ分析と動学的パネルデータについての基本的な部分を簡単にまとめました。 こちらの書籍も目を通してみました。パネルデータを扱うための基本的な注意点などがまとまってり、あ…

構造因果モデルを考え描いて推定する時のメモ(未完)

はじめに Pearl派の因果推論について勉強しています。 勉強した内容の自分用のメモになります。 いつも通り、少しづつ加筆していくスタイルで行きます。 また、理論面は(雰囲気で)なんとなくわかってきたのですが、実際分析を行っていくイメージが持てなかっ…

マルチスケールブートストラップ法によるクラスタリングの有意差検定

はじめに 半年前ぐらいにselective inferenceについてまとめました。 qiita.com その時、クラスタリングにおけるselective inferenceについて触れようと思いましたが、ブートストラップ法を用いたクラスタリングやマルチスケールブートストラップについての…

ブートストラップ法を用いた回帰分析と検定

はじめに Bootstrap法による回帰分析を使うかもしれないので、すこし調べてまとめました。 参考にしたのは、共立出版の「Rで学ぶデータサイエンス ブートストラップ入門」です。 ブートストラップ入門 (Rで学ぶデータサイエンス 4)作者:汪 金芳,桜井 裕仁発…

ローカル差分プライバシー保護ついてすこし調べてみました

はじめに データ分析におけるプライバシー保護に興味があり少しづつ勉強しています。 その中でも差分プライバシーという概念があります、前々から知っていました。 そして、あるイベントでローカル差分プライバシーという概念を知りました。 概要や利用先を…

書籍紹介「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」

はじめに すでに一部の書店や電子書籍では発売されていますが、1月18日に技術評論社から「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」が発売されました。 著者はサイバーエージェント AILabの経済学チームのリーダーの安井さん、監修はホ…

Causal Treeはどうやって個別の因果効果を推定しているのかを整理(しきれなかった)

はじめに ここ最近で機械学習と因果推論の融合が有名になってきました。 その中で、決定木(回帰木)のアルゴリズムを用いて条件付き処置効果(CATE)を推定するCausal Treeという手法の話がでてきています。 しかし、概要を聞いても何をしているのかよくわから…

クラウドソーシングにおける真のラベル推定手法【RStanで実装】

はじめに 最近、教師データを作成する際に質の高いデータが欲しいなとという思いが強くなってきました。 そんなときにクラウドソーシングにおけるラベルの品質管理という話を知りました。 少し調べてみましたので、まとめて用いられている手法を実装してみま…

開発経済学におけるランダム化比較実験を覗いてみました

はじめに 今年のノーベル経済学賞は、開発経済学と呼ばれる途上国の経済問題を分析する分野の研究者三名が受賞をしていました。 www.newsweekjapan.jp 3人の研究成果には、インドの学校における個別の補習指導や、世界各国政府への予防的医薬品向け支出拡大…

関数データ分析について雑にまとめました

はじめに 11月2日に行われた日本行動計量学会秋の行動計量セミナー「関数データ分析の基礎と使い方」に参加してきました。 昨年の統計関連学会連合大会で滋賀大学の松井先生の発表で関数データ分析という方法を知っていましたが、触れる機会はありませんでし…