名前はまだない

データ分析とかの備忘録か, 趣味の話か, はたまた

統計学

Staggered DIDの利用の感どころを簡単に確認

はじめに こちらでStaggered DIDを初めて知りました。 blog.brainpad.co.jp 介入タイミングが異なる場合のDIDということで、実務でも利用シーンがありそうな問題設計だと思いました。 簡単にまとめたいと思います。 概論 元の論文は以下になります。 arxiv.o…

カオス時系列解析の基礎 with R

はじめに 気になっていたこちらの書籍を読みました。 非線形時系列解析の基礎理論作者:平田 祥人,陳 洛南,合原 一幸東京大学出版会Amazon 元々学生の時に少し齧った内容だったので、非常に楽しかったです。 12章仕立てで様々な話題を広く薄く扱っており、読…

Immortal time bias(不死時間バイアス)の確認と対処を簡単に

はじめに target trial emulationについてまとめた中で不死時間バイアス:Immortal time biasを知りました。 Rのコードは以下の記事をかなりパクる参考にさせてもらっている。 moratoriamuo.hatenablog.com moratoriamuo.hatenablog.com 不死時間バイアス フ…

Target trial emulationについて簡単にまとめる

はじめに Target trial emulationという考え方を少し前に知りました。 www.krsk-phs.com 面白そうなので、メモとしてまとめておきます。 (上記を中心とした参考資料の方が適切でわかりやすいのそちらを参照されたし) Target trial emulation Target trial em…

Wild Bootstrapの基本について

はじめに 最近、こちらの書籍を読みました。 計量経済学---ミクロデータ分析へのいざない作者:末石 直也日本評論社Amazon わかりやすい理論の説明に合わせて、実際のデータ分析行う際の視点に立った解説が端々にあり、非常に良い本でした。 その中で、第8章…

xgboostによる多重代入法:mixgb パッケージ

はじめに twitterで以下のツイートを見かけました。 R :: mixgb https://t.co/TuD7bEU9hTmixgb は XGBoost を使用した多重代入法の R XGBoost による予測値に対して,predictive mean matching (PMM) で補完をしており,https://t.co/BYkjF6eg0Eにあるような…

Targeted Maximum Likelihood Estimation:TMLEについて

はじめに 数年前のセミナーか学会でTMLEの概要の説明を聞いたことがあります。 しかし、詳細については理解していないため、今回簡単にまとめたいと思います。 概要 このページが非常に丁寧に方法論と手順を説明していました。 www.khstats.com 特にこちらの…

固定効果モデルに関するメモ

はじめに こちらの共立出版の固定効果モデルを読みました。 固定効果モデル (計量分析One Point)作者:Paul D. Allison共立出版Amazon 感想としては以下のようになります。 様々な固定効果モデルの気をつける場所が理解できる 複数のパターンのモデルを比較解…

RstanでWAICとWBICの算出

はじめに 情報量基準の復讐も兼ねて簡単にまとめます。 こちらの内容をまとめたものです。 社会科学のための ベイズ統計モデリング (統計ライブラリー )作者:浜田 宏,石田 淳,清水 裕士発売日: 2019/12/01メディア: 単行本(ソフトカバー) 事前設定 ある確…

スタイン推定量と小地域推定の基本

はじめに 小地域推定とスタイン推定量について興味を持ったので、簡単にメモをまとめます。 参考になったのは、これらの資料やページです。 小地域推定についてのノート [理論編] 小地域推定のためのノート [実習編] 推定における縮小法の展開—高次元解析と…

ベイジアンABテストと停止基準について

はじめに 仕事で、ベイジアンABテストを利用するのが良さそうだなと思い、調べてみましたのでまとめてみます。 ベイジアンABテスト 通常のABテストの懸念点 頻度論に基づく仮説検定では、帰無仮説における母数に対して得られた標本のがどの程度起こりうるか…

基本的な逐次的仮説検定について

はじめに 逐次検定を仕事で使えないかなと思って少し調べてみましたよ。 ちなみに歴史的にみると、ドイツ軍のエニグマ暗号解読の進め方の決定にも用いられていたようです。 en.wikipedia.org 逐次的に検定を行うことの問題点 通常の統計的仮説検定では、事前…

ゼロ過剰ポアソン非負値行列因子分解をRstanで

はじめに こちらの本を読みました。 機械学習スタートアップシリーズ ベイズ推論による機械学習入門作者:須山敦志発売日: 2018/12/07メディア: Kindle版 こちらには非負値行列因子分解(NMF)の話も出てきます。 前から、各要素がガウス分布やポアソン分布に従…

マルチスケールブートストラップ法によるクラスタリングの有意差検定

はじめに 半年前ぐらいにselective inferenceについてまとめました。 qiita.com その時、クラスタリングにおけるselective inferenceについて触れようと思いましたが、ブートストラップ法を用いたクラスタリングやマルチスケールブートストラップについての…

ブートストラップ法を用いた回帰分析と検定

はじめに Bootstrap法による回帰分析を使うかもしれないので、すこし調べてまとめました。 参考にしたのは、共立出版の「Rで学ぶデータサイエンス ブートストラップ入門」です。 ブートストラップ入門 (Rで学ぶデータサイエンス 4)作者:汪 金芳,桜井 裕仁発…

書籍紹介「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」

はじめに すでに一部の書店や電子書籍では発売されていますが、1月18日に技術評論社から「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」が発売されました。 著者はサイバーエージェント AILabの経済学チームのリーダーの安井さん、監修はホ…

クラウドソーシングにおける真のラベル推定手法【RStanで実装】

はじめに 最近、教師データを作成する際に質の高いデータが欲しいなとという思いが強くなってきました。 そんなときにクラウドソーシングにおけるラベルの品質管理という話を知りました。 少し調べてみましたので、まとめて用いられている手法を実装してみま…

開発経済学におけるランダム化比較実験を覗いてみました

はじめに 今年のノーベル経済学賞は、開発経済学と呼ばれる途上国の経済問題を分析する分野の研究者三名が受賞をしていました。 www.newsweekjapan.jp 3人の研究成果には、インドの学校における個別の補習指導や、世界各国政府への予防的医薬品向け支出拡大…