名前はまだない

データ分析とかの備忘録か, 趣味の話か, はたまた

データ分析

生存時間分析のシェーンフィールド残差について

はじめに 前から気になっていたこちらの書籍を読みました。 イベント・ヒストリー分析 (計量分析One Point)作者:Paul D. Allison共立出版Amazon 行間が怪しい部分も多かったですが、このシリーズらしく様々な要素を解説しているので、新しく知れる視点もあり…

Staggered DIDの利用の感どころを簡単に確認

はじめに こちらでStaggered DIDを初めて知りました。 blog.brainpad.co.jp 介入タイミングが異なる場合のDIDということで、実務でも利用シーンがありそうな問題設計だと思いました。 簡単にまとめたいと思います。 概論 元の論文は以下になります。 arxiv.o…

Immortal time bias(不死時間バイアス)の確認と対処を簡単に

はじめに target trial emulationについてまとめた中で不死時間バイアス:Immortal time biasを知りました。 Rのコードは以下の記事をかなりパクる参考にさせてもらっている。 moratoriamuo.hatenablog.com moratoriamuo.hatenablog.com 不死時間バイアス フ…

MetaのMMMパッケージ Robynを試してみる

はじめに 概要 Robynを試す インストール モデルの設定 モデルの推定 パレート最適な投資内容を抽出 アロケーションの最適化 投資額を設定したアロケーションの最適化 所感 参考 はじめに Metaが開発しているMMMパッケージの存在を知りました。 github.com f…

マーケティング・ミックス・モデリングに触れてみる

はじめに マーケティング・ミックス・モデリングに興味を持ったので、簡単に触れてみます。 メモとして残しておきます。 コードを動かした結果は少しづつ追加していきます。 基本的なモデル マーケティング・ミックス・モデリングではいくつかの効果を考える…

因果推論における未観測の共変量の影響を考える感度分析

はじめに 数年前に岩波書店の確率と情報の科学シリーズの星野崇宏 著「調査観測データの統計科学」を読んでいきまとめていました。 調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)作者:星野 崇宏岩波書店Amazon …

複雑ネットワークの基本

はじめに ネットワーク分析に興味をもち過去にこちらの書籍を読み、 ネットワーク分析 第2版 (Rで学ぶデータサイエンス)作者:努, 鈴木発売日: 2017/05/24メディア: 単行本 以下のような記事を書いていました。 qiita.com qiita.com 複雑ネットワークについて…

RstanでWAICとWBICの算出

はじめに 情報量基準の復讐も兼ねて簡単にまとめます。 こちらの内容をまとめたものです。 社会科学のための ベイズ統計モデリング (統計ライブラリー )作者:浜田 宏,石田 淳,清水 裕士発売日: 2019/12/01メディア: 単行本(ソフトカバー) 事前設定 ある確…

スタイン推定量と小地域推定の基本

はじめに 小地域推定とスタイン推定量について興味を持ったので、簡単にメモをまとめます。 参考になったのは、これらの資料やページです。 小地域推定についてのノート [理論編] 小地域推定のためのノート [実習編] 推定における縮小法の展開—高次元解析と…

Rstanで動的因子分析

はじめに こちらの書籍を読んでいます。 Rによるベイジアン動的線形モデル (統計ライブラリー)作者:G.ペトリス,S.ペトローネ,P.カンパニョーリ発売日: 2013/05/08メディア: 単行本 その中で、動的因子分析について一部触れていたので、packageとRstanでの実…

計量時系列分析まとめ【単位根過程と共和分過程】

はじめに 色々と発展的な時系列系の分析手法に手を付けようとすると、基本的な時系列分析についての知識が抜け抜けだったので、初心に帰って沖田先生の本に目を通しました。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)作者:竜義, 沖本発…

LiNGAMで因果グラフを探索してみる with R

はじめに Pearl, Raubinときたので、LiNGAMについて知っておこうと思い以下の書籍を読みました。 統計的因果探索 (機械学習プロフェッショナルシリーズ)作者:清水 昌平発売日: 2017/05/25メディア: 単行本(ソフトカバー) いつも通り簡単にまとめて、Rで実…

パネルデータ分析についてのメモ

はじめに パネルデータ分析について興味があり少し調べてみました。 パネルデータ分析と動学的パネルデータについての基本的な部分を簡単にまとめました。 こちらの書籍も目を通してみました。パネルデータを扱うための基本的な注意点などがまとまってり、あ…

構造因果モデルを考え描いて推定する時のメモ(未完)

はじめに Pearl派の因果推論について勉強しています。 勉強した内容の自分用のメモになります。 いつも通り、少しづつ加筆していくスタイルで行きます。 また、理論面は(雰囲気で)なんとなくわかってきたのですが、実際分析を行っていくイメージが持てなかっ…

マルチスケールブートストラップ法によるクラスタリングの有意差検定

はじめに 半年前ぐらいにselective inferenceについてまとめました。 qiita.com その時、クラスタリングにおけるselective inferenceについて触れようと思いましたが、ブートストラップ法を用いたクラスタリングやマルチスケールブートストラップについての…

ブートストラップ法を用いた回帰分析と検定

はじめに Bootstrap法による回帰分析を使うかもしれないので、すこし調べてまとめました。 参考にしたのは、共立出版の「Rで学ぶデータサイエンス ブートストラップ入門」です。 ブートストラップ入門 (Rで学ぶデータサイエンス 4)作者:汪 金芳,桜井 裕仁発…

ローカル差分プライバシー保護ついてすこし調べてみました

はじめに データ分析におけるプライバシー保護に興味があり少しづつ勉強しています。 その中でも差分プライバシーという概念があります、前々から知っていました。 そして、あるイベントでローカル差分プライバシーという概念を知りました。 概要や利用先を…

Causal Treeはどうやって個別の因果効果を推定しているのかを整理(しきれなかった)

はじめに ここ最近で機械学習と因果推論の融合が有名になってきました。 その中で、決定木(回帰木)のアルゴリズムを用いて条件付き処置効果(CATE)を推定するCausal Treeという手法の話がでてきています。 しかし、概要を聞いても何をしているのかよくわから…

開発経済学におけるランダム化比較実験を覗いてみました

はじめに 今年のノーベル経済学賞は、開発経済学と呼ばれる途上国の経済問題を分析する分野の研究者三名が受賞をしていました。 www.newsweekjapan.jp 3人の研究成果には、インドの学校における個別の補習指導や、世界各国政府への予防的医薬品向け支出拡大…

関数データ分析について雑にまとめました

はじめに 11月2日に行われた日本行動計量学会秋の行動計量セミナー「関数データ分析の基礎と使い方」に参加してきました。 昨年の統計関連学会連合大会で滋賀大学の松井先生の発表で関数データ分析という方法を知っていましたが、触れる機会はありませんでし…