面白かったデータサイエンス関係ブログ

渋谷駅前で働くデータサイエンティストのブログ。多分超有名。人のブログを続けて見ることはあまりないが、これは読み始めると止まらなかった。おかけで会議をすっぽかした。実務の面からデータサイエンスを解説してくれている。技術理論とビジネス実務がバランスしているようで技術に傾くという絶妙な感覚で書かれている。また、「統計的因果推論 」についても書かれており、「なんでそうなるの?」というサイエンスの思考を大事にしていることが窺い知れる点が好き。データサイエンス界隈の人を「データサイエンティスト(アナリスト)」、「機械学習エンジニア」、「おしゃべり課題解決コンサル おじさん」の3分類にクライファイしている点もセンスを感じた。

 

 

データロボット社のブログ。データロボットは、ウェブベースの機械学習ツールで、展示会でも大きなブースを設けているため、特に企業関係の人に取ってはおそらく有名。データロボットは、誰でも最先端の機械学習が使えるように、機能を絞り込み、インターフェイスを簡素化し、パラメータ調整やモデル選択の自動化している。「データサイエンスの民主化」をうたっていつつもライセンス費用をガンガン上げてきたのはさておき、確かに使いやすい。本記事は、そのデータロボットを使った要因分析の解説記事。「交絡がある中での介入の効果をみたい」という悩ましい問題を解決する方法について書かれている。傾向スコアによって交絡因子を1つにまとめ、傾向スコアマッチングによって交絡の影響を抑え、介入の効果を分析するという手順。理論1、2と実践の3つに分かれているが、必要十分に書かれて読みやすい。マルチコ(多重共線性)についてもきちんと触れられており議論に隙がない。どうしてこのブログに興味をもったかというと、まわりでここまでデータロボットを使いこなしている人を見かけなかったため。教えてあげよう。

 


AI 専門のnews media のAINOW。技術だけでなくカンファレンス情報も載してくれている。また、AIに対する批判記事やデータサイエンティストのネガティブな面も取り上げており、ためになる。そして、最先端のAI記事を人力で仕分けているという実利志向が良い。更新されればチェックするようにしている。続けていってほしい。