2015年03月04日
みなさんこんにちは。アナリストの荒木です。
近い将来さまざまな仕事がロボットに置き換わっていくと多くの人が予想しており、そのコアテクノロジーの一つが機械学習です。 GoogleがDeepMindを買収したことで機械学習という言葉も身近になりつつありますが、すでにamazonレコメンドや画像認識などで活躍しています。
そこで今回は、ウェブ担当者が「機械学習ってどんなことをやっているのだろう?」という場合に勉強できるスライドをまとめました。
目次
機械学習でどんなことをしているのかをまとめたスライドです。データのこと・機械学習のこと・評価のこと・分析のことの4部構成で、データマイニングの一連の流れを学ぶことができます。
Googleの猫認識例で有名になった手法を紹介したスライドです。 Deep Learningを使って、自動運転の実用化が加速されたのではないかと考えてます。 このアルゴリズムは、今まで人間が定義していた特徴抽出まで行う点が特徴的です。
利点と欠点がわかりやすくまとまっているスライドです。 SVMはスパム判定や広告配信ロジックなどに幅広く使われている機械学習アルゴリズムです。 GoogleやMicrosoftの特許で頻繁に見かけます。
アヤメのデータを使って、具体的な決定木の作り方を紹介したスライドです。 このアルゴリズムは一連の手続きに沿ってデータを分類することにより、予測や判別を行います。 決定木の出力は理解しやすく、実務レベルで扱いやすいアルゴリズムです。
ロジスティック回帰という手法を紹介したスライドです。 ロジスティック回帰はダイレクトマーケティングで頻繁に使われるアルゴリズムです。 例えば「10代の男性で東京に住んでいる人」がDMに反応する確率を算出できます。
クラスタリングは全体集合を部分集合に分けるアルゴリズムです。 レコメンドエンジンやソーシャルグラフを作成できます。
K-meansというクラスタリングの一つで、全体集合をある程度似ているK個の集合に分割する方法を紹介したスライドです。 45ページからK-mearnsについて概要、プログラミング方法、内容の理解について説明されています。 概要がとても分かりやすくまとまっています。
階層的クラスタリングという手法で、ソーシャルグラフの作り方がまとまっているスライドです。
機械学習はRやpythonで多くのパッケージが提供されているおかげで、無料で手軽に使うことができるようになりました。
今後のウェブ業界でさらに注目されてくる分野ですので「言葉を聞いたことがある」から「ためしに使える」ようになる良いきっかけになればと思います。
最後までご覧いただきありがとうございました!
robots.txtとは
インプレッションとは
Google特許検索でGoogleの特許を探す方法
非承認しても不自然リンクのサンプルとして表示される事例
どうして!? Twitterのアカウントがロックされてしまう理由と解除方法
なぜNAVERまとめはサービス終了したのか!?SEO視点で調べてみた
企業向けFacebookページ(ビジネスアカウント)の作成・管理方法
迷ったらこうする[漢字/ひらがな編] -「出来る/できる」「事/こと」など
知られざるWordの使い方「スタイル、アウトライン」編