ヒト

膨大なデータの海から未来のオールアバウトを見出すデータエンジニア・横山

オールアバウトの成長や変革に寄与した人物にお話を伺い、仕事に対する価値観や取り組みの詳細を深堀りしていく「プレイヤーズ」。今回は2016年エンジニア部門における通期MVPに輝いた、システム部 データマネジメントグループ データエンジニアの横山賢治さんをご紹介します。


横山 賢治(よこやま けんじ)
株式会社オールアバウト システム部 データマネジメントグループ

2013年2月、オールアバウトへ入社。派遣プログラマや社内SE、パソコンスクールの講師等を経て集計チームにたどり着く。鳩をトレードマークとして、古典SFの小説を片手に猫と暮らす日々を満喫中。

■データエンジニアって、どんな仕事?

—はじめに、横山さんのこれまでのキャリアについて教えてください。

大学卒業後、派遣のプログラマとして働いていました。2000年頃から長期の現場に入るようになり、サーバーサイドのアンチウイルスソフトの企業ではUNIXに深く携わりましたし、携帯電話会社では社内SEとしてグループネットワークシステムの保守・管理をしていました。そこから2013年2月にオールアバウトへ転職しました。

—オールアバウトに入社を決めたのは、なぜですか?

ずっとログを触ってみたいと思っていたんです。データマイニングという単語を初めて聞いたときに、「これだ!」と思いました。ユーザーの行動ログを見れば、何が必要とされていて、何が足りないのかも一発でわかるはずだと。そんなときに、オールアバウトで集計システムの担当を募集していたんです。総合情報サイト「All About」では、1,300もの幅広い領域にわたって17万本の記事を扱っているので、普通のWEBメディアでは見られないデータが見えるのではないかと考え、入社しました。

—データエンジニアという職種はあまり聞きなれないのですが、データサイエンティストとの間には、どんな違いがあるのですか?

データサイエンティストとは主にデータを分析する人のことを言いますが、その業務内容の8〜9割が“データを集めて加工すること”と言われるほど、前処理にものすごい手間がかかっているんですね。データエンジニアは、そこをサポートする仕事です。例えば、データエンジニアがフロント側のWebアプリやメディア内に集計システムを入れておくことで、データサイエンティストがSQLを叩けば、一発でデータが届くようになる、といった具合です。

自分は分析に興味があったものの、データサイエンティストになるとデータを集めるところで苦労するのは目に見えていました。だったらデータを集めるところから始めて、そのあと分析もできるようになろうと思ったんです。オールアバウトでは最近、落ち着いてデータを分析できる環境が揃ってきたので、まさにこれから、本来やりたかったデータサイエンティストの業務にも入っていけるというところですね。

—横山さんのように、バックエンドのエンジニアからデータエンジニアを経て、データサイエンティストになるというキャリアパスは、よくあるケースなのですか?

そうですね。以前、同じ質問を詳しい人にしてみたところ、営業サイド、もしくはエンジニアサイドからデータサイエンティストになるパターンは、50:50くらいだということでした。“何のためにデータ分析をするのか、よく知っていること”と“どうやればできるのか、よく知っていること”。この2つのスキルが合わさってこそのデータサイエンティストなので、両方からの流れがあるみたいですね。

■レガシーシステムからの脱却で2016年通期MVP受賞

—横山さんが所属しているデータマネジメントグループ(DMG)とは、どんな部署ですか?

社内独自の集計システムとGoogle Analyticsの集計の仕組みを一手に担い、編集や営業に対して、それぞれに必要な数字を報告できるようにするのがメインタスクです。最近では、Google AnalyticsをGoogle Analytics 360 Suiteにしたので、それを普及するための社内勉強会も始めています。メンバー構成としては、データエンジニア寄りの人が自分を含めて4人、社内のサポート側に寄っている人が2人です。

—独自の集計システムとは、どんなものですか?

これは初期からオールアバウトで独自開発していた集計システムで、編集や営業がデータを見るためのダッシュボードを含んでいます。ここからクライアントに提出するレポートの生成もできるようになっています。

今は、今後のメインとなるものをG Suiteで作っているのですが、Google Analyticsの数値をDBに保存したものをGoogle Data Studioでダッシュボード化させています。実は、これも暫定版で、いずれTableauにしようかと思っています。裏側はシステム化してあって、このままTableauでも使えるはずなので。

—最新技術を積極的に取り入れていらっしゃるのですね。

オールアバウトは創業16年目の会社のため、当時のシステムに支障をきたしている部分もあるので、システム部として全面的に見直しているところです。自分が入社した当時にはHadoopが運用されていたのですが、作った人が退職していて、ただ動いているだけというつらい状態でした(笑)。つぎはぎだらけの、まさにレガシーシステムですね。

そこで社内集計システムをHadoopからトレジャーデータにシステムを移行させ、さらに関連するDBも以前から使用しているSQL ServerからMySQLに切り変えることで、筋の通った設計思想でのビルドが終わったところです。
非常に拡張しやすい状態になっているので、BigQueryとGoogle DataFlowを使った機械学習のサービスへの組み込みも行っています。

—そうした一連の取り組みが、エンジニア部門における2016年通期のMVP受賞につながったそうですが、どんなところで苦労されましたか?

苦労したことはたくさんあります。誰にも中身がよくわかっていなかった社内集計システムを、ひとつずつ紐解いてお引っ越しができる状態にするまでも大変でしたし、たくさんのツールを組み合わせていたので、それらをオーソライズした設計で一本化するのにも苦労しました。

あとは、新しいシステムと古いシステムにデータの整合性を持たせるために、トラブルが発生することを予見して、シームレスに移行できるよう、簡単に切り替えできる並行稼働の手順を作ったことも、なかなか大変でしたね。

—新しいシステムへ移行したことで、どんなメリットがありましたか?

Hadoopで運用していた頃は、ハードウェアのトラブルが月に1度は起きるような状態でしたので、インフラチームにお願いして夜間作業を行ってもらうことも多かったのですが、トレジャーデータに移行してからは安定稼働しています。それに、年次のKPI数値等、以前は1時間掛かった集計が10分で終わってしまって驚きました。

■データエンジニアからデータサイエンティストへ

—横山さんは部内の“頼れるお兄さん的な存在”だということですが、なぜそのように慕われているのだと思いますか?

何か不可解なトラブルがあったときに、そのシステムがどういう理念で動いているのか、という根っこから考えることで、原因を見つけられた経験が何度かあるからじゃないかなと。そのときに、原因にたどり着くまで掘っていくための考え方を、ちゃんと説明するようにはしています。トラブルが起きない方がみんな幸せに暮らせますからね。

それとDMGってトラブルの最終的な火消し役になることが多いんです。なので、トラブルが発生する原因に向き合うのは習慣化していて、それをチームでも共有し、次回以降の設計に活かしトラブル回避に努めています。

—他部署の業務への理解が深い点も周囲から評価されていますが、そのために心がけていることがあれば、教えてください。

他部署から相談を受けたときに、やるべきことが明確ではない場合もあるので、「会社として、なぜそれをやる必要があるのか」「それをやった場合にどんなことが起きる可能性があるか」といったように、役職的に2段階上の視点から見るように意識しています。

特に管理職を目指しているからというわけではなく、そこまで考えて動くのがお給料分かなと思っているからです。前職が社内SEだったので、社内のシステムに対する責任を持っていたこともあり、上段から物事を見る癖がついているのかもしれませんね。

—横山さんはオンラインゲームやSF小説がお好きだそうですが、そういった趣味の世界が仕事に活かされているなと感じることはありますか?

数十人のギルドで会社経営をするオンラインゲームでは、「こういう風に権限を分配しておけば、誰かがこなくなっても他の人がフォローできるな」と考えながら権限設計をしていたりとか、小学生時代には“第二次世界大戦の補給線を作る”というPC88のゲームにハマっていて、メモ帳にみっちり数式を書きながら綿密に計画を練っていたりとか……。長編SF小説が好きな理由も、壮大なスケールの構想の中に、細かいところがしっかり作り込んであるところなので、根っからの設計好きみたいです(笑)

—幅広い知識が必要だと思いますが、横山さんはデータエンジニアとして、どのように知識のアップデートを図っていますか?

新しいサービスが出て使えそうだと思ったら、簡単な使い方を見て、どんなときに使えるのか把握しておくくらいです。大昔から変わらないインターネットの基本的な思想だけはちゃんと抑えてありますが、技術はすぐに古くなるので、JavaScriptの新しいフレームワークのような細かい話は、バッサリ切り捨てています。RFCやW3Cといった世界標準のベースとなる知識があれば、いくらでも応用が利きますので。

逆に、HadoopのMapReduceのような、たとえHadoopがなくなってもその考え方は生きていく、という基礎概念に近い考え方は長続きしますので、そのような新しい概念が出てきたときには、がっつり勉強するようにしています。

—安定運用のフェーズに入ったことで、次のDMGはどこを目指していきますか?

上長ともよく話していることですが、自分が入った5年前はDMGではなく集計チームという名前でした。そこから5年間でやっとインフラが整い、集計システムができあがったので、今後はさらに一歩踏み込んだデータの分析ができるチームになろうとしています。

具体的には、データエンジニアとデータサイエンティストとプランナーの3軸でDMGを構成して、データエンジニアが出したデータをもとにデータサイエンティストが施策を考え、プランナーと共に実現していくというイメージです。編集や営業の中にプランナー的な役割の人はいますが、今後はDMGからプランナー相当の機能も提供していきたいと考えています。

—最後に、横山さんが思い描く、データエンジニアの理想像は?

不可解な動作が起きたときに原因を突きとめられるよう、根っことなる技術をしっかりと知った上で、ビジネスを回すために必要な設計ができることです。これまでは、そこからさらに自分たちでコードを書いて実現する必要がありましたが、技術の進化によって、ほとんどコーディング無しで実現できるようになっていくと思うので、今後はその空いた時間を使ってデータサイエンティスト寄りの、もっと企画側の話に踏み込んでいきたいなと思っています。
(取材・文 野本 纏花)

■システム部の採用情報はこちら

44 件

おすすめの記事

ヒト <リーダーズvol.12> 不確実な世の中で”長く続く会社”になるために

今年3月の決算説明会にて、7期連続増収・過去最高売上高更新を発表したオールアバウト。2020年に迎える創業20周年に向けて、今、順調に業績を拡大している背景について、代表の江幡さんに...

専門家 お洒落かっ!デートコースとしても使える男同士の恵比寿「はしご酒」プランを、山田ゴメスに聞いてみた

総合情報サイト「All About」が誇る900人の専門家(ガイド)に色々聞いて、教えてもらうこちらのコーナー。 第3弾は、All About「男の夜遊び」ガイドの山田ゴメスさんに、...

専門家 “あるもの” で「サンタ専用ソリ」をつくったら意外とよく出来た

総合情報サイト「All About」が誇る900人の専門家(ガイド)に色々聞いて、教えてもらうこちらのコーナー。 今回は、All About「工作・手作りグッズ」ガイドのトモコ ガル...

人気記事ランキング

専門家 “あるもの” で「サンタ専用ソリ」をつくったら意外とよく出来た

総合情報サイト「All About」が誇る900人の専門家(ガイド)に色々聞いて、教えてもらうこちらのコーナー。 今回は、All About「工作・手作りグッズ」ガイドのトモコ ガル...

コト 今年は恵比寿もアツかった……オールアバウトのハロウィンパーティーをレポート

ハロウィンといえば“渋谷ハロウィン”が話題となっていましたが、恵比寿のハロウィンはもっと熱い?! ということで、先日オールアバウト社内で開催されたハロウィンパーティーの様子をレポート...

お知らせ 2019年3月期第2四半期決算説明会をおこないました。

2018年11月8日に行われた、株式会社オールアバウト平成31年3月期 第2四半期 決算説明会資料の内容を書き起こしでお伝えします。