社会で活躍する修士・博士・ポスドクのキャリアストーリー
社会インフラの予知保全を技術で支える。AI/機械学習を用いて水道管の劣化状況を予測するソフトウェアサービスを提供するFractaでデータサイエンティストとして働く

Fractaは「AIを通じて社会インフラの未来を構築する」というミッションのもと、米国カリフォルニア州シリコンバレーで2015年に設立されたソフトウェア技術ベンチャー企業です。古くは100年以上前に布設され、現在グローバルなレベルで老朽化が進む水道・ガス・電車などの社会インフラの老朽化を社会問題と捉え、既存の社会インフラを再構成することを目指して、FractaではAI/機械学習を用いてまずは水道管の劣化状況を予測するソフトウェアサービスを提供しています。
そんなFractaにて、データサイエンティストとしてAI/機械学習アルゴリズムの開発に従事する蓑田和麻氏に、Fractaの事業の意義や課題について伺いました。

Fractaに関する求人情報はこちら

蓑田 和麻(Kazuma Minoda)

Fracta Japan株式会社
データサイエンティスト

物理モデルの説明から、結果データから逆算する購買行動の分析へ。データを使って分析・課題解決する仕事への興味

── まず大学入学前に興味を持っていたことや、大学での専攻について教えてください。

蓑田小さい頃からそろばんをやっていたこともあってもともと数学が得意で、高校生の頃は数学オリンピックに参加したりもしていました。好きだった教科は数学と物理でしたが、図形や幾何的なものよりは、微積や解析学の理論が好きで、それを応用する先が物理という感じでした。

学部は理工学部、学科が管理工学科です。経営工学や経済を理系的または数理的な側面から科学していく、という分野でした。学科は物理学科と悩みましたが、興味が物理的な現象にあるというよりは裏に潜んでいるロジックに興味があることに気付き、加えて純粋数学よりは応用領域で、と考えて選択しました。ちょうど統計が世の中で使われ始めたタイミングが大学3年生の頃で、その当時有名だったのが「スーパーマーケットでおむつの近くにビールを置いておくと売上が上がる」という統計データ分析のキャッチーな話です。そこから統計学に興味を持ち始め、統計学系の研究室に入りました。現在の業務である機械学習に興味を持ち始めたのは大学院に入った頃ですが、理論寄りの統計を扱っている研究室だったので機械学習は隣接した分野で、自分でも色々調べたり、インターンシップにも行ったりしました。

── 研究テーマの内容と、なぜそのテーマを選択されたのか教えてください。

蓑田研究では確率過程における潜在クラス付きスイッチングモデルのパラメータ推定手法を扱いました。普通のマルコフ過程では、時間に依存せず、現在の状態だけで将来の状況が決定される、という性質を仮定しています。それに対して扱ったのは、直接観測できない潜在クラスを複数種類(確率1で同じ状態を周回するロイヤリティクラス、一様分布で状態変化するスイッチングクラス)、複数個導入するモデルです。潜在クラスのパラメータは制約仮定の元で複数個になると解析的に解けずシミュレーションで解く必要があるのですが、パラメータの収束が保証されない探索的なアルゴリズムしか開発されておらず、一番大事なのは初期値と言われていて、パラメータを更新していく出発点を間違えてしまうと誤った結果に収束してしまうのが課題でした。そこで初期値の設定をどのようにすれば局所最適化に陥らないか、それを解決するための手法を提案しました。

そのテーマを選んだ理由は、企業との共同研究でデータが利用でき、内容も分析しやすいことが挙げられます。人の行動を定式化できることは行動経済学のような分野にも紐づいていて面白く、同時にその限界を知りたいという想いもありました。内容としては理論寄りですが、実際に扱ったお茶の購買分析データではそれらしい結果、例えば有名ブランドの商品はロイヤリティ層が少なくスイッチングで入っている人が多く、逆にニッチな商品はロイヤリティ層が占めていてスイッチングが起きにくいなど、現実をうまく表現できたと感じました。

社会問題の解決という意義の大きな取り組みと、水×機械学習という異色の組み合わせへの興味から転職を決意

── 就職活動ではどのような企業を検討しましたか?

蓑田実は就職活動はあまりしていませんでした。研究でお付き合いのあった企業で、業務に近い形でデータの見方や業界の知識を教えてもらうなどしたほかは、友達に誘われて修士1年の冬からリクルートでインターンをした程度で、説明会もほとんど参加せずしっかりとした就職活動はしませんでした。

それでも就職先を決めたのは、データを使って分析をして課題を解決していくプロセスが見えたというか、生々しいビジネス課題や社会を動かしているものに対して、解決のために数理的なアプローチが通じると思えた面白さが挙げられます。大学の研究での課題は数理的なアプローチでしか解けないもので、なおかつ解けることが保証されていませんが、ビジネス課題では、例えばCVR(コンバージョン率)が低いのでCVRを5%上げたいという泥臭い課題に対しても、数理的なアプローチが通用するというギャップが面白かったです。

── 新卒入社された先ではどのような業務をされていましたか?

蓑田結局、新卒でリクルートに入社しました。リクルートは面白くていい会社だと思っています。特に私のいた部署はR&Dを専門としていたので、自分がやりたいことを手を挙げてやることができたし、他では経験できないことを経験させてもらったと思っています。具体的には、自分で手を動かすだけではなく、予算を管理し、人を採用し、プロジェクトを進行させ、P/Lも管理していくという、社内起業のような経験をすることができました。
テーマも自分で選定していました。例えば人事部だと毎年何万通もの新卒採用のエントリーシートがくるのですが、判別に膨大な時間がかかります。ただ人事のプロが内容を読めば誰が良いか簡単に分かる。そこに解決すべき課題を見出しました。エントリーシートはパターン化されているものなので機械学習的なアプローチで「プロの目」に対抗できるのではないかと考え、自然言語処理分野のシステム開発を行いました。その他にもリクルートが出している各種原稿の校閲システムで原稿チェックにかかる期間を短縮するなど、データを使って直接売上に繋がる部分だけではなく、リクルート社内の作業を効率化する取り組みも推進してきました。

── その後、Fractaに転職されたきっかけを教えてください。

蓑田リクルートを辞める気は全くありませんでしたが、Fractaからお誘いを受けたことがきっかけです。大学時代の友人がグループ会社であるFracta Leap(会社HPへのリンク)にいて、Fractaのデータサイエンティストを探しているという話に、私を候補として挙げてくれたようです。Fracta本社(米国カリフォルニア州)のCEOである加藤から電話を貰いました。
加藤は水に対して強い課題意識を持っていて、人間が生活するうえで必要不可欠なインフラなのに、このまま放置したら手が付けられなくなる。このままでは日本でもアメリカでも水道料金が高くて、水が使えない・水が飲めない人が出てくるという課題感を強い熱量で語っていました。自分を振り返ってみると、それまで社会問題に真正面からアプローチしたことはありませんでした。もしかしたら「社会問題・インフラ・水」と「機械学習」という、全く別物だと考えていたことの掛け合わせに心を動かされたのかも知れません。研究で行ったような購買行動の分析や、他の事業会社で扱われるようなビジネステーマも重要で、個人的に面白かったし、データでアプローチして解決できる。でも社会問題ではなかったと気付かされました。当時の私の頭には「水」という発想は全くありませんでしたが、そこに自分の技術でソリューションを提供し、水のインフラを維持するという社会的使命にチャレンジしてみたいと素直に思いました。

社会インフラの抱える課題を本当に解決できたと実感できることがゴール

── 現在Fractaで取り組まれていることについて教えてください。

蓑田現在は水道管の劣化予測のアルゴリズムを開発しています。その開発とアルゴリズム提供に伴う課題と日々向き合っています。
難しいポイントが大きく2つあり、一つ目はテクニカル面で、単純な機械学習に加えて未開拓のGIS(地理情報システム)のデータを絡ませていることです。他の分野、例えばマーケティングであればレコメンド専用の学会、自然言語処理や画像処理専門の分野でも専門の学会があります。しかし機械学習とGISを関連付ける分野は文献が非常に少なく、社内にいるGISのスペシャリストの知識に、私の機械学習の知識とGISのリサーチ結果を掛け合わせ、どのソリューションが最適なのかを模索している状態にあります。そこが技術的にも面白くかつ難しいところで、日々奮闘しています。

二つ目は、ビジネスの適用の難しさが挙げられます。適用先がアメリカの場合、水道会社は民間企業が多いとはいえ元をたどれば国の事業ですし、日本だと自治体がカウンターパートになります。リクルートで仕事をしていた時とは環境が異なるので、ニーズや課題は何であるかをビジネスや営業の方と連携しながら特定し、それを実現するために必要なアルゴリズムを試しながら、いいものを製品に組み込んでいくという仕事の進め方をしています。例えアルゴリズム自体が良いものであっても、最終的なアウトプットとしてどういう製品にしていきたいか、ユーザーの立場を考えながら実装していく必要があります。

── 日々の業務で面白いと思うポイントはありますか?

蓑田技術的なトピックが最近の興味で、中でも先ほど挙げたGIS×機械学習にとても興味があります。基本的に機械学習を用いるソリューションは、各データについてある程度独立関係を仮定しています。もちろん理論的には証明されていませんが、例えばウェブのデータを使う場合、ユーザーIDが別であれば別の人の行動履歴なので、独立的な関係がある程度保証されているものとして機械学習やデータ解析のスタートラインに立っています。一方、GISにはいわゆる「空間的自己相関関係(Spatial Autocorrelation)」と言われる概念が存在しており、簡単に言えば地理的に近いものというのは似たようなデータを持ちやすい傾向を持つ、というものです。直観的にも分かりやすいですが、近くの地点は同じような傾向、離れていれば異なる傾向、というイメージです。それを一地点ごとに全く別の独立した情報と見なしてモデリングすると当然ながら問題が発生します。古典的な統計手法であれば空間的自己相関関係の検定や処理方法は存在するので、私が扱っているGISデータも緯度経度の情報から「近さ」を定義することはできます。しかし機械学習で用いるようなモデリングやノンパラメトリックなモデリングにはそのような手法がなじまず、どう組み込むべきか、面白いテーマとして今取り組んでいます。これは論文が書けるレベルの研究テーマだと思います。

── 入社のきっかけともなった「社会問題」を扱っているという点に関して、入社後の実感はどうですか?

蓑田社会問題を扱っているのは確かだが、成果を実感するには至っていない、と言うのが正直な感想です。例えば、愛知県豊田市にソフトウェアを提供しているのですが、豊田市に行って漏水調査の現場を視察したり、豊田市の職員の方と話をしたり、社会問題に触れている実感はあります。データの管理も含めて本当にアナログな世界なので、このまま画期的なソリューションが提供されないと将来大変なことになる、ということは容易に想像がつきます。しかし、これをいま解決できている証左はありません。もちろん解決の方向に向かっているのは間違いないですが、やはり水道料金が下がる、水道のメンテナンスコストが減る、といったことが明確な成果として現れないとまだ実感できないと思っています。事業はまだ始まったばかりで、インフラ相手なので非常に長い時間がかかることは重々承知ですが、そこまでやり遂げることが会社のミッションだと考えています。

── 自分本位の感覚だけでなく、お客さまから見て結果にならなければ、という姿勢・情熱を持っていらっしゃるのは素晴らしいことですね。

答えのない課題解決に取り組むプロセスこそが、Fractaの仕事

── 大学院で学んだことや研究を通して身に着けたことで役に立っていると思うことはありますか?

蓑田研究は直接結び付かないという話はよく言われますが、基礎となる数理的なものの考え方、研究の進め方、周辺知識は役に立っていると思います。具体的には、いま扱っている機械学習やGISデータでは行列など数理的な概念は必須ですし、研究の基本である、文献を調べてそこに問題点を見つけ、その原因や解決する手法を探索する、といった流れには研究と同じ要素があると思います。いま、どういった問題が起きていて、どこに問題があるからこれを解決すれば次に進める、ということの繰り返し。それがFractaの仕事でもあります。そのプロセスを研究で経験している人は馴染みやすい世界だと思います。

── 大学生・大学院生の時にはこういうことをしておくべき、といったトピックは何かありますか?

蓑田深く学ぶということは、大学や大学院が適しているのではないかと思います。社会人になり、業務の幅が広がるにつれ、知識の深さだけでなく広さがどうしても大事になります。一つのことに本当に没頭する経験、何の役に立つのか分からないようなことでも、自分が興味のあることであれば、広げずにとことん突き詰める経験が大学生・大学院生に適していると思います。就職活動からマナー、プログラミングを学び始める人は多いですが、それらは就職してからでも身に着けられるものなので、本当に自分の興味あることだけを深くやってほしい、と思います。ただ…英語だけはやっておいた方が良いかもしれません。Fractaでもアメリカ本社とのやり取りがあり、個人的に苦労している側面があります。

── 掘り下げていく分野の選び方や基準は何かありますか?

蓑田自分の興味主体で良いと思います。例えば研究に関わる分野や研究に必要なスキルとか。それが何であれ、深く掘り下げた時に得た知識や経験は、後から絶対に何かに紐づき役に立ちます。もしあるとすれば、体系化されていないものでしょうか。簡単に結果を得られたり答え合わせができるものではなく、自分で探索して、自分なりの考えをぶつけていけるような分野が良いと思います。その意味では、研究も該当するし、インターン等を通じて得ることのできる実務経験も該当しますし、Kaggleのようなリアルデータを用いたコンペでも良いと思います。

── では、どのような方がFractaに向いていると思いますか?

蓑田スキルからお話しすると、ソフトウェア開発で基本的な言語はPythonを使用しているので、Pythonは使えないと厳しいです。それに加えて、オープンデータ等の既に綺麗になっている研究用のデータではなく、実際にリアルなデータを自分なりに解析した経験が重要です。機械学習の手法を「とりあえず使ってみた」ではなく、なぜこのアルゴリズムを使うのか、アルゴリズムの中身を正しく理解できる数理的な能力というのが求められるかと思っています。これはどこの企業でも、深いテーマになればなるほど「とりあえず使ってみた」では通用しないので共通して必要だと思っています。

マインドでいうと、やはり小さい会社なので変化が激しく、その変化の中でも常に自分のやりたいことを忘れず、一歩一歩前進できるマインドセットを持っている方は合っているのではないかと思います。本当に好きなことは、多少ストレスが溜まったり嫌になっても、どこか頭の片隅に残っていて離れないと思います。例えば私は、Fractaのソフトウェアによって、一人でもいいので水道料金が下がったとか、水道管の保守費用が減った、と実感できることがゴールだと思っていて、それがずっと頭にあります。

何にも興味がない人はいないと思いますので、興味のあるものを見つけて全力を傾けて打ち込めることが重要で、それがFractaの方向性とマッチしていればベストだと思います。

加えてFractaのような企業とデータサイエンスのコンサルティング企業との大きな違いは、Fractaには水道管・ガス管といった特定のプロダクトがあり、なおかつ課題解決まで終わりがない、ということだと思います。データサイエンスがいくら得意でも水道管などの社会インフラ課題に興味がなければ業務を楽しめないと思います。またコンサルティングは受発注の関係なので案件には終わりがあり、ある程度の結果が出ると次のプロジェクトに移行していきます。一方Fractaは自分たちで設定した課題なので、基本的に課題が解決できるまで止めることはありません。ひとつのことをとことん深掘りできるので、その姿勢に共感できる人が合っていると思います。

── 社会インフラという課題に対して未開拓の技術領域に挑戦し続ける姿勢が伝わってきました。興味深いお話、ありがとうございました。

修士・博士・ポスドクのキャリア支援サイト
修士・博士・ポスドクのキャリア支援サイト

 

蓑田 和麻(Kazuma Minoda)

Fracta Japan株式会社
データサイエンティスト

2016年、慶應義塾大学 理工学研究科修了(修士)。
株式会社リクルートホールディングスに入社し、リクルートテクノロジーズ配属後、データテクノロジーラボ部にてスタッフ業務効率化のためのプロダクト開発や原稿校閲のプロダクトの導入・推進業務を行いながら、機械学習技術の研究開発に従事。その後Fractaに転職し、データサイエンティストとして水道管劣化検知プログラムのAIアルゴリズム開発等に従事。
修士論文のテーマは、複数の潜在クラス付きスイッチングモデルのパラメータ推定手法の提案。