社会で活躍する修士・博士・ポスドクのキャリアストーリー
データ分析を通じたモデル化で、人の暮らしをより良いものにしたい。SBI新生銀行で金融データ分析を担うデータサイエンティストとして働く

株式会社新生銀行(掲載時点。現・株式会社SBI新生銀行。以下同じ。)は、リテール業務、コンシューマーファイナンス業務、法人向け業務などの幅広い事業を通じて、お客さまの多様なニーズに応える金融サービスを展開しています。また、個人向けローン事業を展開する新生フィナンシャル株式会社や、ショッピングクレジット、クレジットカード、決済などの事業を手掛ける株式会社アプラスは、新生銀行グループ(掲載時点。現・SBI新生銀行グループ。以下同じ。)の中核企業として、個人向け金融サービスを中心に事業を行っています。
グループデータ戦略室 樋口氏のインタビュー(リンク)に続き、データサイエンティストとしてグループ各社のデータ分析業務に従事する河原氏に、入社のきっかけや業務の面白さについて伺いました。

SBI新生銀行に関する求人情報はこちら

河原 勇太(Yuta Kawahara)

株式会社SBI新生銀行 グループデータ戦略室

制御工学から「現象をモデル化する」面白さを知る

── 大学院での研究分野を選んだきっかけや、大学以前に興味を持っていたことについて教えてください。

河原教科としては、ずっと数学が好きでした。数学の面白さとしては、高校までの算数~数学と、大学に入ってから扱う数学は系統が異なると思います。高校生まではパズルみたいな楽しさがあり、例えば受験などで扱う試験問題は綺麗に作られていて、解くのが楽しかったです。大学に入ってからは公理・定理の綺麗さ・美しさといったところに興味を持ちました。例えば、よく挙げられますがオイラーの公式。あれは本当に綺麗だと思いました。

研究室を選ぶ段階では、数学とは別の分野として、人間の動きをアシストできるような装置にも興味を持っていました。ネットの記事で見かけたのですが、パワーアシスト装置や人工網膜など、工学でありながら人体を補強できる技術の存在を知ったのがきっかけです。特にパワーアシスト装置は面白そうだと思っていたので、専攻を選ぶにあたっては、パワーアシスト装置に関連し、なおかつ可能な限り数学に触れられることを重視しました。

── 大学院での研究は人工筋肉の予測制御に関することと伺っていますが、そのテーマを選定したきっかけはありますか?

河原パワーアシスト装置は人間の体に装着するものなので、当然ながら、できるだけ柔らかい素材で作りたいという意図・背景があります。そこで候補として挙がるのが人工筋肉なのですが、人工筋肉は制御するのが非常に難しい素材です。ヒステリシスという現象があり、制御に対する応答が単純な線形関係になりません。例えば、人工筋肉に圧力をかけることで長さが変わりますが、10hPaから20hPaにかけて10hPaの加圧で5cm伸びたとして、20hPaから30hPaの同じ10hPaの加圧分では8cm伸びる、という性質です。制御には圧力・加速度といったパラメーターを用いるのですが、先行研究では数式モデルを組んでいて、ヒステリシスを線形に落とし込む形で扱っていたので、あまり複雑なモデル化はされていませんでした。これに対して機械学習アルゴリズムでアプローチしてみよう、というのが研究テーマでした。

── 機械学習のアルゴリズムも数多くあると思いますが、どのようにアプローチし、またどのような面白さがありましたか?

河原実は単純な数式モデルだけでなく、機械学習モデルを用いた先行研究も存在していて、その中で新規性に加えて制御を向上させるという結果を両立するのに試行錯誤しました。データの制約や応答の精度に応じて色々と選択肢はありますが、実際に人工筋肉をパワーアシスト装置として運用することを想定すると、事前の学習データが不十分になりがちな状況があります。その場合でも、サポートベクトルマシン(SVM)は汎用性が高く、未学習のデータに対しても性能を発揮できる機械学習モデルですので、最終的にはLS-SVM(Least Squares Support Vector Machine)というアルゴリズムを用いました。

研究をやってみて感じた点としては、これが就職のきっかけにもなりましたが、モデリングという作業自体が面白かったです。数字・数学を用いることで現実世界に付加価値を提供できるモデルが作れてしまうということに面白さを感じました。

人に役に立つモデル化・自動化を通じて社会に貢献する

── 次に、就職活動ではどのような企業を見ましたか?

河原もともと進学するつもりではありましたが、学部生の時にも一通りエントリーするなどして企業探しをしました。当時は学科が情報系ということもあってSIerの説明会にも参加しましたし、モノづくりのような工学寄りの企業、例えば機械メーカーなども情報を集めました。その後、大学院に進学して研究をする中でモデリングへの興味が強くなり、モデル化やデータ分析といった分野の方が向いているのではと考え、そちらに重点を移しました。

パワーアシスト装置に興味を持ったきっかけもそうですが、モデル化や自動化を通じて人の活動を直接的にサポートする、というのが共通して持っていた想いです。エンドユーザーに直接関わることができる分野で、人の助けになるモデリングやデータ分析ができれば、と考えて就職活動をしていました。

── 新生銀行はどのように見つけたのですか?

河原データサイエンス分野に重点を移し、まずインターンシップを探しました。当時はデータサイエンスのインターンシップは多くありませんでしたが、新生銀行グループが開催する「新生ハッカソン」は、参加可能なインターンシップの中でも長い期間経験を積めることが、参加を決めた一番大きな要素でした。
正直なところ、当時は金融に対する知識は全くなく、銀行はなんとなく堅苦しそうといったイメージがあった程度でした。金融業界に惹かれたというよりデータサイエンスがキーワードでした。

── 「新生ハッカソン」で扱った内容を教えてください。

河原貸金の貸し倒れ率(デフォルト率)を予測する、という課題を扱いました。扱ったデータはレコード数がまず多く、加えてカラム、つまり説明変数となる要素もとても多くて、今まで触ったことのない膨大なデータと格闘しました。その点は大変であり、楽しかったところでもあります。特に印象に残っているのはデータの欠損値の取り扱いです。欠損は必ずしも単純に発生するものではなく、欠損自体に意味があるようなケースもあり、どのように処理して欠損としての意味を持たせるか苦労しました。例えば欠損に対してありえない数字(外れ値)を入れて試しましたが、逆にその値が影響しすぎてうまくいきませんでした。最終的には「〇〇欠損」というカラムを用意して0,1で処理しましたが、そこに至るまで試行錯誤でした。

── 最終的に新生銀行に決めた理由は何ですか?

河原まず、グループデータ戦略室が掲げる「データを紡いで、気が利いた金融を体現する」というミッションが、私の目指していたエンドユーザーとの関わりや人の助けになるデータ分析、というキャリア像に合致したことが一番の要因です。
加えて、扱うデータ・内容もさることながら、そこで働くヒトに惹かれた、というのもポイントです。金融なので堅苦しいイメージがありましたが、インターンのときに助言をいただいた社員の方々がとてもフランクに接してくださり、人柄の良さが表れていました。新生銀行グループとしてもできるだけ訪れやすいような銀行にするための取り組みをしているので、会社の雰囲気を表していると思います。「過ごしやすい」という表現が適切か分かりませんが、良い環境だなと感じました。働くにあたって「何をするか」というのはもちろん大事だと思いますし、どのぐらい社会に貢献できるかというのは大事だと思いますが、個人として長い目で働くためには環境の良さも大事だと考えています。その環境を作り上げている人柄の良さ、従業員の方が持っている知識量、といった部分がとても魅力的に感じました。

チーム力と探求心で、答えのないデータ分析に粘り強く取り組む

── 現在の業務内容や面白いと感じていることを教えてください。

河原現在は、グループ会社が発行するクレジットカードについて、属性情報や売上データから特定の利用者の利用性向や特徴を分析する業務に携わっています。例えば各個人の属性情報や利用傾向から、どのような特徴の方がクレジットカードをよく使っていただいているのか、あるいは今は使っていただけていない方々にどうアプローチすれば今後使っていただけるのか、といった分析をしています。クレジットカードをフィールドとして「データを紡いで、気が利いた金融を体現する」ことが業務と言えると思います。

面白い点としては、クレジットカードの種類によって利用傾向が異なる点が挙げられます。具体的には、車を買った時に契約したカードであったり、家のリフォーム時に契約したカードであったり。単純に年齢・性別など属性が違うことも要素の一つだとは思うのですが、大きくお金を使うところに違いがあるので、個人ごとのお金の使い方や考え方の違いが表れているのかなと思います。これをどう特徴量として定義・抽出するかは分析していて非常に面白い課題です。

── 仕事をする上で難しいと感じることはありますか?

河原立場の違う人たちがチームとして一つの課題に向き合っているので、その中での合意形成や期待値のコントロールは難しいポイントの一つだと思います。当初設定していた課題について掘り下げていくと、では別のデータではどうなる、別の方法ではどうなる、と議論が広がってしまうことが多くあります。もちろんそのような意見には可能な限り応えていきたいですが、分析は時間をかければいくらでも深掘りすることができるので、当初の目的とスケジュールに照らして可能な範囲はどこか、きちんと整理することが重要です。そのためには、相手の真意を正しく汲み取れるような質問をし、また前提条件を含め相手の認識を確認しながら、チームとして最良の結果に向けて意見をすり合わせていくことが大事だと思います。

── どんな方が新生銀行のグループデータ戦略室に向いていると思いますか?また志望する学生に対するメッセージをお願いします。

河原粘り強く考えられる人、新しいことに積極的にチャレンジできる人、だと思います。これはグループデータ戦略室として明示していますし、私もその通りだと思います。例えば、何か物事に打ち込んだ経験、壁に当たっても新たな別の切り口で考え続けられる、そういう志向が必要です。業務をする中では、簡単に答えが出る課題はありませんし、加えて常に新しい技術や知識を吸収していかなければなりません。恐らく、モチベーションとして知識を探求することが面白いと思える人が向いているのではないでしょうか。単純に新たな知識を得るという楽しさもありますし、得た知識によって今までの知見が更に広がる楽しさもあります。これを求め続けることが粘り強く考えることであり、また新しいことにチャレンジすることだと思います。

── データサイエンスというキーワードから、「人の役に立つモデル化」という業務を金融の世界に見出して真摯に業務に取り組む姿勢が伝わってきました。貴重なお話をありがとうございました。

修士・博士・ポスドクのキャリア支援サイト
修士・博士・ポスドクのキャリア支援サイト

 

河原 勇太(Yuta Kawahara)

株式会社SBI新生銀行 グループデータ戦略室

2019年、広島市立大学大学院 情報科学研究科 システム工学専攻修了(修士)。
2019年4月、株式会社新生銀行入行。グループ会社が発行するクレジットカードについて、属性情報や売上データから特定の利用者の利用性向や特徴を分析する業務に従事。
修士論文のテーマは、ゴム型人工筋肉のLS-SVMモデリングとモデル予測制御。