事業力&技術力の両輪で生み出す、“移動の未来”へつなげる「モビリティ×CV」テクノロジー
交通事故削減支援を行う次世代AIドラレコサービス「DRIVE CHART」を支える、コンピュータビジョン(CV)技術。
専用車載器から得られる車内外の映像を解析し、交通事故に繋がる可能性の高い危険シーンを自動検知しています。
これらの危険シーンを高精度に検出するためには高度な画像認識・解析技術が不可欠です。Mobility Technologies(MoT)におけるCV技術開発について、「DRIVE CHART」のAI技術部分のマネジメントを担う、AI技術開発部 副部長の内田祐介に聞きました。
事業に全力コミットしてこそ、「モビリティ×CV技術」が磨き上げられる
――まず、MoTのCV技術の強みを教えてください。
事業を持たない研究開発では、問題設定や精度評価が机上の空論となりがちです。その点、MoTではPoCではない実プロダクトのための技術確立が求められており、事業ニーズから発生する様々な問題設定に対し、適切な評価指標等を事業サイドと密にすり合わせながら研究開発を進めています。事業に活かし、人々の生活に貢献できる実践的なCV技術を効率よく正確に磨いていけることが一番の強みと言えるでしょう。
――「DRIVE CHART」に活かされているCV技術、ドライブレコーダーならではの難しさはありますか?
ドライブレコーダーには潤沢な計算資源があるわけではなく、限られたリソースで様々な機能を動かさなければなりません。危険シーンを自動検出するための深層学習モデルなどは、精度と処理速度の難しいバランスを取りながら開発しています。
CVは深層学習によって幅広い応用が可能になりましたが、多くの場合、元から存在する事業におけるタスクの精度を上げるために活用されていると感じます。例えば、製造プロセスにおける外観検査や監視カメラにおける人物識別などですね。
そのため、「DRIVE CHART」のように新しい事業の“コア”としてCV技術を活用しているのはレアケースだと思います。実事業を前提とした研究開発であり、求められるハードルも高いため、様々な最新技術を取り入れて試行錯誤しなければならないことも、技術力のベースを高める強みとなっています。
将来の事業展開、社会動向を見越して活用技術を厳選する
――「DRIVE CHART」は、顔認識システムを内製化していますね。
わざわざコストをかけて内製化した理由は、顔認証の精度の問題があったからです。当たり前と言っては当たり前なのですが、既成の顔認証用データセットには人種による偏りがあり、そのデータセットを用いてシステムを構築しても日本におけるご年配のタクシー乗務員の認識精度が高くありません。さらに、日本ではコロナ禍以前よりマスクを着用している方が多いため、「サングラスやマスクをした状態で、しかも正面以外の自然な運転状態での認証」という要件が求められた「DRIVE CHART」では通用しませんでした。
「DRIVE CHART」は、決まったフローの中で顔認識をするのではなく、運転をしている人の顔が自然と認識されるUXになっています。単純に正面から捉えるだけではないため、認識のハードルがとても高く、内製化する方が効率的だと判断したんです。
自動運転時代には、安全やセキュリティ観点で乗客を認識する技術が重要になる可能性があります。今後、プライバシーとの兼ね合いで議論が活発化し、法制度が徐々に整っていく――そうした動きに柔軟に対応するためにも、顔認識システムの内製化には大きな意味があると思っています。
――今後、どのような点に注力していきたいと考えていますか。
事業統合前はDeNAのAIシステム部に所属していたため、オートモーティブをはじめ、ゲームやヘルスケアなど様々な事業ドメインに目を配っていました。私自身、今後は「モビリティ×AI」「モビリティ×CV」というモビリティ視点で技術を見て、より深く、新しい領域に進出していかなければならないと感じています。
その一環として現在、プロジェクトで必要な技術のほかに、将来的に事業貢献に繋がりそうな技術を見つけるなど、先行的な研究開発も進めているんです。
また、7月にAIシステム部とモビリティインテリジェンス開発部が統合して一つの組織になったため、より大きくなった組織をどう運営していくのかという、マネジメント面での新たなチャレンジに大きな責任とやりがいも感じていますね。
他分野のスペシャリストと共創して「専門領域」を拡張するダイナミズム
――事業としてプロダクトを開発する利点を冒頭でご説明いただきましたが、内田さんのバックグラウンドを教えてください。
もともと、通信キャリアの研究所で主に論文化を目標とした研究開発と、研究技術の実用化を行っていました。国際学会など外部に見える仕事をしたいという思いがあったんです。
ある時、米国・シリコンバレーにある「SRIインターナショナル」に客員研究員として行く機会を得て、約半年間、現地の研究者と画像検索、映像検索技術を共同研究したり、米国の国立標準技術研究所(NIST) が開催する競争型の国際ワークショップに参加したりしました。そこで、画像検索や画像認識などCVに近い領域に大きな関心を持ち、それらを専門として研究を続けていたんです。
――アカデミックな領域からキャリアをスタートしたからこそ、事業にコミットする大切さを実感しているわけですね。
そうですね。画像検索技術がいくつか実用化まで持っていけるようになった頃、本社の企画開発部門に異動することになり、2年半ほどスマートフォンの企画開発業務に携わりました。そのタイミングで社会人博士課程に入学し、博士号を取得。その後、研究所に戻ったのですが、関連する研究分野はほとんどディープラーニングが席巻していて、また研究を取り巻く環境も大きく変化していました。
論文はarXivといったプレプリントサーバに迅速に公開され、その実装もGitHubに公開される――そのような環境下では、研究を行うにしても、その後の実用化を行うにしてもエンジニアリング能力が必要になると強く感じました。そこで、ちょうどAI部門を立ち上げようとしていた、また元々“エンジニアの会社”という印象を抱いていたDeNAに転職したんです。
DeNAではAIシステム部に所属し、「DRIVE CHART」プロジェクトを立ち上げから担当しました。CV技術を使い、ドライバーを認識する初期のモデルを構築したり、データ分析やシステム構築からプロジェクトマネジメントまで様々な業務に携わりましたね。実際にプロダクトを作るようになったことで、企業における事業力の重要性も改めて認識しました。
――最後に、研究者というキャリアがある内田さんから見た、MoTで働く魅力を教えてください。
データ集めからサービスへの落とし込みまでを一貫して経験でき、自分の専門領域を広げていける環境があることです。
社内には、研究開発エンジニアやデータサイエンティスト、ML Opsエンジニアなど、各分野に強みあるメンバーがいます。各々が専門分野に徹しているわけではなく、状況に応じて、各々の境界を超えて取り組まなければならない・取り組める仕事が多くあります。そのためMoTは、特に自分の専門性をベースとしながらも、その幅を広げたい人にはぴったりの会社だと思います。
※掲載内容は2020年11月時点の情報です。
採用情報
MoTでは、共に働く仲間を募集中です。興味がある方は、気軽にご連絡ください!