世界38カ国、800万人が愛読する経済誌の日本版

イラストレーション=Luke Waller

自らの力で道を切り拓く女性たち「SELF MADE WOMEN100」を紹介する連載企画。今回は機械翻訳やAI(人工知能)に不可欠な学習データセットを作る企業、バオバブCEO相良美織へのインタビュー。

日本で唯一のAIスタートアップユニコーンのプリファード・ネットワークスをはじめ、NTTコミュニケーション科学基礎研究所や東京大学、カーネギーメロン大学などといったAI開発の最前線の組織と一緒に仕事をする会社、バオバブとは? そして「当たり前のことをしつこくやることで当たり前ではない結果をたたき出す」という相良美織のマネジメント哲学とは?


──「相良美織バオバブ」と現在の事業について教えてください。

AI、機械学習に必要なモデルの学習データセットを作っています。例えば、AIで農家がトマトを集荷するために、いつ、何名ぐらいの人員が必要か予測するためには、ビニールハウスに画像認識を搭載したカメラを走らせます。その画像認識の機械学習のモデルには、グリーン、オレンジ、レッドというようにトマトの成熟具合によって写真に矩形とラベルがついた学習データセットが必要になります。これは「アノテーション」と呼ばれ、すべて手作業で行っています。このアノテーションがいい加減だと、誤った結果を出力するモデルになります。AIの研究開発で最も面倒くさく、お金がかかる作業です。

スタンフォード大学で博士号を取り、現在テスラのAIのヘッドを務めるAndrej Karpathy氏は「Building the software 2.0 Stack」において、大学ではほとんどの時間をモデルとアルゴリズム開発に時間を費やしていたにも関わらず、テスラでは約4分の3の時間をデータセットのために使っており、「データラベラーはプログラマーだ」と語っています。この世界ではプログラマーの方が上で、データラベラーの方が下と思われがちなのですが、それに対して彼はデータラベラーの方も重要で、どのようにラベリングするかがモデルに深く関わってくるんだ、と言っています。

良い機械学習のモデルのためには、いかに定義づけするか、そしていかに正確にラベリングするかが非常に重要なのです。

──「バオバブ」の競合と強みは?

世界では同様のことを行っている会社が多くあります。「Amazon Mechanical Turk」や「Figure 8」が有名ですが、賃金が安く、一方的な仕事の発注でコミュニケーションも少なく、受注側と発注側が対立構造になっているがゆえに品質の低さにつながる事例も多々散見されます。私は、そうした対立の構造や「リモートワーカーはえてして品質が悪い」という常識を打ち壊したいと考えています。

編集=岩坪文子 イラストレーション=Luke Waller

VOL.34

24歳でブラジル移民に。『魔女の宅急便』作者...

VOL.36

軽井沢の小さなグローバル学校を生んだ「意思...

PICK UP

あなたにおすすめ

合わせて読みたい