人工知能開発で最も大変なのが「データ収集」である。金融データなど数値データなら自動で集めてといった方法が可能なものも多いが、画像データなどではそれぞれが何の画像であるかのタグ付けを行わなければならず、その作業は非常に属人的である。
一部の「複数の画像を判別させる」タイプの画像認証には、一方は認証に使うが、もう一方は「教師データ収集」に利用するなど「無料でユーザーに教師データを作成させる」というアイデアもあるが、普通は誰かに地道な作業を依頼し、多額のコストがかかる。
フィンランドのスタートアップVainuは、請負業者とそこと提携したい企業を人工知能を使って結びつけるために設立された企業だが、そのデータ収集に受刑者の刑務作業を利用しているとして話題になった。
作業内容は、「フィンランド語の記事を読んで、その記事がどの業界に属する内容かをタグ付けをする」というものだ。英語であれば例えば新興国の英語話者(インドやフィリピンなど)に格安で依頼することも可能だが、フィンランド語の場合は話者が少ないので、フィンランド語を理解できる低賃金労働者ということで選ばれたようだ。
刑務作業には1時間当たり2ドル(囚人に入る金額はもっと少ない)だけであり、低コストで教師データを作成できる。
刑務作業と人工知能といえばイメージが結びつきにくいが、それもそのはずだ。懲役は社会復帰のための訓練という意味合いもあり、日本でなら町工場からの作業依頼や、靴製作など「手に職をつけるタイプ」の刑務作業が多い。
当然フィンランドでも同様の批判はあがっており、フィンランド人がフィンランド語を読んでも、それ自体で何かスキルが上昇するわけではない。刑務作業で人工知能開発をさせているわけではなく、あくまでも母国語でニュースなどを読ませているだけである。
日本では可能だろうか。例えば、法務省の刑務作業についての説明では、
刑務作業は,刑法に規定された懲役刑の内容であるとともに,受刑者の矯正及び社会復帰を図るための重要な処遇方策の一つです。受刑者に規則正しい勤労生活を送らせることにより,その心身の健康を維持し,勤労意欲を養成し,共同生活における自己の役割・責任を自覚させ助長するとともに,職業的知識及び技能を付与することにより,円滑な社会復帰を促進することを目的としています。
法務省「刑務作業の目的」
注:太字は筆者が追加
とやはり社会復帰や技能の付与を目的としている。
刑務作業の種類については、
刑務作業の種類は,生産作業,社会貢献作業,職業訓練及び自営作業の四つがあります。生産作業は,製作作業(生産に用いる原材料の全部又は一部が国の物品である作業),事業部作業(生産に用いる原材料の全部又は一部が事業部物品である作業)及び提供作業(生産に用いる原材料の全部が契約の相手方から提供された物品である作業又は国が被収容者の労務のみを提供して行う作業)の三つに区分されます。
法務省「刑務作業の種類」
注:太字は筆者が追加
と、事業部作業については教師データ生成は原材料と言えるかもしれないが、前述の「刑務作業の目的」と照らし合わせれば難しいかもしれない。
この辺りの法的な扱いは筆者にはわからないので、興味があれば法務省に問い合わせてみてはどうだろうか。もしかしたらいけるかもしれない。但し、利用の仕方がばれて炎上しても筆者は知らない。
参考文献
Interesting Engineering, “Finnish Startup Turns to Cheap Prison Labor to Train Its AI”, 15 Apr 2019