教師データの重要性

AIは教師データが無ければ機能しないため、AIビジネスを成功させるためには、教師データを大量に準備しなければなりません。

この原則はディープラーニングだけでなく、簡易モデルにおいても成り立ちます。もちろんデータが集まればよいというものでもありません。

そのデータが綺麗でなければならないからです。万一欠損値や誤りがあれば、AIに入力する前にクレンジングすることになります。

AIの精度を高める作業に従事するに当たり、気を付けるべきことがあります。それは、再現率と適合率とを区別するということです。

再現率は、正解をきちんと正解として認識できる割合を指し、適合率は解答に対する正解率を意味します。AIをどの分野に導入するかによって、再現率と適合率のどちらをより重視すべきかが決まります。

例えば、医療の画像診断にAIが使われるのであれば、再現率が大事な指標になります。一方、メールの判定に使われる時は、適合率が重視されます。以上の例から分かるように、導入を検討している企業は、AIの機能学習について、最低限の知識が求められます。

AIは完璧なツールではないため、より万全の状態で利用するためには、人間もまた頭を使わなければならないのです。

ベンダーはそうした事情を理解していることも多いのですが、残念ながらクライアントの企業は十分勉強しているとは言えない状況です。

両者ともに相手の業界の常識を勉強しすることで、初めて協同作業が可能になります。

プロトタイプを作成するには協働することが欠かせないのです。