【概要】
HCSは画像処理やMulti-parametric解析の点で機械学習との親和性が高い分野である。一方で機械学習を用いたAI創薬と一口にいってもその方法や用途は多岐に渡るため、経験分野や目的によって議論がすれ違う事も多い。まずWSの冒頭でHCSの解析フローにおける機械学習の様々な用途と、教師有り無しで分類される機械学習法を整理した。その後「画像処理における機械学習」と「統計処理における機械学習」という2つのトピックに関して、HCSに活用する上での可能性を議論した。参加者は過去に機械学習を経験した方が多かった。測定器付属ソフトのAI機能を解析に用いている方からIT専任者で独自の解析ソフトを構築している方、創薬への機械学習の応用分野の一つとして画像解析を考えている方々など多様な分野・経験のある方が参加してくださった。
【トピック1:画像処理における機械学習】
Deep Learning/CNNモデルなどの活用例として、明視野から蛍光画像を予測する画像変換処理モデルの応用例を長浜バイオ大学・水上先生に紹介して頂いた。会場からは機械学習を用いて分類する場合に中間的な分類画像が期待通りに判定できないといった問題提起や、over fitの課題(少ない教師データに最適化しすぎて、教師データ以外の分別能力が落ちる事)などの話題が挙げられ、ベンダーなど開発側も含めた意見交換が活発に行われた。Deep Learningを含めた機械学習では一般的にデータ量は多い方が良いとの見解が多数を占めた。データ量を拡張できない場合の解決策として、細胞画像を回転するなどして得られる擬似的なデータ拡張方法が有効であることなどが言及された。またDeep learningにおける問題点として、実験間における染色のばらつきや測定器による画像の質の違いなどが問題となっていること、機械学習過程がBlack-box化されているため各社のソフトで結果が違う場合の妥当性判断などが難しいことが提起された。汎用性のある解決方法の提案には至らなかったものの、Deep learningや機械学習を画像解析に適用する上での現場での問題点の共有や解決策の必要性を共有することができた。
【トピック2:統計処理における機械学習】
HCSでは画像から多様な測定値が得られるが、そのメリットを十分活用しきれていないとの意見がよく聞かれる。そこで統計処理を含むデータ活用方法について議論が行われた。特にDeep Learningは教師データなしで画像を分類できることがメリットである一方で、その分類に生物学的な意味づけを行う上での課題も提起された。また教師データありの学習で良い結果が得られたとの意見が聞かれた一方で、未知のフェノタイプを抽出することが困難なことや、現在所有している測定器ソフトでは教師なしの機械学習が実施できないなどの意見もあった。機械学習による分類や予測は一つのsuggestionであり、そもそも正解かどうかを突き詰めていくのではなく、仮説に賭けてみるといった姿勢で創薬に積極的に活用したらどうかという意見も聞かれた。