DeepMosaicを用いたコントロールなしのモザイク一塩基変異(SNV)の検出法
DeepMosaicが非がん性サンプルにおけるモザイク一塩基変異を高精度かつ対照不要で検出可能であることを示した論文です。
Control-independent mosaic single nucleotide variant detection with DeepMosaic
要 旨
モザイク変異(Mosaic variants: MVs)は、胚発生中の変異原性プロセスや環境曝露に起因し、加齢とともに蓄積し、がんや自閉スペクトラム症(ASD)などの疾患の原因となることが知られています。非がん性モザイク変異の検出は、クローン性に拡大していないために表現される頻度が低く、計算解析上の課題となっていました。本研究では、DeepMosaicという新たな手法を提案します。この手法は、一塩基モザイク変異を可視化する画像ベースのモジュールと、対照データを必要としない畳み込みニューラルネットワーク(CNN)ベースの分類モジュールを組み合わせたものです。
DeepMosaicは、18万件のシミュレーションまたは実験的に評価されたモザイク変異を用いて学習され、さらに、61万9,740件のシミュレーション変異と、16人の全ゲノムおよび181人のエクソームから得られた530件の実際の生物学的検証変異を用いて評価されました。
DeepMosaicは、非がん性の全ゲノムシーケンスデータにおいて、感度0.78、特異度0.83、陽性的中率0.96という高い精度を示し、既存手法よりも優れた性能を達成しました。また、非がん性の全エクソームシーケンスデータにおいても、これまでの最良の手法と比べて、検証成功率を2倍以上(0.43 vs 0.18)に向上させました。DeepMosaicは、非がん性サンプルにおけるモザイク変異検出において、既存手法の代替または補完的手法として活用可能な高精度の分類器を提供します。