創薬

創薬に関する解析事例です

1. 細胞と臨床データを統合した薬剤有効性の分析

ご依頼内容

某製薬会社様にて、自己免疫疾患の治験薬の用量反応性試験を実施。「解析部門で結果を分析してみたけれど、比較群でResponse Rateに一貫性がなく、臨床側としては違和感が残る結果となったので再解析をお願いしたい」とのご依頼がありました。

前知識

解析の入力データは、プラセボ・各投与群のベースライン値から24週までのフローサイトメトリーのデータ、臨床的指標、検査値、被験者背景、有効性評価項目。治験薬投与後に有効性が増加する細胞集団を探索。

ソリューション

有効性評価の「検証的」解析に加えて、機械学習を使用した「探索的」解析を実施。フローサイトメトリーのクラスターの細胞量と臨床データを統合し、有効性評価項目に影響がある特徴量を抽出したところ、交絡因子を特定。データを調整して再解析を行ったところ、細胞量変化と薬剤有効性についてより明確な結果が得られました。

特徴量抽出で関連性が強く示唆された項目について、項目の意味や、考えられる理由について、解析者が現場の研究者の方々と丁寧にディスカッションすることが大切です。

解析イメージ

2. 深層学習を用いたシングルセル解析

ご依頼内容

某製薬会社様より、「従来のライブラリ(Seurat)より良い精度でシングルセル解析を行いたい」とのご依頼がありました。

前知識

細胞解析では、「疾患に特異的なセルタイプと発現差のある遺伝子(DEG)」を特定し、発現差のある遺伝子の機能やパスウェイを調査して疾患のメカニズムを解明します。

従来のバルク解析では「細胞集団」から抽出される遺伝子発現量を解析していましたが、シングルセル解析では「細胞1つ1つの遺伝子発現量」を測定できるようになりました。バルク解析の遺伝子数は3,000〜5,000である一方で、シングルセルでは10,000〜20,000でありおよそ4倍です。細胞解析では遺伝子が特徴量となるため、遺伝子数が増えるほど次元数が増えて解析が難しくなります。これを「次元の呪い」といいます。 また、シングルセル解析はバルク解析に比べてドロップアウトやバッチエフェクトといったノイズの影響を受けます。

ソリューション

「次元の呪い」と「ノイズの影響」を考慮して、「次元圧縮で抽象化されたデータが遺伝子発現のパターンの特徴を正しくとらえている」ことが重要です。そこで、従来のライブラリで用いられていたPCAではなく、非線形の柔軟性がある深層学習を用いて次元圧縮と正規化を行いました。

アノテーションでは外部データベースを用いて、DEGのGene Ontologyやパスウェイなどを調べて、疾患に関連が高い機能を分析しました。「前処理、モデルの作成と評価、発現差解析、アノテーション」まで一連の解析ステップを行いました。

細胞のクラスタリングの例