解析データの
見方について

概要

レパトア解析の結果は、TCRやBCRにおいて遺伝子別にそれぞれ出力されるため、例えば血液検体が1つであったとしても、TCR α鎖、TCR β鎖の解析を行った場合には、ふたつの結果が得られます。また解析結果をまとめたレポートファイル(Excel)は、動物種および遺伝子別に用意されています。これはV遺伝子およびJ遺伝子が、例えば TCR α 鎖とTCR β鎖では異なるためです。

一方、BCR遺伝子については、重鎖(H鎖)としてIgM、IgG、IgA、IgD、IgEがそれぞれ異なる特異的プライマーによって増幅され、別々のレポートとして得られるものの、これらはH鎖の定常領域がクラススイッチによって変化したものであり、V遺伝子およびJ遺伝子のセットは同じ配列となります。このため、レポートファイルの種類はH鎖として共通のシートとなります。なお、軽鎖(L鎖)にはIgL、IgKの2種類がありますが、これらは異なるV遺伝子およびJ遺伝子のセットとなるため、レポートファイルは異なるシートとなります。以下に、各動物種別に得られる解析結果の種類をまとめました。

レポートファイルの説明

以下にレポートファイルの例を示します。

  1. レポート種類
    • 動物種、遺伝子種類に対応した解析シート
    • レポートのバージョン
  2. レポート生成日、検体ID
    • Date of report:解析ソフトによってレポートが生成された日付
    • Project ID:案件番号
    • Sample ID:検体ID + 解析遺伝子
      TCR α、β、γ、δ:a、b、g、d
      BCR IgM、IgG、IgA、IgD、IgE、IgL、IgK:M、G、A、D、E、L、K
  3. シーケンス情報
    • Total reads:次世代シーケンサーによる解析で得られたリード数
    • Assigned reads:解析ソフトでTCR 遺伝子として判定されたリード数
    • In frame reads:CDR3 領域がアミノ酸配列に変換可能な(機能的な)リード数
    • Unique reads:In frame reads のうち、固有の組み合わせを持つリード数
    • In frame / Unique:Unique read が持つInframe read 数の平均値
  4. 多様性指数
    • レパトアの多様性の程度を4 種類の多様性指数で表示しています(数字が大きいほど多様性が大きいと評価します)。
    • Shannon-Weaver index H’:シャノン指数
      頻度の低いリード(リード数の少ないユニークリード)も考慮するため、検体のレパトアの豊富さに対して感度が高い特徴があります。レパトアの多様性を表す指数としては適正です。一方、その特性により、クローナリティーが高い検体では感度が低下する可能性があります。
    • Inv. Simpson’s index 1/λ:シンプソン指数(逆数)
      頻度の高いリード(リード数の多いユニークリード)を強調する特徴があり、クローナリティーが高い検体の評価に適しています。一方、レパトアの豊富さに対して感度が低下する可能性があります。
    • Pielou’s evenness:ピールー指数
      evenness(均など性)を強調し、シャノン指数やシンプソン指数(逆数)のような特異性や多様性にフォーカスしない特徴があります。安定的な評価系であるため、数値的なデータの差が出にくい可能性があります。
    • DE50(Diversity Evenness score)
      クローナリティー(クローンの程度)を示す指標で、上位ランキングのユニークリードからIn frame reads を足し合わせ、50%のIn frame reads を占めるユニークリード数の割合を評価します。
  5. レパトア解析結果 2D グラフ
    • 検体のレパトアで、V 遺伝子、D遺伝子、J 遺伝子、C遺伝子(判定可能な場合のみ)の頻度を集計し、グラフ化したものです。
    • 横軸に遺伝子名、縦軸に頻度(%表示、合計値は100%、レンジは変動する)を表示します。
  6. レパトア解析結果 3D グラフ
    • 検体のレパトアで、V 遺伝子、J 遺伝子の頻度を集計し、グラフ化したものです。
    • 2D グラフとは異なり、V-J 遺伝子の組み合わせが一致するリードを積み重ねたグラフとなります。
    • 横軸にJ遺伝子、奥行きにV遺伝子、縦軸に頻度(% 表示、合計値は100%、レンジは変動する)を表示します。
  7. Unique read ランキング Top 50
    • V-J-CDR3 アミノ酸配列が同一のIn frame read を集計し、Unique read の使用頻度を表示します。
    • 左から「ランキング」、「V 遺伝子」、「J遺伝子」、「CDR3 アミノ酸配列」、「該当する In frame read数」、「In frame read 中の使用頻度(%)」を示します。
    • 50 位以降のリードについては、同じExcelファイルのタブ「back_data」に、すべての集計結果(out of frame も含む)が格納されています。

評価を行ううえで注意すべき点

細胞数が少ない検体、RNA 濃度が薄い、品質が低下している検体、T 細胞およびB 細胞の存在量が少ないと想定される組織検体では、レパトア(多様性)が始めから少ない場合があるため、比較対象の条件を踏まえたうえで、クローナリティーについて言及する必要があります。

効率よくレパトア解析結果を読みほどくコツ

1 まずは3D グラフで何か特徴があるか確認する

  • そのピークはほかの検体でも高いですか、そうではないですか? グラフの傾向は類似しますか?
  • 共通のピークがあれば、特異的に活性化しているクローンを追跡することができます。

2 ランキングを見て1%以上のリードをピックアップ

  • 特異的な反応を起こしているクローンの候補となりえます。
  • 検体にもよりますが、マウスTCR α鎖では、iNKT細胞(自然免疫系と獲得免疫系の中間に位置する特殊なT 細胞)が数%レベルで、しばしば検出されます。

3 多様性指数は大きいですか:小さいですか?

  • 検体間比較において、客観的な数値として、多様性やクローナリティーを評価できます。

補足資料の説明

レパトア解析において、大量のシーケンスデータから得られたレパトアの集計結果は、検体別としてレポートファイルに集約されているものの、検体間での比較を手作業で行うことは、過酷としか言えません。そのため、複数検体で同じ解析遺伝子を依頼された先生方には、検体間のリード比較を容易にするために、以下の補足資料を含めて報告しています。

  1. シーケンスQV スコア
  2. 検体間比較(シーケンス情報、多様性指数)
  3. 検体間比較(Unique read 共通性)
  4. データベース更新にともなう遺伝子名の対応表

補足資料1:シーケンスQV スコア

  • 各検体のシーケンスリードの品質(R1、R2)を評価することができます。
  • QV20 を下回る検体(品質が低下している検体)については、結果を考慮する必要があります。

※Miseq では塩基配列を両側から読むため、R1(表側)、R2(裏側)のデータが得られます。裏側は品質が低下する傾向があるため、R1 側でJ 遺伝子とCDR3 アミノ酸配列、R2 側でV 遺伝子を判定します。各検体のExcelレポートでは、レパトア解析により自動的にR1、R2 から得られた情報を結合し集計します。

補足資料2:検体間比較(シーケンス情報、多様性指数)

  • 個別検体のレポートファイルを開くことなく、解析結果のシーケンス情報や多様性指数を確認できるため、データの抜粋や統計処理の際に、効率よく作業が進められます。

補足資料3:検体間比較(Unique read 共通性)

  • 個別検体のファイルを開くことなく、特定のユニークリードについて効率よく検索ができます。
  • 各検体間で共通するユニークリードが一覧になっているため、特定ユニークリードにおける経時的変化の評価がしやすいです。
  • 評価の注意点としては、集計表自体は「リード数」で表記されているため、レパトアの存在頻度(%)を見る際は、各検体の総In frame read 数を分母として、割算した値を取得し、評価を行います。

補足資料4:データベース更新にともなう遺伝子名の対応表

  • 最新のIMGT 遺伝子名表記および分類に対応するため、レパトア解析に使用する当社データベースを定期的に確認、更新し、より正確な解析結果が得られるように反映させています。
  • レパトア解析実験そのものに変化はないため、過去に実施したシーケンスデータを元にして、再解析が可能です。
  • 経時的な解析を実施されている先生方については、無償にて再解析を実施いたします。