遺伝子セット濃縮分析に多くのアプローチの一つである 遺伝子発現の分析 プロファイルデータとに記載されている 紙ブロード研究所の労働者から.
基本的なコンセプトは、勉強という観察によって促された 個々の遺伝子 2ステートまたは表現型であるとの間の発現レベルにおける最も大きな違いを示す 機械論的洞察に欠け. 代わりに, それは取る方が理にかなっている 遺伝子のセット いくつかを共有する 生物学的なリンク, と質問をする - 全体集合は任意の統計を示してい 有意な富 発現差を持っているそれらの遺伝子の?
A 遺伝子セット 選択することができます, アプリオリ, e.gいくつかの理由で. 以上の影響を受けることが知られている遺伝子のセット- マイクロRNAまたは過少発現, 染色体上の位置に基づいて選択またはおそらくセット, 分子機能のためにまたは遺伝子, 細胞成分と / または生物学的プロセスはの統制語彙を使用して割り当てられている 遺伝子オントロジー.
GSEAのアプローチの1つの利点は、それがあなたを組み込むことが可能であるということです 完全なデータセット, 任意に選択された発現差のしきい値を持つだけでなく、それらの転写産物. "どのようにそれは完全なデータセットを使用するには、[OK]をすることができます - 私はこれを読んだ多くの人々が考えていることと確信している? 通常、私はだけで遺伝子を検討する >2 (または他の好きな値)-"アプローチが有効である理由は、低水準でまたは複製に大きな差があると発現している遺伝子がGSEAによって使用されるメインメトリックに寄与しない倍の差動式である, '濃縮スコア' (ES).
GSEAは最初のことで動作し ランキング ことにより、各遺伝子の発現値 信号対雑音 比 - 各表現型を表すサンプルの平均値の差を計算し、標準偏差の和によってそれらをスケーリング. これは生物学の間で異なった状態とほとんど変化の間で発現量に大きな差を持つ遺伝子が高度にランク付けされて複製されることを意味します.
次のステップは、つまり、ES, GSEAによって生成された主要な統計, 各遺伝子セットのために計算される - GSEAマニュアルに, 見事にソフトウェアを記録している, それは述べ:
"すべての遺伝子は、第1のノイズ比率へのシグナルによってランク付けされ, 次にESは遺伝子のランク付けされたドロップダウンリスト "歩く"ことによって計算される 増加 A 実行中の和 遺伝子が遺伝子セット内にあり、統計 減少 それはそれがないときに. ザ 大きさ インクリメントのに依存 相関 と遺伝子の 表現型. ESは、リストを歩行する際に遭遇ゼロからの最大偏差です. A 正の ESは、少なくとも遺伝子セット濃縮を示し トップ ランク付けされたリストの; A 負 ESは、少なくとも遺伝子セット濃縮を示し ボトム ランク付けされたリストの。 "
ESの値は次のとおりです。 正規化 遺伝子セットのサイズに基づいて、次に 偽の発見率 計算され, 偽陽性の推定確率を与える. GSEAは非常にリラックスしたデフォルト値を使用します 25%, 生物学的に比較的多数のレプリケートと仮説生成に適している.
からのデータに働いていた科学者 非ヒト サンプルはまだGSEAを使用することができます, それだけには必要用心する - 遺伝子記号 "アールGSEAによって使用される翻訳"彼らの人間の同等物i.eから. マイクロアレイ上で表される、興味の種からの遺伝子のために使用される識別子は、そのための記号に変換されます ヒトのオーソログ, 分析で使用し. スブラマニアンら 主張する この変換は、ほとんど、あるいはされていることを 影響はありません GSEAの有用性について; それは、複数の非ヒト種で正常に使用されています, 結果の詳細を調査するときに、もちろん、これは心に留めておかなければなりません.
優れたための, 深い, 経路ツールのレビュー, 相談する:
パスウェイ解析のアドバイスもう一つの良いソース, 特にR統計パッケージに精通しているためである ここで.
参考文献
1 トラックバック
[...] 差次的に発現転写産物のためのデータのゲノムワイド. ブロード研究所の素晴らしいGSEAツールを使用して, 私は特定の遺伝子オントロジー用語や経路があったことを統計的証拠を評価した [...]