使用基因集合富集分析的途徑分析 (GSEA) 工具

基因集富集分析的許多方法之一 基因表達分析 描述文件數據,是描述在 工人在Broad研究院.

通過觀察,學習的基本概念提示 單個基因 最重要的兩個國家或表型表達水平之間的差異 在機械性的認識不足. 代替, 它採取一個更有意義 設置的基因 分享一些 生物鏈接, 問的問題 - 整套任何統計顯示 顯著富集 在這些差異表達的基因,?

基因組 可以選擇, 先驗, 的數量的原因,例如. 受到超過已知的基因集- 或下一個微RNA的表達, 或者一組基於染色體位置選擇, 或基因,這些基因的分子功能, 細胞成分和 / 或生物過程已分配使用的受控詞表 基因本體論.

到GSEA方法的優點之一是,它是可能把您的 完整的數據集, 不只是這些謄本,一個任意選擇的差異表達閾值. 我相信,很多人讀這將思考 - “怎麼會這樣確定使用完整的數據集? 一般情況下我只考慮基因 >2 (或其他喜愛的價值)-倍差異表達的原因。“的方法是有效的,是不利於基因表達水平低或存在較大差異複製的主要指標使用GSEA, '富集得分“ (ES).

GSEA的工作原理是第一 排行 每個基因的表達值 信號噪聲 比 - 計算代表每個表型的樣品的平均值之間的差異,和縮放它們的總和的標準偏差. 這意味著,有很高的基因表達水平有較大的差異,在不同的國家和生物之間的變化不大複製.

接下來的步驟是,在ES, GSEA所產生的主要統計, 計算每個基因組 - 中的GSEA手冊, 它記載了出色的軟件, 它指出:

“所有的基因的信號噪音比第一排名, 那麼,ES的計算方法是“走”下來的基因排序名單 增加正在運行的總和 統計當一個基因的基因組中,並 減少 它時,它是不. “ 大小 的增量取決於 相關 基因與 . ES是從零走在列表中遇到的最大偏差. 一 積極 ES表示基因組富集 頂部 位列榜單; 一 ES表示基因組富集 底部 位列榜單。“

ES值 基於基因組大小,然後一個 虛假的發現率 計算, 得到的估計的誤報的概率. GSEA使用一個非常寬鬆的默認值 25%, 這是適合於產生假設與相對大量的生物學重複.

工作的科學家提供的數據 非人類的 樣本仍然可以使用GSEA, 但需要提防 - 在 基因符號 使用GSEA“翻譯“從他們的人力現金等價物即. 他們的芯片上表示的利息從你種的基因使用的標識符轉換成符號 人類的同源基因, 然後在分析中使用. Subramanian和他的同事們 聲稱 這種轉換具有很少或 沒有影響 GSEA的效用; 它已成功地用於在多個非人類物種, 但當然,這必須牢記的詳細調查結果時,.

對於一個優秀的, 深入, 審查通路工具, 參考:

Khatri, P., 希洛塔, M., & 巴特, 一. Ĵ. (2012). 十年的途徑分析: 目前的做法和重大挑戰. PLoS計算生物學, 8(2), e1002375. 二:10.1371/journal.pcbi.1002375

另一個很好的來源,途徑分析建議, 特別是對那些熟悉的R統計軟件包 這裡.

延伸閱讀

SUBRAMANIAN一個, 塔馬約P, Mootha VK, 慕克吉小號, 艾伯特BL, 吉列MA, Paulovich一個, 波默羅伊SL, 戈盧布TR, 蘭德ES, Mesirov J​​P (2005) 基因集富集分析: 以知識為基礎的方法來解釋全基因組表達譜. PROC NATL科學院學報U S A 102:15545-15550

謝興, 呂君昌, Kulbokas EJ, 戈盧布TR, Mootha V, 琳達巴德托博士K表, 蘭德ES, Kellis中號 (2005) 系統發現人的發起人和監管圖案 3[總理] 通過比較幾種哺乳動物的非編碼區. 性質 434:338-345

此項目被張貼在 路徑分析. 書籤 一篇. 發表評論 或留下引用: 引用網址.

引用

發表評論

您的電子郵件 從來沒有 發布或共享. 必填項已被標記為 *

*
*

您可以使用這些 HTML 標籤和屬性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

CommentLuv badge
  • 與我們聯繫

    Link to ourRss
    Link to ourTwitter
  • 與我們聯繫

    Link to ourLinkedin
    Link to ourRss
    Link to ourTwitter