知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > TCGA >

TCGA數據庫Counts和FPKM以及FPKM-UQ

時間:2017-08-27 21:21來源:原創 作者:森莘 點擊:
在做TCGA數據庫分析時,下載基因表達矩陣時,遇到一個選項,需要選擇Counts、FPKM、FPKM-UQ,很多學員有點困惑,這些都是什么區別呢?
首選你得知道如何進入TCGA數據庫,知道如何選擇需要的癌癥分類,和數據類型,在選擇基因表達的時候,經常遇到一個問題,有個選項:HTSeq-Counts,HTSeq-FPKM,HTSeq-FPKM-UQ,不少學員對此產生困惑,這里究竟應該如何選擇,每個選項究竟是什么意思。
counts數據
簡單的講,Counts是數據后臺沒有處理的原始表達量,而FPKM和FPKM-UQ是兩種數據處理方法,也就是說,如果下載Counts數據,是表達量數據,如果下載FPKM數據,那么要注意這些數據是經過處理的。正常情況下,我們下載Counts數據就可以了,特殊情況選擇FPKM數據也是可以的。
接下來我們來看看FPKM的具體概念,究竟是什么樣的處理結果:
FPKM
下載數據后,在數據分析時,用的方法也是不同的,Counts數據一般使用edgeR包或DESeq包,對數據做分析;如果下載FPKM數據,就不能使用edgeR包,只能只用DESeq包進行處理。
在使用edgeR包做Counts數據處理時,是需要對數據進行normalize的,所以我們在下載數據時,下載counts是比較常用的。

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(12)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A