知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > TCGA >

癌癥類型和樣本代號詳解TCGA

時間:2017-06-06 12:08來源:原創 作者:BioWolf 點擊:
癌癥類型,TCGA數據庫包括主要的32個癌癥,樣本代碼,需要知道01C這個字段,01-09是tumor即癌癥樣本,10-29是normal即癌旁樣本,那么馬上來看看“一入TCGA深似海”吧
這是實戰TCGA數據庫的又一個知識點,如果你已經對TCGA有淺顯的認識,那么我們應該根據研究方向找到自己的癌癥類型,TCGA有一臺完整的癌癥分型,慢慢這個分型也成為了主流,你別不服氣,如果我們有這樣的科研實力和共享魄力,一樣可以得到科研界的認可,可是路漫漫,幸好我們都在路上,至少現在的統計顯示,國內發表關于TCGA的文章數據已經過半數了。
32種癌癥類型
最重要的癌癥類型有32個,會帶領大家一個一個來認識,以后分析學習的時候可以直接查看,如果是全英文的,那你會說,這個我也知道,放心,當然會給大家簡單中文檢索的。他們分別是:
ACC 腺樣囊性癌
BLCA 膀胱癌
BRCA 乳腺癌
CESC 宮頸鱗狀細胞癌
CHOL 膽癌
COAD 結腸癌
DLBC 淋巴癌
ESCA 食管癌
GBMLGG 腦癌
HNSC 頭頸部鱗癌
KICH 嫌色細胞癌
KIRC 腎透明細胞癌
KIRP 乳頭狀腎細胞癌
LAML 骨髓癌
LIHC 肝癌
LUAD 肺腺癌
LUSC 肺鱗狀細胞癌
MESO 胸膜癌
OV 卵巢癌
PAAD 胰腺癌
PCPG 腎上腺癌
PRAD 前列腺癌
READ 直腸癌
SARC 軟組織癌
SKCM 皮膚癌
STAD 胃癌
TGCT 睪丸癌
THCA 甲狀腺癌
THYM 胸腺癌
UCEC 子宮內膜癌
UCS 子宮癌
UVM 眼癌
這樣展示給大家,會不會很唐突,大家保存就是了,整理是需要時間和經理的,具體每個癌癥的詳情,還需要大家一起去完善。不知道有找到自己需要研究的癌癥類型呢?找到了癌癥的類型,帶大家來認識一下癌癥大數據里最常見,最有標志性的,樣本代號,這個估計也要變成國際標準了,相信科研組在考慮如何命名是也是下足了功夫,因為TCGA數據量大,涉及的樣本多,每個樣本的表達數據類型有多,太簡單的話無法檢索需求啊,太難更不行了,會被嫌棄的!
TCGA樣本代碼
舉個樣本例子給大家:
TCGA-02-0001-01C-01D-0182-01
就這么一個簡單的代號,包含著多少信息,又包含著多少科研工作的熱情和心血。
TCGA命名每個字段的意義
Project-TSS-Participant-Sample&Vial-Portion&Analyte-Plate-Center
TCGA:Project  項目名稱
02:TSS  組織來源代碼
0001:Participant  科研參與者
01:Sample 樣本號
C:Vial 樣本序列中樣本的階數
01:Portion 順序中部分的次序
D:Analyte
0182:Plate 順序中的板的順序
01:Center 測序鑒定
詳解癌癥譜圖樣本代號
看了這么多,是不是有點糊涂了,其實這個代碼中,最重要的就是第四個字段,也就是01C,準確的說01對我們來說非常重要,這個sample的數字是從01-29的,其中01-09是tumor,也就是癌癥樣本;其中10-29是normal,也就是癌旁;這個對于每個研究者才是最重要的,當然,這個必須記住,只有記住這個,后期才能做差異分析,生存分析,如果連腫瘤樣本和癌旁樣本都區分不了,何談后續分析呢?
業內有人戲說:“一入TCGA深似海”,這可見癌癥譜圖有多大,我們有多渺小,對于科研數據,我們應該懷著一顆敬畏和空杯的心態,一步一步,不如TCGA大數據的殿堂,去挖掘對癌癥分析、治療有用的數據庫,也不枉TCGA曾經定下的目標和宏偉夢想。

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(29)
90.6%
踩一下
(3)
9.4%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A