数据处理

引入:提出问题 GEO 里海量的芯片表达数据为许多validation 分析提供了丰富的素材。有时,直接从GEO页面得到的series matrix file 是 normalization 之后的数据用起来不太友好,就需要我们从原始的.cel文件获取基因的表达矩阵来满足我们自己的分析需要。我们都知道芯片数据是基于一个个探针信号来对基因进行定量的,并且经常出现设计多个探针对应同一个基因进行检测,因