请问版里做bioinfo的牛人:
RNA-seq数据做QC时通用的标准是怎样的?因课题需要,我们在重新分析GEO里的一批数
据,用FastQC评估该批数据,发现几乎所有read后半部分的score偏低(见下图)。像
这种情况,应该怎样处理比较合理?
1)Filter by quality: quality cut-off设定为20,90%,结果一半左右的reads会被
扔掉。而文章中宣称其可保留85%以上的read。是我这种filter设定参数有问题吗?一
般的标准是怎样的?
2)Trim:把每个read后30碱基去掉。这样做可行否?理由是什么?
3)针对这种情况,更合理、准确的的方法是什么?
谢谢!