我正在分析来自实验的基因表达数据,其中我有(i)6只不同的小鼠(A:D); (ii)2个不同的时间点(" pre"" post" treatment); (iii)2种不同的反应类型("响应者" vs."非响应者")。在应答者与非应答者治疗后,我试图找到具有差异表达的基因。换句话说:如果我看一下治疗后基因表达的变化与“前”相比,哪些基因在应答者中与非应答者相比差异表达?另外,我如何包含“配对”#39;在我的分析方面,我可以通过以配对而不是一般的方式运行上述分析来获得更有意义的信息?
我花了一整天的时间阅读有关设计差异表达设计矩阵的教程,但我无法确定细节,我希望有经验的人可以提供帮助。< / p>
一个可重复的小例子:
ms = factor(rep(c("A", "B", "C", "D", "E", "F"), each = 2)) # Mouse ID
rx = factor(rep(c("Pre", "Post"), 6)) # Pre or Post treatment
rp = factor(c(rep("NR", 6), rep("R", 6))) # Is the mouse a 'responder' or 'non-responder'?
data.frame(ms, rx, rp)
ms rx rp
1 A Pre NR
2 A Post NR
3 B Pre NR
4 B Post NR
5 C Pre NR
6 C Post NR
7 D Pre R
8 D Post R
9 E Pre R
10 E Post R
11 F Pre R
12 F Post R
我想做的理想分析如下,但包括配对设计,这有望使分析更强大:
(Post / Pre in responders) / (Post / Pre in non-responders)
第一个术语(&#34;响应者中的Post / Pre&#34;)将在响应者中找到DE基因,并通过除以第二个术语(&#34;非响应者中的Post / Pre&#34;)理想情况下,我会得到仅在反应者中差异表达的基因。
我试过运行&#34; Post / Pre&#34;分别在响应者和非响应者中进行分析,并按照上面的代码手动分割,但感觉不对,并且必须有一种真正的方法来运行适当设计的矩阵。
写完这篇文章后,我意识到这可能过于生物化,而不是编程。如果是这种情况,请告诉我,如果您知道提出这个问题的好地方。非常感谢。