Loading...
墨滴

谢大飞

2021/06/16  阅读:90  主题:默认主题

Rstudio导入/导出数据

导入数据

导入数据
导入数据

也可以使用命令行来导入数据

gene_exp <- read.table(file = 'C:/Users/daily_learn/gene_class/bioinformation_start/training/R_basic',
                       header = TRUE,
                       row.names = 1,
                       sep = '\t')

但是我们直接从文件夹得到的文件的路径地址是这样

C:\Users\daily_learn\gene_class\bioinformation_start\training\R_basic

然后很多的斜杠会导致产生转义字符导致Rstudio在读取文件的路径时会出错,所以需要将路径改为正确的路径,一种方法时在\前面再加上一个\这样就可以将斜杆变为本来的意思,或者将斜杆换一下/换成相反的方向就可以找到

求样本之间的相关性

### 检验生物学重复之间的重复率好不好,及检验样本相关性
sample_cor <- cor(gene_exp)
View(sample_cor)

# 保留两位小数
sample_cor <- round(sample_cor, digits = 2)
View(sample_cor)

# 导出表格,其中quote用来规定表格的第一行没有“”
write.table(sample_cor, file = 'output/sample_cor.tsv', sep = '\t', quote = FALSE)

write.table(sample_cor, file = 'output/sample_cor.csv', sep = ',', quote = TRUE)
#导出csv格式可以直接用excel进行查看

tsv是用制表符用来分隔的,csv是用逗号来进行分隔的然后可以用excel直接打开 但是这个样子看到的还是表格的数据形式,不能很好的看到样本之间的相关性,所以最好的就是画个热图,然后根据颜色来判断相关性的高低

画个热图

## 画张热图
### 安装画图的R包
install.packages('pheatmap')

### 加载R包
library(pheatmap)

pheatmap(mat = sample_cor)          #直接根据相关性以及其他的内容进行聚类和表达

#如果不想先聚类再看相关性的话可以加一些参数
pheatmap(mat = sample_cor,
         cluster_rows = FALSE,
         cluster_cols = FALSE)

聚类之后的热图 聚类热图

指定不进行聚类的热图 不聚类的热图

保存图片

保存图片最好保存成PDF格式,这样的话方便放大或者保存等后续使用 可以直接用Export来导出 Export

或者使用命令来导出

pdf('output/sample_cor.pdf')
pheatmap(mat = sample_cor,
         cluster_rows = FALSE,
         cluster_cols = FALSE)
dev.off()

位图和矢量图的区别

位图(bitmap):也称为点阵图像或者绘制图像,是由无数个单个点组成通过不同的排列和染色构成,当放大位图的时候会很模糊看见构成整个图像的无数个方块 格式:JPG、BMP、PSD等 可以用Photoshop、美图秀秀等用来处理

矢量图:是根据几何特性来绘制图形的,文件占用的内存空间较小,放大后图像也不会失真,因为矢量图包含独立的分离图像,可以无线的重新组合 格式:CDR、AI、PDF、PS、 可以用AI来进行处理

谢大飞

2021/06/16  阅读:90  主题:默认主题

作者介绍

谢大飞