问题:
- 给定成分数据,使用Pandas计算各成分之间的相关系数
代码
- 调用函数:pandas.corr()
1、单个文件的情况
import pandas as pd
# 指定文件名称,这里假设数据文件data.csv与此文件位于相同的目录
file_name = './data.csv'
# 读取数据文件
data = pd.read_csv(file_name)
# 可以通过打印数据表的行、列信息以级前几行来简单的了解数据
# print(data.shape)
# print(data.head())
# 调用corr()函数计算数据列之间的相关系数
corr = data.corr();
# 把相关系数结果存储到新的文件中,路径默认为当前文件夹
corr.to_csv('correlation.csv')
2、多个文件的情况
import pandas as pd
# 指定数据文件的路径
file_name_1 = '../dic1/dic2/name1.csv'
file_name_2 = '../dic1/dic2/name2.csv'
file_name_3 = '../dic1/dic2/name3.csv'
file_name_4 = '../dic1/dic2/name4.csv'
# 将数据文件的路径统一到列表中
lists = {file_name_1, file_name_2, file_name_3, file_name_4}
# 使用循环来对数据文件逐个操作
for file_name in lists:
# 读取数据文件
data = pd.read_csv(file_name)
# 计算数据列之间的相关系数
corr = data.corr();
# 为了区分不同的文件计算得到的相关系数,此处通过数据文件名做区分,用split()函数截取原始的数据文件名
out_name = file_name.split('/')[3]
# 将每个数据文件的相关系数计算结果存储到当前路径下,文件名以“correlation与文件名”做拼接
corr.to_csv('./correlation_' + out_name)
本文作者:
whtli
本文链接: https://hexo.whtli.cn/archives/4e858b60.html
版权声明: 遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
本文链接: https://hexo.whtli.cn/archives/4e858b60.html
版权声明: 遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。