Pandas Skills and Tricks

remove duplicates from correlation in pandas

from https://stackoverflow.com/questions/48395350/how-to-remove-duplicates-from-correlation-in-pandas

import numpy as np
import pandas as pd
data = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))

dataCorr = data.corr(method='pearson')
dataCorr = dataCorr[abs(dataCorr) >= 0.01].stack().reset_index()
dataCorr = dataCorr[dataCorr['level_0'].astype(str)!=dataCorr['level_1'].astype(str)]

# filtering out lower/upper triangular duplicates
dataCorr['ordered-cols'] = dataCorr.apply(lambda x: '-'.join(sorted([x['level_0'],x['level_1']])),axis=1)
dataCorr = dataCorr.drop_duplicates(['ordered-cols'])
dataCorr.drop(['ordered-cols'], axis=1, inplace=True)

read table value as string

from https://stackoverflow.com/questions/16988526/pandas-reading-csv-as-string-type

pd.read_table(table_file, dtype=np.str)

[返回首页]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Pandas Skills and Tricks

remove duplicates from correlation in pandas

read table value as string

FilesExpand file tree

pandas-tricks.org

Latest commit

History

pandas-tricks.org

File metadata and controls

Pandas Skills and Tricks

remove duplicates from correlation in pandas

read table value as string