Added homework on pandas by ibragimovaamina · Pull Request #5 · ibragimovaamina/Python_BI_2022

ibragimovaamina · 2022-11-11T12:02:22Z

No description provided.

krglkvrmn

Всё круто, жалко, что без второй части

krglkvrmn · 2022-12-10T22:53:08Z

+rrna_gff_df = read_gff('data/rrna_annotation.gff')
+alignment_bed_df = read_bed('data/alignment.bed')


Если код подразумевает работу с данными из каких-то файлов, то эти файлы обязательно нужно класть в репозиторий и указывать относительный путь до них. Исключение только одно - слишком большие файлы, в таком случае можно заливать их маленький кусочек.

krglkvrmn · 2022-12-10T22:53:40Z

+# Function for reading gff files
+def read_gff(path_to_gff):
+    gff_header = ['chromosome', 'source', 'type', 'start', 'end', 'score', 'strand', 'phase', 'attributes']
+    return pd.read_csv(path_to_gff, sep='\t', names=gff_header, comment = '#')


Suggested change

return pd.read_csv(path_to_gff, sep='\t', names=gff_header, comment = '#')

return pd.read_csv(path_to_gff, sep='\t', names=gff_header, comment='#')

krglkvrmn · 2022-12-10T22:54:56Z

+rrnas_by_types = pd.DataFrame({'count' : rrna_gff_df.groupby(['chromosome','attributes']).size()}).reset_index()
+
+# Merging gff and bed files
+merged_df = pd.merge(rrna_gff_df, alignment_bed_df, how='outer', left_on=['chromosome'], right_on=['chromosome'])


Можно чуть проще

Suggested change

merged_df = pd.merge(rrna_gff_df, alignment_bed_df, how='outer', left_on=['chromosome'], right_on=['chromosome'])

merged_df = pd.merge(rrna_gff_df, alignment_bed_df, how='outer', on='chromosome')

krglkvrmn · 2022-12-10T22:57:47Z

+plt.xticks(rotation=90, size=10);
+
+# Extracting rRNAs which intersect with alignment
+rrnas_align_intersect = merged_df[(merged_df['start_x'] >= merged_df['start_y']) & (merged_df['end_x'] <= merged_df['end_y'])]


Рабочий вариант. Можно ещё через query, ИМХО так чуть лаконичнее

Suggested change

rrnas_align_intersect = merged_df[(merged_df['start_x'] >= merged_df['start_y']) & (merged_df['end_x'] <= merged_df['end_y'])]

rrnas_align_intersect = merged_df.query('start_x >= start_y and end_x <= end_y')

Added homework on pandas

e00fd50

krglkvrmn suggested changes Dec 10, 2022

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Added homework on pandas#5

Added homework on pandas#5
ibragimovaamina wants to merge 1 commit into
mainfrom
homework_pandas

ibragimovaamina commented Nov 11, 2022

Uh oh!

krglkvrmn left a comment

Uh oh!

krglkvrmn Dec 10, 2022

Uh oh!

krglkvrmn Dec 10, 2022

Uh oh!

krglkvrmn Dec 10, 2022

Uh oh!

krglkvrmn Dec 10, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

		rrna_gff_df = read_gff('data/rrna_annotation.gff')
		alignment_bed_df = read_bed('data/alignment.bed')

	return pd.read_csv(path_to_gff, sep='\t', names=gff_header, comment = '#')
	return pd.read_csv(path_to_gff, sep='\t', names=gff_header, comment='#')

	merged_df = pd.merge(rrna_gff_df, alignment_bed_df, how='outer', left_on=['chromosome'], right_on=['chromosome'])
	merged_df = pd.merge(rrna_gff_df, alignment_bed_df, how='outer', on='chromosome')

	rrnas_align_intersect = merged_df[(merged_df['start_x'] >= merged_df['start_y']) & (merged_df['end_x'] <= merged_df['end_y'])]
	rrnas_align_intersect = merged_df.query('start_x >= start_y and end_x <= end_y')

Conversation

ibragimovaamina commented Nov 11, 2022

Uh oh!

krglkvrmn left a comment

Choose a reason for hiding this comment

Uh oh!

krglkvrmn Dec 10, 2022

Choose a reason for hiding this comment

Uh oh!

krglkvrmn Dec 10, 2022

Choose a reason for hiding this comment

Uh oh!

krglkvrmn Dec 10, 2022

Choose a reason for hiding this comment

Uh oh!

krglkvrmn Dec 10, 2022

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants