# root = Path("/mnt/c/Users/alexi/Documents/mustard")
def readExome(root):
e = pd.read_csv(root /
"Suivi exomes_2022-02-02_12-34-15.tsv",
sep= "\t")
# Clean up data first
e = e[['patientID', 'specimenID',
'presta', 'capture', 'sequencage',
'date_reception',
'resultat', 'incidental', 'commentaires', 'runComments']]
return e
def readDNA(root):
dna= pd.read_csv(root /
"DNAThèque_2022-02-02_11-46-28.tsv",
sep="\t")
dna = dna [['patientID',
'sampleID',
'sampleIDdate_de_reception',
'sampleIDorigine_de_l_echantillon',
'commentaires']]
# Clean column name
dna.columns = dna.columns.str.replace('dataSetsPatients', '')
return dna
def readPatients(root):
patients = pd.read_csv(root / "Patients_2022-02-02_11-44-03.tsv",
sep = "\t")
patients = patients[['patientID', 'nom', 'prenom', 'date_de_naissance',
'date_de_deces', 'sexe', 'parente', 'statut', 'foetus', 'consanguinite',
'clinicien_referent', 'clinicien_referentinstitution', 'pathologie',
'gene', 'commentaires']]
return patients
def cleanExome(d):
cols = ['nom', 'prenom', 'date_de_naissance',
'sexe', 'parente', 'statut',
'clinicien_referent', 'clinicien_referentinstitution', 'pathologie',
'gene',
'sampleIDdate_de_reception', 'sampleIDorigine_de_l_echantillon',
'patientIDexome', 'presta', 'capture', 'sequencage',
'date_reception', 'resultat', 'incidental', 'commentairesexome',
'commentaires' ,
'commentairesdna']
d = d[cols].rename(columns = {"gene": "gene_responsable"})
# Remove none
d['gene_responsable'].replace("None", "", inplace=True)
return d