¡Hola! Solo quiero aprovechar este espacio para agradecerles todo su tiempo, dedicación y esfuerzo.
Me fue imposible seguir el ritmo, voy muy atrasada en cuestión de Mumuki y no se diga Ciencia de Datos ni Bioinformática. Mi intención de este README es platicar sobre la idea que más o menos había pensado, y está basada en un trabajo que realicé junto con otras 5 compañeros durante el proyecto final del 1er Verano de Bionformática, que se realizó en la UNAM campus Juriquilla en Querétaro, Qro. México:
Uno de mis compañeros de proyecto estaba en búsqueda de genes de una planta silvestre Argentina (Figura 1: Final_tgf.pdf) que codifican para proteínas de defensa a diversos factores bióticos y abióticos. Esta planta forma parte de la familia de las solanáceas como el tomate y la papa. Entonces lo que se realizó es buscar en bases de datos como el NCBI las proteínas ya descritas para esta familia de plantas que les aportan defensa contra factores abióticos y bióticos (no recuerdo si era temperatura, sequía y algún otro).
Se hizo una lista con dichas proteínas, y mediante Python se generó un df con información sobre la planta, su nombre científico, secuencia de gen, secuencia de proteína, tipo de protección; y se metió a un software en línea (no recuerdo el nombre) para realizar el análisis filogenético y agrupar según el tipo de protección.
Empleando el servidor de forma remota que usamos durante el Verano, y empleando un archivo .fasta con las sencuencias se alinearon las sencuencias de las proteínas expresadas por los genes de resistencia a solanáceas. Después empleando tanto el df como los alineamientos, se generó un archivo el cual se introdujo a ITOL para generar un árbol filogenético con dicha información. Primero obtuvimos un resultado no muy interesante ni atrayente (Figura 2: Final_tgf.pdf), pero después con la ayuda de un asesor (7° integrante del equipo) pudimos obtener la imagen que presentamos como producto final del proyecto (Figura 3: Final_tgf.pdf).
En esta figura 3, observamos la relación filogenética entre las especies de solanáceas y sus proteínas de resistencia a factores bióticos y abióticos. No recuerdo bien qué significan los colores, pero cada uno representa un factor abiótico.
Regresando al Camp 2023, debido a que me asignaron más horas frente a grupo (monitoreo de materia), y también capacitaciones, encargos, me fui atrasando y atrasando sin poder continuar adecuadamente con el Camp. La idea era generar un árbol filogenético parecido al de las solanáceas generado en el Proyecto Final del 1er Verano de Bioinformática, Juriquilla 2016; pero empleando otra familia de plantas como las liláceas.
Pero no se pudo
Me da mucha pena, pero creo que independientemente de que no se pudo lograr el objetivo final, aprendí y sigo aprendiendo del Camp y mis compañeras. Agradezco la oportunidad, y en caso de que suceda otra edición, mucho me gustaría, poder participar.
¡MUCHAS GRACIAS POR TODO! Saludos desde México.
Dejo por aquí el enlace del video de YouTube que se solicitó: WBDS LA Camp - Final_tgf