Hemos obtenido permiso para poder ir publicando los logs de los talleres que se están ofreciendo estos días en el canal #semananegra del freenode.
— Log opened sáb may 10 21:54:26 2014
22:08 <@MASTER> empecemos con la intro
22:09 ╺┳╸┏━┓╻ ╻ ┏━╸┏━┓ ┏┓ ╻┏━┓╻┏┓╻┏━╸ ╻ ╻┏━┓ ╺┓
22:09 ┃ ┣━┫┃ ┃ ┣╸ ┣┳┛ ┣┻┓┃┃ ┃┃┃┗┫┣╸ ┃┏┛┃┃┃ ┃
22:09 ╹ ╹ ╹┗━╸┗━╸┗━╸╹┗╸ ┗━┛╹┗━┛╹╹ ╹╹ ┗┛ ┗━┛╹╺┻╸
22:09 <@MASTER> ¿Quien sabe lo que es la bioinformática así a grandes rasgos?
22:09 <@PUPILO> ni idea
22:09 <@PUPILO> yo ni idea
22:10 <@MASTER> vale pues voy a ir ayudando con unos apuntes 🙂
La Bioinformática aborda el estudio, desarrollo y uso de técnicas y herramientas computacionales para el análisis de la información biológica. Estudia el desarrollo de métodos computacionales y técnicas estadísticas para resolver problemas prácticos y teóricos derivados del almacenamiento, extracción, manipulación y distribución de información relativa a macromoléculas biológicas como el ADN, ARN y proteínas
22:11 <@MASTER> es una asignatura multidisciplinar
22:11 <@PUPILO> o/
22:11 <@MASTER> es decir hay que saber de informática biología y química
22:11 <@PUPILO> genial
La bioinformática está fuertemente ligada a la biología molecular. En el momento en que esta última empezó a producir datos y éstos a almacenarse en soporte digital, se dieron las condiciones para iniciar uno de las simbiosis más productivas en la ciencia moderna.
La informática se alió entonces con la biología para gestionar y procesar los datos que producía.
Las secuencias biológicas fueron el punto de partida.
22:13 <@MASTER> Objetivo de la Bioinformática
22:13 <@MASTER> El objetivo principal de la Bioinformática es lograr entender mejor las células
y la manera en que funcionan a nivel molecular. Esto es realizado mediante el análisis de secuencias
moleculares en bruto y datos estructurales
22:13 <@MASTER> De esta manera la investigación en bioinformática puede generar nuevas ideas y ofrecer
una perspectiva global de las funciones célulares
22:14 <@MASTER> ¿mas o menos?, ¿dudas?
22:14 <@PUPILO> de momento, bien
22:14 <@MASTER> seguimos
El genoma es todo el material genético almacenado en las células de un organismo. La genómica es el estudio integral del origen, evolución y funcionamiento del genoma. Su rama estructural estudia la forma espacial de las moléculas, en especial de proteínas y ADN, y las funciones asociadas a ella.
22:14 <@PUPILO> contempla funcionamiento de redes neuronales?
22:15 <@MASTER> ahora se están comenzando a implementar
22:15 <@MASTER> ten en cuenta q para manejar un volumen de datos tan grande necesitas un datacenter
22:15 <@MASTER> La proteómica es el equivalente de la genómica a nivel de proteínas, es decir relaciona las proteínas con sus genes.
La bioinformática es una disciplina relativamente joven en la que continuamente se producen nuevas tecnologías para obtener datos en nuevos experimentos, y que requieren el desarrollo de nuevas estrategias o algoritmos y su implementación en servidores Web que es la forma tradicional en el área de ofrecer los servicios a la comunidad científica.
22:17 <@MASTER> “Secuencia”: Composición de nucleótidos del ADN, o la de aminoácidos de una proteína. Puede puede corresponder a un gen, un genoma, o a una parte de ellos. La obtención de estas secuencias (secuenciación) y en particular la del ADN completo de un organismo es el punto de partida de muchos proyectos de genómica.
Mediante técnicas de secuenciación, es posible “romper” el ADN e identificar la composición de pequeños fragmentos que luego se van uniendo hasta formar largas cadenas de letras (cada base del ADN se representa con una de las letras A, C, G o T). Éstas se almacenan en fichas en bases de datos
22:18 <@MASTER> ¿El código de la vida?
22:18 <@MASTER> Imaginemos que hemos encontrado un libro escrito en un lenguaje extraño del que no conocemos aún como se forman las palabras ni cuales son los símbolos de puntuación. De momento sabemos que ese libro es el manual de instrucciones del funcionamiento de un organismo. Ayudar a descifrarlo es la tarea básica de la bioinformática
22:18 <@MASTER> Por lo tanto hay que empezar por ver que dice el libro. Desafortunadamente no podemos leerlo completo de un tirón porque nuestras tecnología (unas gafas particulares por ejemplo) solo abarcan unas pocas líneas cada vez. Debemos pues leerlo por trocitos que cortamos al azar y que sí somos capaces de leer. Una vez leído cada pequeña parte tenemos que ensamblarlo como si fuera un puzzle, viendo qué piezas encajan con la siguiente (en palabras sencillas, el fin de una es igual al inicio de otra).
Curiosamente mientras la producción de datos crece, las técnicas computacionales para procesarlos se hacen más complejas. Se requieren algoritmos más complejos y máquinas más potentes.
En nuestro símil del libro de la vida, ahora ya tenemos todos sus símbolos ordenados en secuencia, pero desconocemos su significado, donde empiezan las recetas, donde se indican las cantidades a producir o combinar, etc.
22:20 * binario ¿es posible crear un servidor web con patatas?
22:20 <@MASTER> binario, sep
22:21 <@MASTER> Una de las primeras tareas de soporte bioinformático está en la gestión de los datos de la secuenciación. Aunque las primeras colecciones de datos se almacenan en ficheros “planos” (sin formato) por generalización se ha denominado como “bases de datos biológicas”
22:21 <@MASTER> Estas bases de datos contienen un conjunto de fichas de secuencias en las que, además de la secuencia en sí, se anotan otros datos de las mismas: se les da un código, se indica a que organismo pertenece, quien la descubrió… pero entre estas anotaciones, una de las más importantes se refiere a la “función” de dicho gen o proteína: qué es lo que hace?, en qué proceso biológico está involucrada?.
22:21 <@MASTER> La gestión de estos datos, su exposición pública en servidores accesibles por Internet es una de las áreas mas informáticas. La definición de estándares para almacenar y compartir con otros centros son tareas típicas de la gestión de datos de secuencias
Ejemplo de una secuencia genética (un virus): http://www.ncbi.nlm.nih.gov/nuccore/NC_001611.1?report=fasta&log$=seqview&format=text
22:22 <@MASTER> eso es una secuencia genética
22:23 <@MASTER> ¿dudas hasta aquí?
22:23 <@PUPILO> va bien
22:23 <@PUPILO> ¿como la bioinfo puede ayudar a sacar algoritmos sobre el cerebro humano?
22:24 <@MASTER> todo esta codificado en el ADN fantanaranja 🙂
22:24 <@PUPILO> ¿algún modelo de por ejemplo redes neuronales artificiales?
22:24 <@MASTER> las neuronas y su funcionamiento están codificadas pero no sabemos leer aun el ADN
22:24 <@MASTER> ahora comenzaremos con el análisis de secuencias
22:25 <@MASTER> 5 min para asimilar y continuamos
22:25 <@PUPILO> curioso ese virus
22:25 <@MASTER> y letal
22:25 <@PUPILO> ¿la bioinfo entonces es para saber interpretar ese código?
22:26 <@MASTER> sirve para muchas cosas
22:26 <@PUPILO> es como si existe un código del humano y esta ciencia lo que hace es intentar interpretarlo?
22:26 <@MASTER> claro hay q interpretarlo pero es tan vasto y grande
22:26 <@MASTER> q se precisan ordenadores. Una cadena de ADN humano son 3mil millones de pares de bases
22:27 <@PUPILO> ¿a qué se refiere con par de bases?
22:28 <@PUPILO> ¿doble hélice?
22:28 <@PUPILO> oh, ¿están hablando del taller de bioinformática?
22:29 <@PUPILO> hay mas átomos en una cadena de ADN que estrellas en el universo visible, la nueva temporada de cosmos se sale.
22:29 <@PUPILO> XD
22:30 <@MASTER> correcto
22:30 <@MASTER> las bases son los nucleotidos que forman la cadena de ADN y van emparejados
22:30 <@MASTER> A-T y C-G
22:31 * PUPILO si PUPILO , estamos ahora preguntando cosas.
22:31 <@MASTER> q va hombre los atomos de una cadena de dna se pueden contar
22:31 <@MASTER> lol
22:31 <@MASTER> ah universo visible ok
22:32 <@MASTER> mas dudas por favor. Esto es la base hay que tenerlo claro.
22:33 <@MASTER> binario, ahi tienes un server con Patatas lol http://d116.com/spud/spud.jpg
22:35 <@PUPILO> muy bonito
Servidor web realizado con patatas:
22:36 <@PUPILO> nos pillas verdes, danos ejemplos.
22:39 <@PUPILO> la potencia de la bioinfo permitirá crear mutaciones de hombres y mujeres perfectos/as?
22:39 <@PUPILO> crees por tanto que esto generará diferentes clases sociales?
22:39 <@MASTER> para quien pueda pagarlo claro
22:39 <@PUPILO> es decir, que es un peligro probablemente
22:40 <@MASTER> teniendo las herramientas si
22:41 <@PUPILO> ¿es posible al día de hoy?
22:41 <@MASTER> por eso USA acusó a uno que monto un laboratorio en su garaje como bioterrorista
22:41 <@MASTER> ya te digo es cuestión de tener las herramientas
22:41 <@MASTER> el conocimiento lo tenemos, puedes crear una vacuna de la gripe o un virus mortal
22:41 <@MASTER> la diferencia es la colocación de las bases en la cadena
22:42 <@MASTER> el orden del DNA
22:43 <@MASTER> tu metes adn en un secuenciador de electroforesis
22:43 <@MASTER> y te sale algo como esto
22:43 <@MASTER> http://www.pnas.org/content/103/19/7240/F4.large.jpg
Ejemplo de ADN en un secuenciador de electroforesis:
22:44 <@MASTER> una vez secuenciado los científicos lo suben a las bases de datos
22:44 <@MASTER> y hablamos de cualquier organismo vivo. Bacterias plantas animales…
22:45 <@MASTER> ¿mas dudas? 22:46 <@PUPILO> ¿por qué decías antes que no se puede entender el ADN referente a las neuronas cerebales?
22:46 <@PUPILO> ¿No sacan el patrón o algo?
22:47 <@MASTER> ahora comenzamos con el análisis de las secuencias. Es la segunda parte
Obtener los datos de las secuencias es el primer paso, en particular en los proyectos de genómica. “Interpretar el ADN significa conocer donde están los genes y cuales son las señales que los regulan”.
Esta área se enmarca dentro de la genómica funcional y va desde la identificación de las zonas que codifican hasta la asignación de función (cual es el trabajo que realiza dicha señal o cual es su significado, qué proteína sintetiza y en qué procesos biológicos interviene.
Por tanto, después del ensamblado se procede a la identificación de genes y señales de control.
La identificación de genes en procariotas es más sencilla puesto que prácticamente todo el ADN codifica para proteínas, pero en los eucariotas –humanos por ejemplo- aproximadamente solo el 3% del ADN codifica proteínas y está “oculto” en montañas de datos.
22:48 <@PUPILO> O_o
22:49 <@MASTER> Dentro del análisis de secuencias, la comparación entre ellas es posiblemente la tarea bioinformática más frecuente.
22:49 <@MASTER> Cuando se dispone de una nueva secuencia obtenida en el laboratorio la primera pregunta a resolver es ¿para que usa el organismo esta secuencia?, ¿cuál es su función?
Asignación de función por homología
La forma “bioinformática” de resolver el problema consiste en compararla con todas las secuencias conocidas, que se almacenan en las bases de datos. Si durante el proceso se encuentran secuencias “parecidas” a la secuencia desconocida, podemos inferir –por su parecido- que desarrollan funciones biológicas similares.
22:49 <@PUPILO> O_-
22:49 <@MASTER> ¿vale mas o menos no?
22:50 <@MASTER> también se usa el análisis para la obtención de arboles filogeneticos y comparar genes entre organismos.
22:51 <@MASTER> venga a mi me surgen muchas preguntas
22:52 <@PUPILO> ¿es verdad eso de que compartimos casi la misma estructura genética con el simio?
22:53 * lulzcat algunos más que otros
22:53 <@MASTER> si en un 99% compartimos los genes
22:53 <@MASTER> http://www.lavozdegalicia.es/sociedad/2007/09/28/00031190958276609862.htm
22:53 <@MASTER> ¿se puede quitar un gen de un organismo y meterlo en otro?
22:53 <@MASTER> Mirad la rana transparente
Rana transparente modificada geneticamente:
22:54 * fantanaranja flipando con rana transparente
22:55 <@PUPILO> ¿pero han modificado a la rana para que sea transparente?
22:55 <@MASTER> Un mono que brilla en la oscuridad con genes de otros animales que brillan?
22:55 <@MASTER> https://bioweb.uwlax.edu/bio203/f2013/zaleski_rona/rhesus-monkey-glowing-animals_11831_600x450.jpg
22:55 <@PUPILO> ¿entonces la han modificado para ser transparente?
22:55 <@MASTER> claro
22:55 <@PUPILO> OMG
Mono que brilla en la oscuridad:
22:56 <@MASTER> el mono fosforescente es epic lol
22:56 <@PUPILO> «cuando vayas al bar en el futuro te encontrarás a gente transparente»
22:56 <@PUPILO> ¿pero entonces será normal entrar a un bar en el futuro y que sea como Star Wars no?
22:56 <@PUPILO> gente parecida a cheewaka
22:56 <@MASTER> loool
22:57 <@PUPILO> otros transparentes y esas cosas.
22:57 <@MASTER> no se
22:57 <@MASTER> el futuro lo hacemos nosotros
22:58 <@MASTER> los genes son los que codifican, sí corto el gen que codifica algo en un organismo
22:58 <@MASTER> y lo pego en la cadena de otro organismo y hacemos que ese gen se exprese
22:58 <@MASTER> tenemos un mono fosforescente como las luciérnagas
22:59 <@MASTER> ahorraríamos en luz con perros fosforescentes xD
22:59 <@PUPILO> ¿en qué momentos de ante-vida o vida es más posible realizar ese tipo de modificaciones genéticas?
23:00 <@MASTER> ¿tu dices de conformar una cadena completa y ponerla a trabajar?
23:00 <@MASTER> pues como hace la vida. Con la mitosis y la meiosis
23:00 <@MASTER> metes el material genético en una célula
23:00 <@MASTER> y a esperar que se replique
23:00 <@PUPILO> esa foto es fake
23:00 <@PUPILO> vale, gracias
23:01 <@MASTER> fantanaranja, ¿esta prohibido hacerle eso a un mono?
23:01 <@MASTER> no es ético pero poder se puede hacer
23:01 <@PUPILO> bueno, lo veo mejor para un trabajador de carreteras
23:01 <@PUPILO> se ahorra ponerse el peto ese.
23:01 <@PUPILO> es flipante !
23:01 <@MASTER> esta prohibido hacerse un clon
23:01 <@MASTER> si esta prohibido
23:01 <@MASTER> es posible hacerlo? si
23:01 <@PUPILO> podemos clonarnos y tener un clon fluorescente?
23:02 <@MASTER> totalmente
23:02 <@PUPILO> yo quiero un clon fluorescente
23:02 <@MASTER> jajajaja
23:02 <@PUPILO> y dónde está el limite ético?
La bioética
La bioética es lo que hace que un científico no se levante un mal día en el que su mujer le ha puesto los cuernos y quiera liberar un virus pandemico.
23:02 <@PUPILO> y un clon con escamas?
23:02 <@MASTER> ahi entra la bioética
23:02 <@PUPILO> ¿qué es ético y qué no?
23:02 <@MASTER> efectivamente, ¿que hace que un científico no se levante un mal dia porque su mujer le ponga los cuernos y quiera liberar un virus pandemico?
23:03 <@MASTER> la bioética
23:03 <@PUPILO> ¿su buena conciencia?
23:04 <@MASTER> es muy importante
23:04 <@PUPILO> ¿eso existe? xD
23:04 <@MASTER> claro es una asignatura
23:04 <@MASTER> de biotecnologia
23:05 <@MASTER> ¿Qué es legal?
23:05 <@MASTER> ¿Que es ilegal?
23:06 <@PUPILO> ¿podríamos ponerle a ZP unas cejas fluorescentes?
23:06 <@PUPILO> xD
23:06 <@MASTER> es un poder muy grande poder clonar a alguien con un pelo
23:06 <@PUPILO> xDD
23:09 <@MASTER> sigamos
23:09 -!- lulzcat is now known as kasdelimon
23:09 <@MASTER> sabemos lo que son los genes
23:09 <@PUPILO> loool
23:09 <@kasdelimon> langus7: o/
La secuencia de aminoácidos que está codificada por un gen se conoce como la estructura primaria o lineal de la proteína.
Esta secuencia guarda relación lineal con el gen que la codifica. Esta relación está establecida por el código genético que para cada triplete de nucleótidos indica el correspondiente aminoácido.
Hay 20 aminoácidos, mientras que las bases del ADN son solamente 4.
Uno de los problemas que más cautiva (y que aún no se ha resuelto) es la predicción de la estructura de la proteína a partir de su secuencia de aminoácidos. Está demostrado que dicha estructura depende o está codificada íntegramente en la secuencia, pero el modelado de las interacciones entre átomos es un problema complejo en el que se dedica mucho esfuerzo de los grupos de investigación.
23:09 <@MASTER> voy a poner un vídeo para explicar esta parte
23:10 <@PUPILO> seee
23:10 <@MASTER> http://www.youtube.com/watch?v=_GhwvxDUiIw
23:11 <@PUPILO> videín ye!
23:12 <@MASTER> como veis en el vídeo así se conforma la estructura 3d de una proteína
23:13 <@PUPILO> a mi me odia, uso ff xDD
23:13 <@PUPILO> sorry
23:13 <@PUPILO> estamos mirando el vídeo aún
23:13 <@PUPILO> bueno, acaba de terminar
La información tri-dimensional de las estructuras de proteínas se almacena en bases de datos (por ejemplo, PDB: Protein Data Bank) en las que se incluye la posición espacial de cada uno de sus átomos lo que permite reproducir la conformación espacial de estas moléculas.
El problema es el siguiente:
Los genes modifican sus niveles de actividad o expresión como respuesta a determinados estímulos, o según la localización del tejido en que se encuentran, o en función del tiempo transcurrido de la respuesta, etc.
Estos cambios de expresión (de los niveles de proteínas sintetizadas por los genes) tienen una gran influencia en los procesos biológicos relacionados con los genes que cambian de nivel.
En realidad lo que siempre nos ha interesado son los niveles o las proporciones de las proteínas, ya que éstas son el descriptor elemental del estado de la célula o del mecanismo de respuesta de un organismo ante una condición particular. Sin embargo, la tecnología para proteínas aún no está del todo lista, y lo hacemos sobre genes, asumiendo una relación lineal entre el nivel de expresión del gen y la proporción de proteína (lo cual no deja de ser una hipótesis de trabajo).
Los experimentos de expresión génica permiten observar el comportamiento (niveles de expresión) dinámico de miles de genes ante determinadas condiciones experimentales.
Los genes modifican sus niveles de expresión en respuesta a estímulos externos, o dependiendo del tejido en que se encuentran, etc. Estos cambios alteran las proporciones relativas de proteínas en la célula y pueden tener efectos muy profundos en las funciones biológicas en las que intervienen, siendo la razón clave para detectar las alteraciones fisiológicas o patológicas y aqui vienen las enfermedades geneticas como el cancer.
Cuando un organismo no funciona correctamente se estima que los genes involucrados en el malfuncionamiento están teniendo niveles de expresión diferentes que el que tendrían en un tejido u organismo sano. Esta es la idea que subyace en los experimentos de expresión génica: detectar que genes (de un tejido enfermo, por ejemplo) tienen una expresión diferencial con respecto a un tejido de referencia (sano).
23:19 <@MASTER> ya he terminado
http://elbinario.net/2014/05/11/virtual-workshop-sobre-bioinformatica/