Genetika, genomika ta beste

Biologo baten maitasun gutuna matematikei

Gaur, European Mathematical Societyk eta European Society for Mathematical and Theoretical Biologyk deituta, Biologia matematikoaren eguna ospatzen da. Biologoa naiz eta nire lanean matematikak erabiltzen ditut genetika ikertzeko. Nola da posible hain hurrun dauden bi zientzia hauek uztartzea? Nola ez zoratu matematiken mundu perfektua erabiltzen biologiaren kaosa aztertzeko? Ba, idearik ez, baina urte hauetan erabilitako matematikei birpasa txiki bat egingo diet, esker on bezala.

Biologian eta genetikan gehien erabiltzen den lanabes matematikoa estatistika da. Dudarik gabe, burura datorren lehen adibidea da hori. Oinarrizko estatistikoak datuak deskribatzeko, bi taldeen arteko ezberdintasunak testatzeko (gaixoen eta ez gaixoen arteko ezberdintasunak, adibidez), aldagaien arteko harremanak aztertzeko, etab luze bat. Estatistikarik gabe biologian ikertzea ezinezkoa litzateke. Banaketa normala, , T proba, Mann-Whitneyren U proba, bariantza-analisia, korrelazioa,… biologo batek ezagutu beharreko kontzeptuak dira

Baina biologia eta matematiken arteko harremana sakonagoa da, bai behintzat genetikan dudan eskarmentuarekin.

Bizidunen material genetikoaren arteko harremanak aztertzeko filogenetika izenez ezagutzen den arloa dugu. Bertan matematikak lanabes oso garrantzitsuak dira. DNA sekuentziak lerrotzeko, hots, jatorri ebolutibo berdina duten posizioak bata bestearekin jartzeko, algoritmo gero eta konplexuagoak erabili dira, erkatu nahi diren espezieen material genetikoaren ezaugarrien arabera. Lerrotze globalak, lokalak, penalizazioak, zer hobetsi, etab. luze bat kontuan hartzen dituzten formulak garatu dira ahalik eta lerrotze onenak lortzeko. Eta behin lerrotze hori lortu dela, oinarri matematiko ezberdina duten analisi filogenetikoak burutzen dira: distantzia-matrizeak, sinesgarritasun maximoa edota Bayesiar inferentzia; horiek burutzeko (eta antzeko analisiak egiteko) Bootstrap, Montecarlo metodoa eta Markoven kate ezkutuak erabiltzen direla.

Bestalde, populazioen genetika bezala ezagutzen dugun arloan formulak eta matematikak dira jaun eta jabe. Populazioen material genetikoaren bilakaera aztertzeko, indar ebolutiboak (mutazioa, jito genetikoa, hautespena eta migrazioa) aztertzen edota modelatzen dira formulen bidez. Hain garrantzitsuak dira matematikak arlo honetan makinaria matematiko oso bat garatu dela populazioen jatorri komuna aztertzeko, koaleszentziaren teoria.

Populazioen genetikan oinarrituta, genoma osoko asoziazio analisiak ditugu, kontingentzia taulak eta khi karratu frogak besterik ez direnak. Milioika aldiz eginda. Horregatik erkaketa anitzetarako zuzenketak behar ditugu. Eta, gainera, gero eta genoma osoko asoziazio analisi konplexuagoak egiteko gai gara, aldagai gehiago kontutan hartuta, erregresio linealei, erregresio logistikoei eta eredu konplexuagoei esker.

Noski gehiago daudela, Grafoak, geneen arteko harremanak aztertzeko; Burrows–Wheeler transformaketa, belaunaldi berriko sekuentziazioaren emaitzak aztertu ahal izateko; baina zerrenda hemen geldituko dut. Hain da luzea, biogauzekin lotutako Bioconductor deitutako R lengoaiaren paketeen biltegia dagoela. Bai, biologoa banaiz ere matematikak maite ditut. Eurak gabe ezinezkoa litzaidake nire lana burutzea. Biologia eta matematika gurutzatzen diren lekuan lan egiten dut, bi mundu eder, bata guztiz perfektua izateagatik eta bestea guztiz inperfektua izateagatik, horiek uztartuta.