Időjárásjelentés az Élet hajnaláról (QWERTY billentyűzettel írva)

A napokban jelent meg egy régóta dédelgetett, Kun Ádám-mal közösen írt cikkünk a Scientific Reports-ban. Gondoltam írok róla egy “akadémiai hokedlifoglalót”, hátha elő tudom adni azt érdekesen. Még akár akkor is, ha az olvasó nem biológus. Szemtelen önmarketing következik…

A genetikai kód és a QWERTY billentyűzet talányai

Akad pár hasonlóság az élő szervezetek és civilizációnk vívmányai között. Én napjaimat azzal töltöm, hogy betűk formájában vetem papírra a fejemben keringő gondolatokat. Ehhez a billentyűzet megfelelő gombjait kell lenyomnom egymás után. Ezekből a betűkből végül szavak, és mondatok lesznek.

Ugyanilyen beleéléssel püföli saját kis genetikai billentyűzetét a Föld összes organizmusa, hogy a DNS-ben található, kódolt információt lefordítsa az életfolyamatokhoz nélkülözhetetlen fehérjékre. Ebben az esetben a DNS-en hordozott bázishármasok (pl. AGC, CAA) határoznak meg egy aminosav-sorrendet, mely a fehérjéket alkotja.

A hasonlóság itt nem ér véget. Az emberek túlnyomó többsége ugyanis majdnem ugyanazt a “QWERTY” billentyűkiosztást, vagy annak variánsát használja (1. ábra; a magyar QWERTZ billentyűzet ezzel szinte teljes mértékben megegyezik). Ennek egyik következménye, hogy ékezetektől eltekintve vakon képesek lennénk ugyanazt a szöveget bepötyögni bárhol. Az adott karakterek pozíciója nem változik a klaviatúrán, legyen szó számítógépről vagy telefononról, Svédországtól egészen Kínáig.

1. ábra: A világszerte használt QWERTY billentyűkiosztás (forrás: wikipedia.hu)

Ehhez hasonlóan minden organizmusban ugyanaz a genetikai ”billentyűkiosztás” található meg! Ha fogok egy emberi DNS-darabot, és azt egy másik élőlénybe, például egy baktériumba ültetem át, megkaphatjuk ugyanazt az fehérjét, ami bennem is termelődik. Egy adott bázishármas, csakúgy mint egy leütés helye a klaviatúrán, ugyanarra a karakterre (aminosavra), fog dekódolódni, pl. CCA → prolin, AGG → arginin (2. ábra). Mindenkiben ugyanaz a fordítócsomag, ugyanaz a genetikai kód fut.

2. ábra: A standard genetikai kód, az élő szervezetek billentyűkiosztása

Hiába hasonlít a két példa csak felületesen egymásra, mindkettő felvet egy közös kérdést:

Miért pont ezek a kiosztások terjedtek el?

Miért használ mindenki QWERTY billentyűzetet és miért pont ez standard genetikai kód található meg a Föld valamennyi élőlényében? Milliárdnyi más felosztást el tudunk képzelni. Például a billentyűzeten valaki igazán sorba is rendezhette volna a betűket, mégse azt használjuk. Hasonlóan máig nem tudjuk, hogy miért pont ez egy genetikai billentyűzet terjedt el a Földön és ez miként alakult ki több milliárd évvel ezelőtt. Ez a Földi élet keletkezésének egy kulcskérdése. A kirakós egyik darabkájának feltárásában lesz segítségünkre ha megfejtjük az emberi billentyűzetet.

Miért QWERTY?

Magát a QWERTY-kiosztást még az 1870-es években fejlesztette ki Christopher Latham Sholes. Tervezése a kényelmes, lehető leghatékonyabb gépeléshez lett igazítva. Ehhez a legyakoribb karaktereknek és karakterkombinációknak könnyen kézre kell esniük, s ez az ist jelenti hogy gépelés során az egymást követő betűk leütéséhez a lehető legkisebb távolságot kell megtennie az ujjaknak, mindezt a lehető leggyorsabban.

Ugyanakkor a karakterek gyakorisága függ a beszélt nyelvtől is! Jelentős eltéréseket találhatunk az egyes nyelvek között (3. ábra). Például a kínai pinjin (a mandarin latin betűs átirata) nagyon elüt az európai nyelvektől ebben a tekintetben. Nem mindegy tehát hogy milyen nyelven gépelünk a QWERTY billentyűzeten.

3. ábra: Betűgyakoriságok különböző nyelvek írott formájában (forrás: Xiaojun Bi és mtsai., 2012)

Ezek a különbségek kihathatnak a gépelés hatékonyságára is. Ezt akár mi is könnyűszerrel ellenőrizhetjük (gép előtt ülők előnyben). Az angolban a leggyakoribb egymást követő karakterpárok: t-h, h-g, i-o, míg a pinjinben: z-h, c-h, s-h. Csak nézzük meg mekkorák a távolságok az egyes billentyűk között!

De ha ez nem lenne elég, akár tovább is mehetünk. Kiszámolható, és kísérletesen ellenőrizhető ugyanis, hogy milyen hatékony a QWERTY billentyűzet az egyes nyelvek esetén (4. ábra). Jól látható, hogy az billentyűk közti távolság az angolban és a hozzá valamelyest hasonlító németben a legkisebb. Őket követi a francia és a spanyol. A kínai pinjin-ben sokkal nagyobb távolságokat kell megtenni leütések közben, ez pedig azt is eredményezi hogy ezen a nyelven sokkal lassabban lehet csak gépelni.

4. ábra: Gépelési hatékonyságok különböző nyelveken, a QWERTY billentyűzetet használva (adatok: Xiaojun Bi és mtsai., 2012)

Az okot valószínűleg már az olvasó is gyanítja: e különbségek elsődleges oka az, hogy a QWERTY-kiosztást amerikaiak tervezték, az angol nyelv igényeire szabva. Minél kevésbé hasonlít egy nyelv az angolra, az annál inkább küszködni fog ezzel az univerzális billentyűzettel. A mi kutatásunk egy hasonló gondolatmenetet követett a genetikai kód eredetének feltárásához.

Mit tudtunk meg a genetikai kódról?

Cikkünk egy hasonló jelenség megfigyelése volt a genetikai kóddal kapcsolatban. Azt már sejtjük egy ideje, hogy a genetikai kód valamelyest optimalizálódott a fehérjék gyártásához. Ennek vannak egyértelmű jelei. Például régóta ismert, hogy a genetikai kód próbálja csökkenteni a “félreütés” kockázatát: ha történik egy mutáció a DNS-ben, az továbbra is ugyanazt, vagy hasonló tulajdonságú aminosavat fog eredményezni a fehérjében. Ezzel pedig lesz rá esély, hogy a “félregépelt” fehérje továbbra is működőképes marad.

Az egységes kód ellenére azonban az élőlények is különböző “nyelvjárásokat” használhatnak, más gyakorisággal püfölik e genetikai billentyűzet gombjait (5. ábra). Az eltérés részben a környezet függvénye. Egy bélbaktérium (Escherichia coli) más összetételű fehérjéket igényel, mint pokoli körülményeket is tűrő mikrobák, akik akár még forráspont körüli termálvizekben is vidáman lubickolnak (pl.: Thermus thermophilus és Ignisphaera aggregans).

5. ábra: Bázishármas-gyakoriságok különböző mikrobák fehérjekódoló DNS-ében

Noha a különbségek nem nagyobbak mint irodalmi magyar és a szögedi ömbörök böszéde közti eltérés, az mégis kihathat genetikai kód hatékonyságára. Mi többek között azt mutattuk ki, hogy a forróbb élőhelyeket meghódító organizmusok e téren igenis alulmaradnak a hűvösebb környezetekben éldegélő “szobabacikkal” szemben (6. ábra). A standard genetikai kódot használva nagyobb a mutációk költsége az ún. extremofil organizmusokban, s így ők nem tudnak olyan hatékonyan gépelni.

6. ábra: A genetikai kód hatékonysága különböző mikrobák és azok optimális környezeti hőmérséklete esetén

Miért meglepő ez?

Mindez akár azt is jelenheti, hogy a genetikai kód jelenlegi formája nem biztos hogy extrém forró körülményekre lett kifejlesztve. Sokkal inkább egy enyhe, tavaszias időjárás képe bontakozik ki. Ez részben meghökkentő. Előszeretettel szeretjük azt gondolni, hogy hajdanán az Élet valami Yellowstone Nemzeti Park-szerű világban látott napvilágot, netán mélyvízi vulkanikus füstölgőkből kúszott elő. Én személy szerint mindig úgy képzeltem el az Élet bölcsőjét mint Csodaturmix varázsfőzetét forrni az üstben.

Azonban korántsem lehetetlen az sem, hogy valamikor hűvösebb körülmények uralkodtak a Földön, és ez adott otthont az első mikroorganizmusoknak. Az viszont, hogy ennek forgatókönyvnek a jelentőségét tisztázzuk és komolyan alátámaszthassunk, már a jövő zenéje…

És természetesen ez nem jelenti azt, hogy sikerült minden kérdésre választ találni a genetikai kóddal kapcsolatban. De lett egy új puzzle darabkánk, aminek segítségével több esélyünk lesz kirakni egy teljesebb képet az Élet keletkezésének korai fázisairól.


Források:

Radványi Á. & Kun Á. (2021) Phylogenetic analysis of mutational robustness based on codon usage supports that the standard genetic code does not prefer extreme environments. Sci Rep 11, 10963.

Bi X., Smith B. A. & Zhai S. (2012) Multilingual touchscreen keyboard design and optimization. Human–Computer Interact 27, 352–382.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük