Cartografierea fizică - biologie

Cartografierea fizică descrie metoda în care secvența unui cromozom poate fi obținută prin aranjarea corectă a clonelor dintr-un proces clonă cu clonă. Datorită noilor metode bioinformatice, viteza cartografierii genelor s-a înmulțit în ultimii ani.

cartografierea

Problemă

Scopul cartografierii fizice este de a crea o secvență completă a unui genom. Când cromozomii sunt secvențați, apar anumite probleme, ceea ce înseamnă că numai secțiunile cu o dimensiune de aproximativ 800 pb pot fi secvențiate dintr-o singură dată. O posibilitate de a rezolva această problemă este de a utiliza informații suplimentare pentru a pune fragmentele de secvență într-o ordine și aranjament corect și, astfel, pentru a obține un cromozom complet din totalitatea lor.

Fundal biologic

Pentru a putea determina ordinea clonelor (clonele în acest context se referă la secvențe mici de ADN; clonele deoarece sunt copii parțiale ale cromozomului), clonele trebuie să se suprapună, iar sondele trebuie să poată determina dacă și care clone se suprapun. Pentru a obține suficiente clone, cromozomul este duplicat și tăiat cu enzime de restricție, care, în funcție de metodă, este folosit pentru problema digestivă parțială, sau la problema digestiei duble Oportunitati. Înainte ca clonele să fie secvențiate, hibridizarea clonă-sondă este utilizată pentru a determina ce clone hibridizează cu care sonde. Deoarece sondele sunt alese astfel încât (în mod ideal) să apară o singură dată în cromozom, se poate crea o matrice de hibridizare clonă-sondă cu ajutorul căreia se pot determina suprapunerea și dispunerea clonelor. Știind cum se suprapun clonele, este posibil să nu fie nevoie ca toate să fie secvențiate.

Cazul impecabil

Presupunând toate clonele

  1. au aceeași lungime
  2. toate suprapunerile sunt unice (fiecare sondă se leagă doar într-un singur loc) și
  3. toate hibridizările atestă suprapuneri reale

ceea ce înseamnă că nici o hibridizare nu se leagă într-un loc greșit, astfel încât să pară o suprapunere în care nu este niciuna, ordinea clonelor poate fi stabilită clar cu un arbore PQ sau prin rezolvarea o problemă consecutivă.

Matricea de hibridizare clonă-sondă este o matrice bidimensională, ale cărei rânduri reprezintă o clonă pe rând și fiecare coloană pentru o sondă pe coloană. Câmpurile matricei sunt marcate cu 1 dacă sonda respectivă hibridizează cu clona respectivă, altfel cu 0.

Clonați 1 2 3 4 5 6
1 1 0 0 1 1 0
2 0 1 1 0 1 0
3 1 1 0 0 1 0
Al 4-lea 0 1 1 0 0 1

Căutăm o ordine a coloanelor acestei matrice M, astfel încât să existe exact un bloc conectat de unități în fiecare rând. Un astfel de bloc se numește consecutiv. Un astfel de bloc arată apoi care sonde sunt una lângă alta pe o clonă. Clonele care hibridizează parțial cu aceleași sonde se suprapun, părțile lor care nu se suprapun sunt la stânga și la dreapta suprapunerilor.

Pentru a rezolva această problemă, matricea este convertită într-o structură de date numită arbore PQ.