Bioinformatyka ĆWICZENIE 7
1. Zasady stosowania pakietu SAS - prezentacja.
2. Omówienie programu SAS stosowanego na ćwiczeniach.
3. Samodzielne przygotowanie programu w SAS służącego do obliczabia wsp. rekombinacji pomiędzy markerami z własnego zbioru danych:
• przeliczyć wsp. rekombinacji na cM przy użyciu funkcji Haldane'a
• przeliczyć wsp. rekombinacji na cM przy użyciu funkcji Kosambi
Wzór programu:
/* czytanie danych */ data REKOMB ;
z danymi]" ; osobnika */
1 i 2 w markerze 1 */ 1 i 2 w markerze 2 */ 1 i 2 w markerze 1 */
infile "[podać ścieżkę i nazwę pliku input 01 ID /* numer
03 L1A1 04 L1A2 /* allel
06 L2A1 07 L2A2 /* allel
08 L3A1 09 L3A2 /* allel
(kontynuować dla wszystkich markerów]
*/
/* tworzenie haplotypów dwumarkerowych data REC1 (keep=H12) ; set REC ;
H12=L1A1*10+L2A1 ; output ;
H12=L1A2*10+L2A2 ; output ;
[kontynuować dla pozostałych par markerów: 2-3, 3-4 itd.] run ;
/* obliczanie liczebności poszczególnych haplotypów */ proc freq data=RECl ;
tables H12 / out=COUNTHAP12 ;
tables H23 / out=COUNTHAP23 ; [dla pozostałych haplotypów] run ;
/* sortowanie haplotypów wg liczbności */ proc sort data=COUNTHAP12 ; by COUNT; run ; proc sort data=COUNTHAP23 ; by COUNT; run ;
/* obliczanie wsp. rekombinacji i cM wg funkcji Haldane*a */ [kontynuować dla pozostałych haplotypów] data C0UNTHAPal2 ; retain NO; set C0UNTHAP12 ;
N=N+1 ; run ;
data REC2 ;
retain REC 0 NREC 0 ; set C0UNTHAPal2 ;
if N=1 or N=2 then REC=REC+COUNT ; else if N=3 or N=4 then NREC=NREC+COUNT ; RECOMBINATION=REC/(REC+NREC) ;
HALDAN E_CM=-0.5*log(l-2* RECOMBINATION) ; run ;
proc print data=REC2 ; run ;