DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   PHP (http://www.devprotalk.com/forumdisplay.php?f=9)
-   -   DNA, codons, proteins (http://www.devprotalk.com/showthread.php?t=10620)

webarto 21. 12. 2011. 01:58

DNA, codons, proteins
 
Viagra :) Jezik nebitan. Zna li neko?

Given a string representing DNA, return a list of strings each representing one of the proteins coded for by the DNA.

(Some details of DNA and protein are ignored here, you should ignore them too)

DNA is represented as a string whose characters are all in the set [ACGT].
Proteins are represented as a string whose characters are all in the set [GAVLIMFWPSTCYNQDEKRH].
Three adjacent characters in DNA represent a codon. DNA is read one codon at a time and translated into protein. Reading starts with a start codon and stops at a stop codon.

There is one start codon, ATG, which also codes for the protein M (which means for the purposes of these problems that all proteins begin with M). ATG only acts as a start codon if it is not in between another start/stop codon pair.

There are three stop codons, TAA, TAG, and TGA. These do not code for a character in the resulting protein, they simply terminate the protein.

For example, here is a short sequence of DNA:

ACATGGTGCACCTGACTCTCATTTGAGATATAAAAAAACCATGAGATCGA TGGCGCTACGCATAATATAAAAA

It is translated as follows:

(junk) M V H L T L I STOP (junk) M R S M A L R I I STOP (junk)
ACCTCCAAC-ATG-GTG-CAC-CTG-ACT-CTC-ATT-TGA-GATATAAAAAAACC-ATG-AGA-TCG-ATG-GCG-CTA-CGC-ATA-ATA-TAA-AAAAGGCCA

So given the above protein as input your program should return:
MVHLTLI
MRSMALRII

IN
Citat:

// Codons
AAA K Lys
AAC N Asn
AAG K Lys
AAT N Asn
ACA T Thr
ACC T Thr
ACG T Thr
ACT T Thr
AGA R Arg
AGC S Ser
AGG R Arg
AGT S Ser
ATA I Ile
ATC I Ile
ATG M Met*
ATT I Ile
CAA Q Gln
CAC H His
CAG Q Gln
CAT H His
CCA P Pro
CCC P Pro
CCG P Pro
CCT P Pro
CGA R Arg
CGC R Arg
CGG R Arg
CGT R Arg
CTA L Leu
CTC L Leu
CTG L Leu
CTT L Leu
GAA E Glu
GAC D Asp
GAG E Glu
GAT D Asp
GCA A Ala
GCC A Ala
GCG A Ala
GCT A Ala
GGA G Gly
GGC G Gly
GGG G Gly
GGT G Gly
GTA V Val
GTC V Val
GTG V Val
GTT V Val
TAA X STOP
TAC Y Tyr
TAG X STOP
TAT Y Tyr
TCA S Ser
TCC S Ser
TCG S Ser
TCT S Ser
TGA X STOP
TGC C Cys
TGG W Trp
TGT C Cys
TTA L Leu
TTC F Phe
TTG L Leu
TTT F Phe
// DNA
ACATGGTGCACCTGACTCTCATTTGAGATATAAAAAAACCATGAGAGCGA TGGCGCTACGCATAATATAAAAA
OUT
Citat:

MVHLTLI
MRAMALRII

ivanhoe 21. 12. 2011. 05:42

Mislim da nije dobar primer, ja dobijem:

MVHLTLI
MRAMALRII

PHP kôd:

$codons = array(
'AAA' => 'K''AAC' => 'N''AAG' => 'K''AAT' => 'N''ACA' => 'T''ACC' => 'T''ACG' => 'T''ACT' => 'T''AGA' => 'R''AGC' => 'S''AGG' => 'R''AGT' => 'S''ATA' => 'I''ATC' => 'I''ATG' => 'M''ATT' => 'I''CAA' => 'Q''CAC' => 'H''CAG' => 'Q''CAT' => 'H''CCA' => 'P''CCC' => 'P''CCG' => 'P''CCT' => 'P''CGA' => 'R''CGC' => 'R''CGG' => 'R''CGT' => 'R''CTA' => 'L''CTC' => 'L''CTG' => 'L''CTT' => 'L''GAA' => 'E''GAC' => 'D''GAG' => 'E''GAT' => 'D''GCA' => 'A''GCC' => 'A''GCG' => 'A''GCT' => 'A''GGA' => 'G''GGC' => 'G''GGG' => 'G''GGT' => 'G''GTA' => 'V''GTC' => 'V''GTG' => 'V''GTT' => 'V''TAA' => 'X''TAC' => 'Y''TAG' => 'X''TAT' => 'Y''TCA' => 'S''TCC' => 'S''TCG' => 'S''TCT' => 'S''TGA' => 'X''TGC' => 'C''TGG' => 'W''TGT' => 'C''TTA' => 'L''TTC' => 'F''TTG' => 'L''TTT' => 'F',
);

$a 'ACATGGTGCACCTGACTCTCATTTGAGATATAAAAAAACCATGAGAGCGATGGCGCTACGCATAATATAAAAA';

echo 
"DNA: $a\n\n";

solve($a$codons);

function 
solve($sequence$map) {

    
preg_match_all('/ATG((?:[A-Z]{3})+?)(?:TAA|TAG|TGA|$)/'$sequence$match);

    foreach(
$match[1] as $seq) {
        echo 
'M';

        foreach(
str_split($seq,3) as $triplet)
            echo isset(
$map[$triplet])? $map[$triplet] : "(Greska za $triplet)";
            
        echo 
"\n";
    }


moglo je i sa preg_replace_callback() jos elegantnije

jablan 21. 12. 2011. 12:49

Ja dobijam

Kôd:

["MVHLTLI", "MRSMALRII"]
http://ideone.com/SiOh2
ili npr (malo zvirnuo kod ivanhoe) ;)
http://ideone.com/EGDPN

ivanhoe 21. 12. 2011. 13:27

aha, ja sam greskom obrisao onaj spejs u DNA

EDIT: Zapravo nije nista pogresno, nisam pazljivo citao, pa i treba da se dobije MRAMALRII za zadati input...

webarto 21. 12. 2011. 19:46

Primljeni ste :D

Ja sam napravio glupu grešku što nisam čitao sa pažnjom, a kasnije je bilo kasno pošto je vremenski ograničeno, i unosi idu preko STDIN itd...

MVHL
MRAMALRI

P.S. nema spacea, to je greška kako sam postovao.

PHP kôd:

<?php

$start 
'ATG';
$stop = array('TAA''TAG''TGA');
$DNA '';
$CODE = array();

$file file('codons_testcases/input00.txt');

foreach(
$file as $line)
{
    if(
preg_match('#[ACGT]#'$line)) $DNA $line;
    if(
preg_match('#^[GAVLIMFWPSTCYNQDEKRH]{3}\s#'$line))
    {
        
$line explode(' '$line);
        
$CODE[$line[0]] = $line[1];
    }
}

preg_match_all("#($start)(.*?)(".implode('|'$stop).")#"$DNA$matches);

$DNA $matches[0];

function 
replace_codons($DNA, &$CODE)
{
    
$return NULL;
    
$DNA str_split($DNA3);
    foreach(
$DNA as $value)
    {
        foreach(
$CODE as $codon => $char)
        {
            if(
$value == $codon)
            {
                if(
$char == 'X'$char '';
                
$return .= $char;
            }
        }
    }
    return 
$return;
}

foreach(
$DNA as $string)
{
    echo 
replace_codons($string$CODE);
    echo 
"\n";
}

?>


ivanhoe 21. 12. 2011. 21:58

a za sta je ovo pitanje?

webarto 21. 12. 2011. 22:08

Facebook... evo email, možete kontaktirati i dobićete šansu, standardna procedura, bWxhbmdhbkBmYi5jb20= ... Na intervju za PHP, pitaju za šta služi strstr i tako, zadatak je bitan :)


Vreme je GMT +2. Trenutno vreme je 01:40.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.