Lipid Modification Database
Tag Content
LipidDB ID
LipidDB-36329-00221
Entry Name
UniProt Accession
Theoretical PI
6.11
Molecular Weight
195726.0
Genbank Protein ID
Genbank Nucleotide ID
Protein Name
Protein Synonyms/Alias
Merozoite surface protein 1;
Gene Name
MSP1
Gene Synonyms/Alias
PFI1475w;
Created Date
01-MAR-2003
 Lipid Modification Sites 
 Position   Sequence Form   Peptide   References   Modification Type 
8
Canonical
MKIIFFLCSFLFFII
[1]
S-Palmitoylation
Organism
Plasmodium falciparum (isolate 3D7)
NCBI Taxa ID
36329
Reference
[1] Predicted from GPS-Lipid
Functional Description
Sequence Annotation
Protein Length
1720 AA.
Protein Sequence
(Canonical)
MKIIFFLCSF LFFIINTQCV THESYQELVK KLEALEDAVL TGYSLFQKEK MVLNEEEITT  60
KGASAQSGAS AQSGASAQSG ASAQSGASAQ SGASAQSGTS GPSGPSGTSP SSRSNTLPRS  120
NTSSGASPPA DASDSDAKSY ADLKHRVRNY LFTIKELKYP ELFDLTNHML TLCDNIHGFK  180
YLIDGYEEIN ELLYKLNFYF DLLRAKLNDV CANDYCQIPF NLKIRANELD VLKKLVFGYR  240
KPLDNIKDNV GKMEDYIKKN KTTIANINEL IEGSKKTIDQ NKNADNEEGK KKLYQAQYDL  300
SIYNKQLEEA HNLISVLEKR IDTLKKNENI KKLLDKINEI KNPPPANSGN TPNTLLDKNK  360
KIEEHEEKIK EIAKTIKFNI DSLFTDPLEL EYYLREKNKK VDVTPKSQDP TKSVQIPKVP  420
YPNGIVYPLP LTDIHNSLAA DNDKNSYGDL MNPHTKEKIN EKIITDNKER KIFINNIKKK  480
IDLEEKNINH TKEQNKKLLE DYEKSKKDYE ELLEKFYEMK FNNNFNKDVV DKIFSARYTY  540
NVEKQRYNNK FSSSNNSVYN VQKLKKALSY LEDYSLRKGI SEKDFNHYYT LKTGLEADIK  600
KLTEEIKSSE NKILEKNFKG LTHSANGSLE VSDIVKLQVQ KVLLIKKIED LRKIELFLKN  660
AQLKDSIHVP NIYKPQNKPE PYYLIVLKKE VDKLKEFIPK VKDMLKKEQA VLSSITQPLV  720
AASETTEDGG HSTHTLSQSG ETEVTEETEE TEETVGHTTT VTITLPPTQP SPPKEVKVVE  780
NSIEHKSNDN SQALTKTVYL KKLDEFLTKS YICHKYILVS NSSMDQKLLE VYNLTPEEEN  840
ELKSCDPLDL LFNIQNNIPA MYSLYDSMNN DLQHLFFELY QKEMIYYLHK LKEENHIKKL  900
LEEQKQITGT SSTSSPGNTT VNTAQSATHS NSQNQQSNAS STNTQNGVAV SSGPAVVEES  960
HDPLTVLSIS NDLKGIVSLL NLGNKTKVPN PLTISTTEME KFYENILKNN DTYFNDDIKQ  1020
FVKSNSKVIT GLTETQKNAL NDEIKKLKDT LQLSFDLYNK YKLKLDRLFN KKKELGQDKM  1080
QIKKLTLLKE QLESKLNSLN NPHNVLQNFS VFFNKKKEAE IAETENTLEN TKILLKHYKG  1140
LVKYYNGESS PLKTLSEVSI QTEDNYANLE KFRVLSKIDG KLNDNLHLGK KKLSFLSSGL  1200
HHLITELKEV IKNKNYTGNS PSENNKKVNE ALKSYENFLP EAKVTTVVTP PQPDVTPSPL  1260
SVRVSGSSGS TKEETQIPTS GSLLTELQQV VQLQNYDEED DSLVVLPIFG ESEDNDEYLD  1320
QVVTGEAISV TMDNILSGFE NEYDVIYLKP LAGVYRSLKK QIEKNIFTFN LNLNDILNSR  1380
LKKRKYFLDV LESDLMQFKH ISSNEYIIED SFKLLNSEQK NTLLKSYKYI KESVENDIKF  1440
AQEGISYYEK VLAKYKDDLE SIKKVIKEEK EKFPSSPPTT PPSPAKTDEQ KKESKFLPFL  1500
TNIETLYNNL VNKIDDYLIN LKAKINDCNV EKDEAHVKIT KLSDLKAIDD KIDLFKNPYD  1560
FEAIKKLIND DTKKDMLGKL LSTGLVQNFP NTIISKLIEG KFQDMLNISQ HQCVKKQCPE  1620
NSGCFRHLDE REECKCLLNY KQEGDKCVEN PNPTCNENNG GCDADATCTE EDSGSSRKKI  1680
TCECTKPDSY PLFDGIFCSS SNFLGISFLL ILMLILYSFI                        1720
FASTA
(Canonical)
>LipidDB-36329-00221|Q8I0U8
MKIIFFLCSFLFFIINTQCVTHESYQELVKKLEALEDAVLTGYSLFQKEKMVLNEEEITT
KGASAQSGASAQSGASAQSGASAQSGASAQSGASAQSGTSGPSGPSGTSPSSRSNTLPRS
NTSSGASPPADASDSDAKSYADLKHRVRNYLFTIKELKYPELFDLTNHMLTLCDNIHGFK
YLIDGYEEINELLYKLNFYFDLLRAKLNDVCANDYCQIPFNLKIRANELDVLKKLVFGYR
KPLDNIKDNVGKMEDYIKKNKTTIANINELIEGSKKTIDQNKNADNEEGKKKLYQAQYDL
SIYNKQLEEAHNLISVLEKRIDTLKKNENIKKLLDKINEIKNPPPANSGNTPNTLLDKNK
KIEEHEEKIKEIAKTIKFNIDSLFTDPLELEYYLREKNKKVDVTPKSQDPTKSVQIPKVP
YPNGIVYPLPLTDIHNSLAADNDKNSYGDLMNPHTKEKINEKIITDNKERKIFINNIKKK
IDLEEKNINHTKEQNKKLLEDYEKSKKDYEELLEKFYEMKFNNNFNKDVVDKIFSARYTY
NVEKQRYNNKFSSSNNSVYNVQKLKKALSYLEDYSLRKGISEKDFNHYYTLKTGLEADIK
KLTEEIKSSENKILEKNFKGLTHSANGSLEVSDIVKLQVQKVLLIKKIEDLRKIELFLKN
AQLKDSIHVPNIYKPQNKPEPYYLIVLKKEVDKLKEFIPKVKDMLKKEQAVLSSITQPLV
AASETTEDGGHSTHTLSQSGETEVTEETEETEETVGHTTTVTITLPPTQPSPPKEVKVVE
NSIEHKSNDNSQALTKTVYLKKLDEFLTKSYICHKYILVSNSSMDQKLLEVYNLTPEEEN
ELKSCDPLDLLFNIQNNIPAMYSLYDSMNNDLQHLFFELYQKEMIYYLHKLKEENHIKKL
LEEQKQITGTSSTSSPGNTTVNTAQSATHSNSQNQQSNASSTNTQNGVAVSSGPAVVEES
HDPLTVLSISNDLKGIVSLLNLGNKTKVPNPLTISTTEMEKFYENILKNNDTYFNDDIKQ
FVKSNSKVITGLTETQKNALNDEIKKLKDTLQLSFDLYNKYKLKLDRLFNKKKELGQDKM
QIKKLTLLKEQLESKLNSLNNPHNVLQNFSVFFNKKKEAEIAETENTLENTKILLKHYKG
LVKYYNGESSPLKTLSEVSIQTEDNYANLEKFRVLSKIDGKLNDNLHLGKKKLSFLSSGL
HHLITELKEVIKNKNYTGNSPSENNKKVNEALKSYENFLPEAKVTTVVTPPQPDVTPSPL
SVRVSGSSGSTKEETQIPTSGSLLTELQQVVQLQNYDEEDDSLVVLPIFGESEDNDEYLD
QVVTGEAISVTMDNILSGFENEYDVIYLKPLAGVYRSLKKQIEKNIFTFNLNLNDILNSR
LKKRKYFLDVLESDLMQFKHISSNEYIIEDSFKLLNSEQKNTLLKSYKYIKESVENDIKF
AQEGISYYEKVLAKYKDDLESIKKVIKEEKEKFPSSPPTTPPSPAKTDEQKKESKFLPFL
TNIETLYNNLVNKIDDYLINLKAKINDCNVEKDEAHVKITKLSDLKAIDDKIDLFKNPYD
FEAIKKLINDDTKKDMLGKLLSTGLVQNFPNTIISKLIEGKFQDMLNISQHQCVKKQCPE
NSGCFRHLDEREECKCLLNYKQEGDKCVENPNPTCNENNGGCDADATCTEEDSGSSRKKI
TCECTKPDSYPLFDGIFCSSSNFLGISFLLILMLILYSFI
Gene Ontology
GO:0046658; C:anchored component of plasma membrane; IDA:GeneDB_Pfalciparum
GO:0009405; P:pathogenesis; IEA:InterPro
Interpro
InterPro; IPR024731; EGF_dom_MSP1-like
InterPro; IPR010901; MSP1_C
InterPro; IPR024730; MSP1_EGF_1
Pfam
Pfam; PF12947; EGF_3;
Pfam; PF12946; EGF_MSP1_1;
Pfam; PF07462; MSP1_C;
SMART
PROSITE
PRINTS