tisková zpráva společnosti SAP
Společnost SAP a Technická univerzita v Mnichově nově nabízejí ProteomicsDB, databázi založenou na platformě SAP HANA, v níž jsou shromážděna data o proteinech a peptidech. Data uložená a analyzovaná prostřednictvím ProteomicsDB lze využívat v základním biomedicínském výzkumu, k vývoji nových léků, pokročilých diagnostických metod i ke stanovení cílů pro další výzkum. Platforma SAP HANA umožňuje identifikovat jednotlivé proteiny na základě dat získaných v experimentech pomocí hmotnostní spektrometrie. Jde o proteiny odpovídající více než 18 000 lidských genů, což představuje pokrytí 90 % lidského proteomu.
Dnešní zdravotnictví spolu se vzestupem personalizované medicíny objevuje příležitosti, které nabízí analýza velkých objemů dat (big data). Tento společný projekt firmy SAP, jejího inovačního centra a Technické univerzity v Mnichově znamená velký krok vpřed ve výzkumu lidského proteomu. ProteomicsDB již v současnosti obsahuje více než 11 000 souborů dat z lidských buněčných nádorových linií, tkání a tělních tekutin a umožňuje tato mnohodimenzionální data analyzovat v reálném čase a rychle testovat jednotlivé hypotézy.
Databáze ProteomicsDB je založena na platformě SAP HANA, což umožňuje rychlé dolování dat a jejich vizualizaci. Je určena pro veřejné sdílení dat o proteinech získaných pomocí hmotnostní spektrometrie. Uživatelé mohou tímto způsobem také kontrolovat data před jejich publikováním. Databáze má úložný systém o velikosti 50 TB, 2 TB paměti RAM a 160 procesorů. Přímé rozhraní pro programovací jazyky L, C++ a R umožňuje flexibilnější výpočty, než nabízí standardně používaný jazyk SQL. Webové rozhraní je založeno na standardu HTML 5 a JavaScriptu; optimalizováno je pro Google Chrome, ale lze používat také v prohlížečích Internet Explorer a Mozilla Firefox. Rychlé a snadno použitelné webové rozhraní uživatelům umožňuje jak prohlížení dat, tak jejich nahrání do úložiště. Při prohlížení dat o lidském proteomu lze získávat informace až na úrovni jednotlivých bílkovin, tedy například jejich funkci či expresi (syntéza podle genetické informace).
Databáze ProteomicsDB bude k dispozici zdarma. Využijí ji výzkumníci v oboru přírodních věd, stejně jako farmaceutické či biotechnologické firmy. Poznatky získané při analýze dat mohou najít uplatnění např. při vývoji nových léků, které budou působit cíleněji a mít méně vedlejších účinků.
„Současný biomedicínský výzkum generuje obrovské množství molekulárních dat. ProteomicsDB nám pomáhá tato data ukládat, analyzovat a neztratit se v nich, takže nenastane situace, kdy pro stromy nevidíte les,“ uvedl prof. Dr. Bernhard Kuster z Technické univerzity v Mnichově.