2012: Rok superpočítačů a rychlého sekvenování DNA

Člověk |

Ročně je dnes osekvenováno zhruba tolik genetických dat, že by zaplnila disky DVD v řadě dlouhé asi 3 kilometry.




Rok 2012 by mohl být zlatým věkem superpočítačů, uvádí technologický ředitel firmy SGI Eng Lim Goh ve svém komentáři pro BioITWorld. Vysoce výkonné výpočetní systémy (HPC, high performance computing) dle Goha překročily kritický práh a nyní dokáží efektivně generovat výsledky použitelné jak ve výzkumu, tak i v komerčním sektoru.

Superpočítače např. zřejmě již v brzké době umožní zavedení skutečně personalizované medicíny, kdy léčebný postup i nasazené léky budou přizpůsobeny genetickému profilu pacientů. Za nadějný se tento přístup pokládá především vzhledem k terapii rakoviny. V příštích 12 měsících by pokles ceny sekvenování DNA mohl čtení genomu zlevnit na úroveň dnes standardně používaných medicínských technik, jako je např. zobrazování magnetickou rezonancí.

 

Záplava dat

Pokud se pokrok na poli sekvenování pokusíme přiblížit v konkrétnějších číslech, dnešní zařízení dokáží během několikadenního cyklu přečíst až stovky gigabází (tj. jednotlivých „písmenek“ v DNA). Ročně je osekvenováno zhruba tolik genetických dat, že by zaplnila disky DVD v řadě dlouhé asi 3 kilometry. Podle odhadů např. osekvenování asi 100 000 lidí – nijak velký počet vzhledem k celkové lidské populaci – vyprodukuje okolo 30 petabajtů dat.

Záplava takto získaných dat zvyšuje v oborech life sciences požadavky na jejich inteligentní analýzu i ukládání a také akceleruje rozvoj souvisejících oborů (např. protenomika, analýza metabolických cest apod.), ale i výzkumů zdánlivě odlehlých; pomocí genetických dat se dnes mj. zkoumá i lidská evoluce a pravěké migrace.

Hlavním problémem dnes již není samotné získávání genetických dat, ale jejich další zpracování. Floyd Christofferson, marketingový ředitel SGI pro úložné systémy, uvádí, že v této situaci se projevuje konkurenční výhoda SGI, protože společnost navrhla ekosystém svých produktů a služeb již s přihlédnutím k potřebě zpracování velkých objemů dat; dokáže proto nabídnout takové klíčové funkce, jako je vysoká škálovatelnost, propustnost I/O (vstup/výstup) a zajištění integrity dat. Jakýkoliv z těchto faktorů může jinak fungovat jako úzké hrdlo.

V rámci farmaceutického a biotechnologického výzkumu a průmyslu se řešení SGI používají již více než 20 let. Společnost SGI nově nabízí v této oblasti např. diskové úložné řešení ArcFinity, které se speciálně hodí pro oblast life sciences, kdy se často pracuje s nestrukturovanými daty a jejich další uchovávání je nařízeno regulačními předpisy. Platforma je založena na rodině procesorů Intel Xeon E5. Důsledné využití standardů znamená, že systém ArcFinity i další řešení SGI lze snadno nasadit také v rámci heterogenních datových center.

 

Nejen genomika

Za další oblast, kde se uplatní možnosti současných superpočítačů, považuje Eng Lim Goh zlepšení modelů pro předpovědi počasí. Problémy s předpovědí počasí vedly v minulosti ke vzniku celých rozsáhlých teoretických modelů, jako byl efekt motýlího křídla (nebo obecněji teorie chaotických systémů). Ukazuje se, že značná část „nepredikovatelnosti“ vývoje počasí byla nejspíš problémem nedostatečných výpočetních kapacit. Účinnější předpověď vichřic a dalších extrémních jevů má samozřejmě nejen teoretický ale i velmi praktický rozměr. Již od roku 2009 používá ruská meteorologická služba Roshydromet řešení od SGI (systémy Altix) pro předpovědi počasí na úrovni jednotlivých čtvrtí ruských velkoměst.

Co se týče technických detailů prognózy, Goh pokládá tento rok přinese triumf počítačů se sdílenou pamětí a technologie Hadoop – jedná se o open source platformu spadající pod projekty nadace Apache; určena je pro zpracování velkých objemů dat (big data), s nimiž by si neporadily tradiční databáze ani datové sklady. Hadoop se dnes kromě vědeckých výpočtů používá také pro oblast business intelligence, analytiku webů a sociálních sítí.

Goh také odhaduje, že stále více zákazníků bude nasazovat systémy obsahující koprocesory a další hardwarové akcelerátory. CPU používané spolu s koprocesory budou obsahovat stovky až tisíce jader a objeví se nové nástroje pro programování využívající výhod koprocesorů.

 

SGI může nabídnout významné reference

Společnost SGI patří k osvědčených dodavatelům systémů HPC computingu. Její řešení používá např. tým slavného britského fyzika Stephena Hawkinga. Jejich superpočítač DiRAC v aktuální verzi odpovídá systému SGI UV, který obsahuje 1 856 procesorových jader Intel Xeon a 14,8 TB vyrovnávací, sdílené paměti v pěti racích. Vědci ho používají pro náročné výpočty v oblasti kosmologie a k hledání exoplanet.

stephen-hawking

Stephen Hawking u systémů SGI

 

SGI nabízí prostředí pro vědecké výpočty také na bázi cloud computingu. Výpočetní síť Cyclone je v tomto případě nabízena ve variantách „software jako služba“ a „infrastruktura jako služba“. První varianta obnáší pronájem předdefinovaných odborných aplikací (zahrnují např. dynamiku proudění kapalin, analýzu konečných prvků nebo výpočetní biologii), ve druhém případě mohou zákazníci provozovat aplikace vlastní.

V ČR provozuje od roku 2009 superpočítač SGI také Fyzikální ústav AV ČR. Systém pojmenovaný Dorje (tibetský výraz pro rituální žezlo) je určen pro výpočty v oblasti fyziky pevných látek.

 

Další informace: www.sgi.com











Komentáře

30.07.2014, 15:56

.... tnx for info!...

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.