Portál AbcLinuxu, 19. dubna 2024 20:51

Biologický software pro Linux

12. 11. 2008 | Vojtěch Zeisek
Články - Biologický software pro Linux  

Stručný souhrn a představení programů, které lze v Linuxu provozovat pro vědeckou (nejen) biologickou práci.

Úvod

Před časem zde vyšel článek, který představoval možnosti využití svobodného softwaru ve vědě, konkrétně v technice. Já bych si dovolil představit některé možnosti pro biologii. Rozhodně si nedělám nároky na úplnost seznamu. Jde o software, který používám buď já, anebo lidé v mém okolí.

Běžná práce

Kancelářský balík OpenOffice.org znají a používají snad všichni. Většině lidem ale dělá trochu potíže práce se seznamy literatury. Ve vědě je důležité doložit všechna tvrzení, která jsou v textu uvedena. Ať už vlastním výzkumem, anebo odkazem na jiného autora. V prostředí Windows existují tzv. reference managery, které se starají o databázi literatury, jsou propojeny s Wordem, vkládají do něj odkazy na literaturu a nakonec generují seznam literatury. My můžeme buď využít obdobné vestavěné funkce v OpenOffice.org, anebo sáhnout po starém osvědčeném LaTeXu. Jeho výhodou je, že největší databáze vědeckých článků i Google Scholar umí exportovat záznamy ve formátu BibTeX. Mým oblíbeným nástrojem je KBibTeX. Z něj pak lze záznamy buď vkládat do LaTeXu, anebo exportovat do HTML, RTF nebo PDF.

biologie kbibtex
KBibTeX s načteným seznamem literatury

Matematika, statistika, ...

Základem je statistický balík R, což je open-source obdoba S-plus, ale může se směle měřit i s předraženými velikány typu SAS nebo SPSS. Hodně lidí si stěžuje na jeho rozhraní, které běží jen v příkazové řádce. To se ale poslední dobou mění. Existuje doplněk do OpenOffice.org Calc a celé GUI pro R. Oba programy jsou zatím spíše na počátku vývoje, ale jistě je čeká slibná budoucnost. Krom základního balíku R používám doplňkové balíky agricolae, ade4, stats, vegan a další. Většinou jde o balíky související s mnohorozměrnou statistikou a biologií.

biologie r4calc
R4Calc - integrace R do OpenOffice.org Calc

biologie rkward
Rkward, kompletní GUI pro R

Pro lidi zabývající se matematickými modely (ale nejen pro ně) tu je Octave, což je přímá konkurence známějšího Matlabu.

Existují i speciální programy psané za nějakým konkrétním účelem. Většinou si je píší sami biologové, takže to po informatické stránce nebývá žádný zázrak. Ale svůj účel to plní. Jako příklad bych uvedl třeba Arlequin, který slouží pro výpočet parametrů populační genetiky.

biologie arlequin
Arlequin (omlouvám se za screenshot z Windows ze stránek projektu, ale momentálně program nemám nainstalovaný)

Molekulární biologie

I když to tak nemusí vypadat, nabídka je vpravdě široká. Neznám nikoho, kdo by se orientoval ve všem :-). O málo menší seznam dostanete, i když budete mezi balíčky Debianu hledat slova jako "biology" nebo "molecular". Existuje i software, který je k dispozici jen pro Linux. Je jím např. ARB, což je velice speciální program pro práci s jedním typem DNA. Opačný problém nastává se softwarem navázaným na hardware, třeba na tzv. sekvenátory, které "čtou" DNA a produkují výsledky ve speciálních formátech. V takových případech mnohdy pomůže Wine s winetricks. Nebo s některými mikroskopy, které se dodávají dohromady s počítači sloužícími k ovládání mikroskopu.

Biologové pracující s DNA běžně pracují s obrovskými on-line databázemi. Ta asi nejznámější je National Center for Biotechnology Information, kde je k dispozici i řada softwaru. Obdobná databáze je i v Evropě a Japonsku. Dohromady tvoří tzv. Velkou trojku a vzájemně se zálohují. Dále existuje řada menších, úžeji zaměřených. K databázím je k dispozici řada on-line nástrojů, pro které stačí jen prohlížeč. Jsou plně multiplatformní. Mezi nejznámější patří asi Sequence Manipulation Suite, kterou si případně lze stáhnout do svého počítače a pracovat jen se svými daty.

Zvláště mezi tvůrci svobodného softwaru pro molekulární biologii je rozšířena i jedna specifická licence: beerware. Když potkáte tvůrce softwaru (třeba na vědecké konferenci), musíte jej pozvat na pivo.

Závěrem

Ve většině případů není problém s tím, že by nebyl dostupný linuxový software pro nějakou konkrétní úlohu (i když i na takové situace už jsem narazil), ale s jeho pohodlností. Kupříkladu rozdíl mezi GRASS a ArcGIS od ESRI je nebetyčný. V jednom musíte psát skripty a zaobírat se příkazovou řádkou, ve druhém jen pohodlně klikáte. Na tom nic nezmění ani obdobné výsledky a nižší stabilita ArcGISu. Nicméně Linux má i pro přírodovědce rozhodně co nabídnout.

Související články

Svobodný software ve vědě
Seriál: Octave
Geografické informační systémy
Použití gnuplot pro tvorbu grafů v PHP
Planetárium OpenCoeli: Cartes du Ciel for Java
Seriál: GPS a komunikační protokol NMEA

Další články z této rubriky

Týden na ITBiz: Svět IT a burzy, umělá inteligence, Nvidia a outsourcing
Linuxové foto novinky: pozvolná evoluce
PCLinuxOS 2017.2 MATE - tak trochu zvláštní linuxová distribuce
Krátký pohled na Fedoru 25, Wayland a GNOME 3.22
Naprosto ničím nezajímavé Lubuntu 16.10

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.