Portál AbcLinuxu, 19. dubna 2024 20:51
Stručný souhrn a představení programů, které lze v Linuxu provozovat pro vědeckou (nejen) biologickou práci.
Před časem zde vyšel článek, který představoval možnosti využití svobodného softwaru ve vědě, konkrétně v technice. Já bych si dovolil představit některé možnosti pro biologii. Rozhodně si nedělám nároky na úplnost seznamu. Jde o software, který používám buď já, anebo lidé v mém okolí.
Kancelářský balík OpenOffice.org znají a používají snad všichni. Většině lidem ale dělá trochu potíže práce se seznamy literatury. Ve vědě je důležité doložit všechna tvrzení, která jsou v textu uvedena. Ať už vlastním výzkumem, anebo odkazem na jiného autora. V prostředí Windows existují tzv. reference managery, které se starají o databázi literatury, jsou propojeny s Wordem, vkládají do něj odkazy na literaturu a nakonec generují seznam literatury. My můžeme buď využít obdobné vestavěné funkce v OpenOffice.org, anebo sáhnout po starém osvědčeném LaTeXu. Jeho výhodou je, že největší databáze vědeckých článků i Google Scholar umí exportovat záznamy ve formátu BibTeX. Mým oblíbeným nástrojem je KBibTeX. Z něj pak lze záznamy buď vkládat do LaTeXu, anebo exportovat do HTML, RTF nebo PDF.
KBibTeX s načteným seznamem literatury
Základem je statistický balík R, což je open-source obdoba S-plus, ale může se směle měřit i s předraženými velikány typu SAS nebo SPSS. Hodně lidí si stěžuje na jeho rozhraní, které běží jen v příkazové řádce. To se ale poslední dobou mění. Existuje doplněk do OpenOffice.org Calc a celé GUI pro R. Oba programy jsou zatím spíše na počátku vývoje, ale jistě je čeká slibná budoucnost. Krom základního balíku R používám doplňkové balíky agricolae, ade4, stats, vegan a další. Většinou jde o balíky související s mnohorozměrnou statistikou a biologií.
R4Calc - integrace R do OpenOffice.org Calc
Pro lidi zabývající se matematickými modely (ale nejen pro ně) tu je Octave, což je přímá konkurence známějšího Matlabu.
Existují i speciální programy psané za nějakým konkrétním účelem. Většinou si je píší sami biologové, takže to po informatické stránce nebývá žádný zázrak. Ale svůj účel to plní. Jako příklad bych uvedl třeba Arlequin, který slouží pro výpočet parametrů populační genetiky.
Arlequin (omlouvám se za screenshot z Windows ze stránek projektu, ale momentálně program nemám nainstalovaný)
I když to tak nemusí vypadat, nabídka je vpravdě široká. Neznám nikoho, kdo by se orientoval ve všem :-). O málo menší seznam dostanete, i když budete mezi balíčky Debianu hledat slova jako "biology" nebo "molecular". Existuje i software, který je k dispozici jen pro Linux. Je jím např. ARB, což je velice speciální program pro práci s jedním typem DNA. Opačný problém nastává se softwarem navázaným na hardware, třeba na tzv. sekvenátory, které "čtou" DNA a produkují výsledky ve speciálních formátech. V takových případech mnohdy pomůže Wine s winetricks. Nebo s některými mikroskopy, které se dodávají dohromady s počítači sloužícími k ovládání mikroskopu.
Biologové pracující s DNA běžně pracují s obrovskými on-line databázemi. Ta asi nejznámější je National Center for Biotechnology Information, kde je k dispozici i řada softwaru. Obdobná databáze je i v Evropě a Japonsku. Dohromady tvoří tzv. Velkou trojku a vzájemně se zálohují. Dále existuje řada menších, úžeji zaměřených. K databázím je k dispozici řada on-line nástrojů, pro které stačí jen prohlížeč. Jsou plně multiplatformní. Mezi nejznámější patří asi Sequence Manipulation Suite, kterou si případně lze stáhnout do svého počítače a pracovat jen se svými daty.
Zvláště mezi tvůrci svobodného softwaru pro molekulární biologii je rozšířena i jedna specifická licence: beerware. Když potkáte tvůrce softwaru (třeba na vědecké konferenci), musíte jej pozvat na pivo.
Ve většině případů není problém s tím, že by nebyl dostupný linuxový software pro nějakou konkrétní úlohu (i když i na takové situace už jsem narazil), ale s jeho pohodlností. Kupříkladu rozdíl mezi GRASS a ArcGIS od ESRI je nebetyčný. V jednom musíte psát skripty a zaobírat se příkazovou řádkou, ve druhém jen pohodlně klikáte. Na tom nic nezmění ani obdobné výsledky a nižší stabilita ArcGISu. Nicméně Linux má i pro přírodovědce rozhodně co nabídnout.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.