Portál AbcLinuxu, 2. května 2025 07:16
Enterprise řešení archivace emailů v podání GFI Mailarchiver
8.1.2014 23:01
| Přečteno: 1718×
| plky
| poslední úprava: 9.1.2014 07:40
Inu, měli jsme prehistorický emailový server Mail602, který již nedostačoval a support taktéž skončil. Exchange 2007 absencí archivačních nástrojů nemile překvapil.
Emailový server Mail602
Mail602 byl zajímavý systém. Veškerá data se ukládala šifrovaně (tak nějak šifrovaně) na fileserveru. Existoval stejnojmenný emailový klient, kterému jsme řekli, kde má data (adresa na fileserver alá H:\Mail602), přihlásili jsme se a on načetl svou emailovou schránku, toto vše plně bez běhu jakékoli emailové služby (toto je samozřejmě velký bezpečnostní fail v návrhu). Na jiném serveru pak běžel Mail602 smtp server, který se staral o zbytek. Tento systém měl v sobě i archivační systém.
Pojmem archivace se rozumí mít kopie všech emailů, nejlépe ve formátu, který nejde mazat (uživatelsky mazat), a zároveň umořňuje jejich čtení uživatelem. Toto Mail602 měl a šlo si zvolit, aby archivoval emaily bez příloh, čímž se šetřilo místo.
Systém měl ale mušky, které přibývaly a firma Software 602 asi usoudila, že tudy cesta nevede. Nástupcem byl Software 602 Lan Suite, který se ale dlouho neohřál a projekt byl ukončen. Ještě štěstí, že jsme se tehdá nerozhodli migrovat právě na toto řešení.
Exchange 2007 - pokrok nezastavíš
Jak už jsem zmínil v předešlých zápiskách, jako nástupce byl vybrán Exchange 2007 (roli hrálo i to, že měli všichni na pc Outlook). Což o to, nějak to jelo, občas to dřelo, ale vesměs spokojenost. Bohužel, Exchange 2007 neobsahuje žádný rozumný způsob archivace emailů. Třeba outlook umožňuje archivovat emaily lokálně na PC uživatele do souboru pst, jehož limit je 20GiB, pak se vytváří další pst, pak chcípne disk na lokálním pc a je konec nehledě na to, že si ty emaily může uživatel mazat (chtěně i nechtěně).
GFI Mailarchiver
V sázce byly dvě řešení, které jsem již zmínil zde : Exchange 2007 SP1 : Archivace pošty.
Symantec Vault byl údajně docela složitý na rozchození, navíc by se musel koupit MS SQL server, což je nemalá částka. Kolega tenkrát usoudil a navrhl řešení v podobě GFI Mailarchiver. Řešení nestálo mnoho peněz a vystačil si s firebird databází (databázema).
Firebird databáze měla své výkonnostní limity, ale dle GFI měla být pro nás plně dostačující.
Jak GFI Mailarchiver funguje
Na Exchange se vytvoří virtuální journálový mailbox, do kterého padá veškerá pošta. GFI tuto schránku vybírá a všechny emaily z ní láduje do své db podle uživatelů v AD (umí vytvářet v archivu i stejnou strukturu složek, jako má uživatel v outlooku). Schránku lze vybírat třeba přes imap. Data lze mít v těchto kombinací :
- Firebird (metadata + odkazy) + FS (skutečná data emailů zašifrovaná na file systému)
- MS SQL + FS (obdoba výše zmíněného) - nejlepší varianta
- MS SQL - všechny data v databázi
Databáze může být měsíční, dvouměsíční, čtvrtletní, pololetní, nebo roční.
My jsme si vyzkoušeli cestu Firebird + FS a následně MS SQL + FS. Zde se definují tři věci :
1) cesta k db
2) cesta k binárním datům (data emailů)
3) cesta k indexům (adresář na FS s indexama)
-
GFI má konfiguráky v xml souborech, kde jsou definovány tyto cesty, takže kdo chce migrovat mezi písmenkama disků, měnit adresářovou strukturu apod., tak stačí zastavit všechny služby, přesunout data, změnit xmlka a nahodit služby a mělo by vše jet ok.
-
Migrace mezi FB db a MS SQL není možná, všechna data je nutné přeimportovat (úplně komplet včetně těch binárních), k tomu slouží cmd nástroj copybix.
-
Import emailů lze ručně z emailových schránek z exchange, nebo z pst souborů.
-
GFI umí exportovat emaily do pst, lze tedy vyexportovat část archivu do pst a uživateli připojit do outlooku. Ve web rozhraní si lze email obnovit přeposláním na jakoukoli adresu, nebo stažením do msg aj. formátů.
-
GFI má outlook konektor, se kterým ale nemáme moc dobré zkušenosti (hodně zpomaloval PC, outlook byl nestabilní atd.). Od jisté verze má v sobě GFI IMAP server a umožňuje uživatelské schránky zpřístupnit pod imapem (samozřejmě jen pro čtení)
-
Ve web administraci lze otevřít jakoukoliv uživatelskou schránku (pod administrátorem). Taktéž disponuje různými reportovacími nástroji, které ukazují pěkné koláče apod.
-
GFI Mailarchiver umožňuje indexovat hodně věcí včetně příloh a má velmi podrobné vyhledávání. Také umožňuje nearchivovat emaily/mailboxy dle různých filtrů a pravidel.
-
Špatně se s ním pracuje, pokud klientská stanice není přihlášená do domény, hlavně v outlook konektoru to bylo otravné (v současné době nevím, jaký je stav).
Proklínám GFI
Kolega stále řešil nějaké problémy s GFI, stále support atd. Nakonec jsem se rozhodl, že mu s tím pomohu a vše nakonec dopadlo tak, že jsem měl GFI na krku (když kolega spozoroval mou iniciativu, tak hodil nenápadně krůček vzad) a rok jsem pěnil zuby a rozcházel ho.
Klacky pod nohy, jeden vedle druhého
Jeden z velkých problémů byl, že se archivační server nasadil až asi půl roku po nasazení Exchange, takže se začal řešit zpětný import emailů do GFI, což nebylo vůbec pěkné. Problémů však bylo více :
- Vzhledem k tomu, že Exchange se fláká a běží na silném železe, se nacpalo GFI k Exchange (dle dokumentace by to mělo v klidu stíhat)
- Import emailů nefunguje, nemám přítup k některým mailboxům, nebo emailů, nebo položkám atd. (našel jsem souvislost - české znaky) Ze supportu dostávám odpověď :
GFI MailArchiver v současné době nepodporuje unicode. Podpora unicode je zařazena mezi možné nové vlastnosti na 1. nebo 2. čtvrtletí příštího roku. Lze to však obejít následovně:
1. Pomocí "ExMerge.exe" z MS Exchange SP1 proveďte export mailboxů do .pst souborů.
2. Proveďte nastavení importu v "GFI MailArchiver Import Service Configuration".
3. "GFI PST-Exchange Email Export Tool" překopírujte na stroj s nainstalovaným Office 2000 nebo 2003 - jedná se o adresář "eewiz".
4. Pomocí "GFI PST-Exchange Email Export Tool" proveďte export .pst do .eml. U každého .pst definujte vlastníka z AD. Výsledné soubory postupně přesuňte do <\Program Files (x86)\GFI\MailArchiver\MAIS\Pickup\>. Emaily se naimportují dle nastavení v bodu (2).
To je docela vtipné, ale vyřešeno.
-
Outlook konektor, který by měl zprostředkovávat archiv přes outlook vyhazuje neustále chyby. Support radí poladit parametry :
Can you please perform the following please:
Close Outlook
Go to C:\Documents and Settings\{user}\Local Settings\Application Data\GFI\MailArchiver6
Edit the GeneralSettings.xml file
Change the following values
<TransferMessagesBatchSize>50</TransferMessagesBatchSize>
<TryConnectionTimeout>240000</TryConnectionTimeout>
Open Outlook and check if the problem persists
Zdá se, že ok.
- Stále se objevuje problém error 500, vypadá to na problémy s výkonem, kontroluji dle dokumentace GFI a neměli bychom mít problém, tzn. do 12 000 emailů denně na jednu firebird databázi, to by mělo být ok (nám přichází tak 5-6000 denně)
- GFI běží na odděleném systému (VM), ale tím vyvstal problém, veškeré loginy do GFI je třeba dělat pomocí doména\uživatel
- Zlobí outlook konektor, vyhazuje chyby, požaduje login stále dokola, poladil jsem mu parametry :
TransferMessagesBatchSize = 50
TryConnectionTimeout = 240000
SynchronizeDaysSpan = 730
A vše vypadá ok, jen sync trvá šíleně dlouho a je stále nekompletní.
- Opět byl doporučen supportem upgrade na novější verzi, která by měla naše problémy řešit, tak upgradujeme. Zdá se, že problémy skutečně vyřešil.
- Každý upgrade vyžaduje ruční aktulizaci schématu firebird db, takže pěkný klikání
- Nastává problém s importem uživatelů z exchange, u kterých ještě nedošlo k importu, schránka s 20 000 emaily se naimportuje ok (vždy čekám, až to GFI přechroustuje, zindexuje a pak pokračuji dalším importem), poté další schránka zahlásí 1000 emailů import ok, 24 000 failed, GFI si vytváří i dočasné soubory v "C:\windows\temp" a tento import zcela vyžral 70GiB volného místa na disku
- Indexace emailů nestíhá a začíná to jít celé do kopru, systém chvíli běží a pak to jde na hubu, nechytáme se s RAID5 postaveným s 8x SAS 10k disků (při asi 6000 emailech denně)
- GFI nenápadně doplnilo do dokumentace, že pro firebird db je limit sice nějakých 16 000 emailů denně, ale najednou jen pro 25 mailboxů, takže my nesplňujeme požadavky, mailů máme méně, ale mailboxů více
- Aktualizace schema firebird db se provádí už automaticky v průvodci upgrade
- šíleně zlobí gfi konektor v outlooku, vyhazuje nesmyslný chyby s fbclient.dll, outlook není stabilní
- Prodlužujeme support, jelikož potřebujeme aktualizace a už není moc cesty zpět
- Celý server jde do kopru při 100 000 emailech za měsíc, my se dostáváme k 200 000 emailům za měsíc
- Vypnutí indexace příloh moc nepomohlo
- Kupujeme MSSQL per CPU a komplet new železo jen pro GFI
- Migruju všechny db do MSSQL, což obnáší kompletní reimport všeho, žádná konverze neexistuje, vše se musí reimportovat, stíhám zmigrovat tři databáze denně, chybí jich ještě sakra dost a až to bude, tak se ještě musí všechny přeindexovat, protože si při reimportu GFI nestíhá indexovat a neumí si pohlídat nezindexované emaily (co nezindexuje nyní, nezindexuje nikdy sám)
- Výkon GFI jde do kopru, vygeneroval 400 000 souborů v jednom adresáři, zaplnil disk C:\ a jde to dolu
- Mám pocit, že znám GFI do posledního souboru, něco jsem řešil ručním reimportem, něco si hlídal každou chvilku a zdá se, že reimport hotov, nyní už jen vše zreindexovat
- přestávám se stydět, vše už vypadá ok
- outlook a gfi konektor je konečná, totálně znestabilňuje outlook, totálně výkonově zabíjí klientská PC, je čas se na něj vykašlat a uživatelé prostě v případě archivu budou používat web rozhraní
- GFI nestíhá reindexovat, takže po každém kvartálu reindexuji všechny emaily v MSSQL db - GFI má 2x silnější HW jak Exchange 2007 a přitom žádné aktivní klienty. Navíc, třeba prvních pár týdnů zvládá bez problémů vše zindexovat, poté se v něm něco zlomí a přestane stíhat a to se v noci ještě fláká, ale evidentně neindexuje :-/
- Občas se stane, že se GFI zahltí a přestane fungovat
- Problém s aktualizací na novější verzi, support netuší, nakonec vyřešeno obezličkou bokem
- V nové verzi si nelze ručně nastavit cesty a pojmenování db, GFI tlačí na maximální bezobslužnost - to mi dělá šílený bordel na poli, ale vím, jak to obejít, je to ovšem pěkná pakárna :-/
- GFI přišlo s další feature - nemožnost se odhlásit z web rozhraní, jediná možnost je zavřít prohlížeč - oficiální stanovisko : "proč se chcete odhlašovat?"
- Přibyla možnost přihlásit se do GFI přes IMAP - nenašel jsem chuť ani odvahu to zkusit a používám stále web rozhraní
Jednoduše řečeno, chvilkama mi z toho pěkně hrabalo. Vždy se systém tvářil ok, ale třeba po měsíci to šlo ke dnu atd. Celou dobu jsem měl pocit, že jsme všichni beta testeři a pomáháme jim ladit systém a ještě jim za to platíme. V poslední verzi se nám už také stalo, že šlo GFI neznámo proč dolu, ale je to věc, která se nyní stane tak jednou za několik měsíců, takže těžko říci, kde je v tom net.balastu problém :-/.
Také vězte, že jsem zmínil jen část problémů, už si vše nepamatuji. Úsměvné je třeba takové debugování a posílání logů na ftp (ve formátu firma/datum logu), kde byl vidět slušný seznam jiných firem, to je pak něco :) (jen upřesním, že seznam byl vidět, ale nebyl přístupný).
Ano, dost problémů bylo způsobeno výkonem, ale náš support věděl, na jakém železe a za jakých podmínek systém provozujeme, jejich specifikace také mluvily pro nás, takže to neberu jako naší chybu. Další věcí je, že vše mi přišlo silně neoptimalizované, dvojnásobné železo oproti Exchange(který se na své skořápce flákal) s tím, že se na server nepřipojují žádní klienti a i tak si to server nedává? Je sice pravda, že Exchange nemusí indexovat všechno možné, ale aby indexování mělo několikanásobné režije oproti Exchange, tenkrát s 200 klientama?.
Jaký je současný stav?
- Uživatelé mají v outlooku nastavenou automatickou archivaci emailů starších 6 měsíců - vše starší jde k nim na lokál do pst souborů, aby se šetřil Exchange, který má teď 600GiB db
- Outlookáři mají nainstalován windows search, takže outlook obstojně indexuje a vyhledává emaily
- V outlooku nepoužíváme GFI konektor, kdo chce archiv, musí použít webové rozhraní GFI - pramálo lidí
- GFI nestíhá indexovat, takže každý kvartál reindexuji (teď reindexuji Q4 2013 - nyní už přes milion emailů)
- Disky na GFI odcházejí jak na běžícím pásu - carepack se na tomto serveru skutečně vyplácí
- Uživatelé občas ještě lezou do archivu starého Mail602, tzn., rok 2007 a starší
- Máme zakoupen support na GFI, protože jsme potřebovali další uživatele
- Nedávno GFI přestal archivovat, po dlouhé době, restart to vyřešil, ale nelíbí se mi to
- Záloha GFI se samozřejmě řeší - rsync na vzdálený storage + export jednotlivých db
- V současné době máme v GFI archivováno 14 412 569 emailů.
- Poslední verze jsou už použitelné v produkci, osobně bych se nebál to nasazovat někde ve firmě.
Závěr
Mno, na jednu stranu peklo, na druhou stranu to tak nějak běží a docela slušně to umí vyhledávat, takže si už přestávám stěžovat. Poučením budiž, že šetření se nám v tomto případě moc nevyplatilo a ve finále se stejně muselo vše dokoupit.
Používáte někdo GFI? Nebo Symantec Vault? Nebo jiné řešení?
Ani nevím, zda existuje nějaká podobná služba pro linucha (postfix/dovecot)? Je pravda, že vytvořit archiv by mělo být ok, ale zindexování veškerého obsahu pro rychlé vyhledávání včetně nějakého uživatelského interface (napadá mně jen ten imap v read-only režimu a indexaci by si musel provést klient sám pomocí emailového klienta)? Řešil někdo něco takového na linuchu?
Obrázky
Tiskni
Sdílej:
Komentáře
Vložit další komentář
8.1.2014 23:35
D-Evil | skóre: 25
| Praha
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
9.1.2014 01:37
Luk | skóre: 47
| blog:
Kacířské myšlenky
| Kutná Hora
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
9.1.2014 06:45
hydrandt | skóre: 35
| blog:
Kanál
| Herzogenburg
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
9.1.2014 13:18
RapMan | skóre: 14
| blog:
RapMan
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
10.1.2014 08:45
KKL | skóre: 10
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
11.1.2014 19:33
heh
Re: Enterprise řešení archivace emailů v podání GFI Mailarchiver
Založit nové vlákno •
Nahoru
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.