Vojenské zpravodajství (VZ) se v březnu zapojilo do mezinárodní operace proti aktivitám hackerské skupiny APT28, která je spojovaná s ruskou vojenskou zpravodajskou službou GRU a která přes slabě zabezpečené routery prováděla kybernetické útoky na státní a další organizace v ČR i zahraničí. Operaci vedl americký Federální úřad pro vyšetřování (FBI) a jejím cílem bylo odebrat útočníkům přístup k napadeným zařízením a ty následně … více »
Tvůrcem nejpopulárnější kryptoměny bitcoin, který se skrývá za pseudonymem Satoši Nakamoto (Satoshi Nakamoto), je britský kryptograf Adam Back. Na základě vlastní investigativní práce to tvrdí americký deník The New York Times (NYT). Několik indicií podle autorů jasně ukazuje na to, že Back a Nakamoto jsou stejný člověk. Jde mimo jiné o podobný odborný a osobnostní profil či totožné chyby a manýry v psaném projevu.
Google Chrome 147 byl prohlášen za stabilní. Nejnovější stabilní verze 147.0.7727.55 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře. Přehled novinek v Chrome DevTools 145 až 147 také na YouTube.
Vývojáři z Laboratoří CZ.NIC vydali nové verze aplikací Datovka (Datovka 4.29.0, Mobilní Datovka 2.6.2). V případě desktopové verze přibyly možnosti projít všechny uložené zprávy, zkontrolovat časy expirací časových razítek a přerazítkovat datové zprávy, které lze v ISDS přerazítkovat. Novinkou je také možnost vytahovat myší ze seznamu ZFO soubory datových zpráv, tento úkon jde udělat i pomocí tlačítek Ctrl+C. Nová verze Mobilní Datovky přináší jen drobné úpravy.
MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.28.0. Z novinek lze vypíchnout novou třídu machine.CAN.
Michael Meeks, CEO společnosti Collabora, na apríla oznámil, nebyl to ale apríl, že nadace The Document Foundation zastřešující vývoj kancelářského balíku LibreOffice vyloučila ze svých řad všechny zaměstnance a partnery společnosti Collabora, tj. více než třicet lidí, kteří po mnoho let přispívali do LibreOffice. Nadace The Document Foundation po několika dnech publikovala oficiální vyjádření. Přiznává pochybení při zakládání
… více »Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že v úterý 14. dubna (změna!!!) od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout
… více »Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Na blogu CZ.NIC vyšel minulý týden ve čtvrtek text s názvem Žadatelů o nové domény je téměř 1 300 (a musi čekat). Dnes na tento článek navazuje aktuální zpráva, v níž je mimo jiné uvedeno, že žadatelé splnili podmínky pro získání 2091 nových domén nejvyšší úrovně (u dalších 214 nebyl uhrazen poplatek 5 000 USD).
V závěru blogspotu se Ondřej Filip zamýšlí nad okolnostmi, které dosavadní proces žádání o nové gTLD provázejí: “Stále si kladu otázku, proč bylo tak nutné zastavit proces podávání žádostí pouhých 12 hodin před ukončením řádné lhůty. ICANN ohlásil, že důvodem byl únik informací. Ale s ohledem na to, že se všechny žádosti mají stejně brzy zveřejnit, v tom až tak velký problém nevidím. Ano, někdo mohl v systému zjistit, jakou doménu chystá jeho konkurence, ale zjistit to 12 hodin před uzavřením podávání žádostí by mu už nijak nepomohlo – žádost by už stejně nestihl podat. Velice podezřele působí i fakt, že systém je odstaven již téměř měsíc. Teď naopak lidé, kteří nějaké informace nelegálně získali, mají čas s nimi pracovat."
Tiskni
Sdílej:
z principu scestný regex na kontrolu mailové adresyA copak mezi
není nějaký rozumný kompromis, který by šel popsat regulárním výrazem?Není.
^.+@.+$, což je příliš benevolentní – a rozumný kompromis může být cokoli (i lehce) přísnějšího…
že variantě 1 odpovídá třeba ^.+@.+$, což je příliš benevolentníAle ono to tak opravdu je (dastych+foo@[94.199.40.244], neřku-li IPv6).
dastych+foo@;;; už platné není a tím regulárním výrazem to projde.
(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t] )+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?: \r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:( ?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\0 31]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\ ](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+ (?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?: (?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z |(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n) ?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\ r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n) ?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t] )*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])* )(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t] )+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*) *:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+ |\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r \n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?: \r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t ]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031 ]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\]( ?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(? :(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(? :\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(? :(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)? [ \t]))*"(?:(?:\r\n)?[ \t])*)*:(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]| \\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<> @,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|" (?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t] )*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\ ".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(? :[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[ \]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000- \031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|( ?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,; :\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([ ^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\" .\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\ ]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\ [\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\ r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\] |\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \0 00-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\ .|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@, ;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(? :[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])* (?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\". \[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[ ^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\] ]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)(?:,\s*( ?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\ ".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:( ?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[ \["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t ])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t ])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(? :\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+| \Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?: [^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\ ]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n) ?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\[" ()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n) ?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<> @,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@, ;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t] )*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\ ".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)? (?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\". \[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?: \r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\[ "()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t]) *))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t]) +|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\ .(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z |(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:( ?:\r\n)?[ \t])*))*)?;\s*)
abc@[def].ghi projde, i když by nemělo.
jmeno.prijmeni@example.com místo jnemo-prijmeni@example.com, tak se bohužel nedá nic dělat (není způsob, jak chybu odhalit, aniž bychom se tam pokusili poslat e-mail), ale bude dost případů, kdy překlep vede na odhalitelnou syntaktickou chybu a ne jen neexistující schránku/doménu.
E-mailových adres mi pod rukama prošlo už hodně a musím říct, že chyba typu example,com místo example.com je poměrně častá.
Co je vlastně ta „naprosto triviální kontrola“? Není to totéž jako „rozumný kompromis“? A jaký je důvod pro použití jednoduššího výrazu, který odhalí méně chyb? Ten ušetřený výpočetní výkon? Zatím stále věřím, že existuje něco lepšího než ^.+@.+$…
Co je vlastně ta „naprosto triviální kontrola“? Není to totéž jako „rozumný kompromis“Nebylo náhodou několik variant výše uvedených?
Není to totéž jako „rozumný kompromis“?Nazval bys rozumným kompromisem ^.+@.+$? Nebo ^\S+@\S+$ (jestli si správně pamatuju \S pro nebílé znaky v mnoha běžných regex jazycích). Napadá mě ještě několik dalších věcí, kterým stále ještě říkám triviální kontrola, takže je nemůžu řadit ke kompromisům mezi triviální kontrolou a něčím jiným.
Ten ušetřený výpočetní výkon?Vážně je nutné snižovat kvalitu diskuze vymýšlením fiktivních argumentů fiktivní protistrany?
Ty jsi udělal trochu podvod, nevím, jestli si to uvědomuješ. Zúžil si možnost použití té kontroly. Já mám za to (můžu se mýlit), že všichni ostatní v diskuzi si pod pojmem kontrola e-mailových adres představují něco, co lze mimojiné použít i jako automatická kontrola při vstupu. Tedy něco, co odmítne formulář s neodpovídajícím vstupem.Špatně jsi to pochopil – mícháš dohromady dvě věci: 1) to, že používám ne zcela košer regulární výraz při ručním čištění dat (ale sám jsi uznal, že při ručním zpracování to nevadí), teď nechme stranou 2) to, že uživatelé zadávají místo e-mailů evidentní blbosti, což jsem doložil několika (anonymizovanými) příklady – toto je věc, na kterou jsem se tou #20 odkazoval. Ano, bavíme se o automatické kontrole u které neasistuje člověk (ta moje ruční kontrola dat je jen poznámka bokem). A teď jde o to, najít regulární výraz, který odhalí co nejvíc chyb a nezpůsobí žádné falešné poplachy.
Nazval bys rozumným kompromisem ^.+@.+$? Nebo ^\S+@\S+$Ne, protože tím projde např. i*
anonym@example,com, což je podle mé zkušenosti častý překlep a hodně lidem by nechodila jejich pošta. Naopak ten perlovský Mail::RFC822::Address tuhle chybu odhalí, takže ho považuji za lepší. Možná existuje i něco ještě lepšího, ale ^\S+@\S+$ každopádně považuji za nedostatečné, zbytečně benevolentní.
Vážně je nutné snižovat kvalitu diskuze vymýšlením fiktivních argumentů fiktivní protistrany?Jestli sis nevšiml, byla to otázka. Ptám se jaký je ten důvod. Chápu, když někdo odsoudí určitý regulární výraz kvůli tomu, že způsobuje falešné poplachy – s tím souhlasím. Ale co regulární výraz, který falešné poplachy nezpůsobuje a odhalí víc překlepů než jednodušší výraz? Jaký je důvod ho nepoužít? *) nebo třeba
@anonym (na začátku je nedělitelná mezera). V dnešní době twitterové idiocie bych se ani nedivil, kdyby to někdo zadal místo e-mailu. Nemluvě o tom, že projde i nezakódovaná čeština nebo jiné unicode znaky.
nezakódovaná čeština nebo jiné unicode znakyK tomu tedy existuje návrh standardu z února 2012: RFC 6530…
Ano, bavíme se o automatické kontrole u které neasistuje člověk (ta moje ruční kontrola dat je jen poznámka bokem).To nebylo úplně zřejmé, alespoň pro mě ne.
Ne, protože tím projde např. i* anonym@example,com, což je podle mé zkušenosti častý překlep a hodně lidem by nechodila jejich pošta.Tak čárka by se dala ještě zahrnout mezi zakázané znaky, pokud je to až tak častý jev. Pokud by se nejednalo o chytání tohoto konkrétního překlepu, tak mi přijde už účelnější provést online ověření podle DNS. Tak, já osobně proti tomu uvedenému regexu nemám, pokud nedává false positives. Ale sám bych se s ním nepsal.
A jaký je důvod pro použití jednoduššího výrazu, který odhalí méně chyb?Ten, že je evidentní, že každá korektní mailová adresa projde. (Zatímco u naprosté většiny složitých regexů, které jsem potkal, bylo pracné, nicméně možné sestrojit korektní adresu, kterou regex zamítne.) Navíc nevěřím tomu, že složitý regex odhalí navíc podstatné množství chyb, které by neodhalila triviální kontrola typu "mailová adresa obsahuje alespoň jeden zavináč, který není ani na začátku ani na konci, a vpravo od něj je aspoň jedna tečka". Nedosti na tom, v životě potkáte mailové adresy, které nejsou podle striktní interpretace RFC 822 korektní, ale fungují a lidé je používají. Třeba
a.b.c.@hell.org, nebo abc@hell.org. (s tečkou na konci). Ty také nejspíš odfiltrovat nechcete.
^.+@.+$, které jsou užitečné a odhalují překlepy uživatelů.
Navíc nevěřím tomu, že složitý regex odhalí navíc podstatné množství chyb, které by neodhalila triviální kontrola typu "mailová adresa obsahuje alespoň jeden zavináč, který není ani na začátku ani na konci, a vpravo od něj je aspoň jedna tečka".Problém té triviální kontroly je, že některé platné e-maily jí také neprojdou
Už jsem se setkal i s e-mailem v TLD. Obávám se, že většina chyb v kontrole e-mailu vzniká právě tím, že někdo odhadne, jak má asi e-mail vypadat, a podle toho kontrolu udělá. Když si někdo dá práci a napíše kontrolu opravdu podle standardu, šance, že bude napsaná špatně, je podle mne daleko menší.
Problém té triviální kontroly je, že některé platné e-maily jí také neprojdouKteré? E-mail v TLD je dost problematický, už proto, že si ho leckterý MTA vyloží jako relativní doménové jméno (to je přesně důvod, proč se na konec někdy píše tečka, byť ji RFC 822 nepřipouští).
Když si někdo dá práci a napíše kontrolu opravdu podle standardu, šance, že bude napsaná špatně, je podle mne daleko menší.Problém je, že prakticky všechny pokusy o kontrolu podle standardu, jsou špatně. Nevím, jestli už jsem nějaký správný viděl.
Kontrolu existence MX záznamu domény jsem viděl taky.Neměl by jít e-mail doručit i na A záznam?
"anonym@example.com (nefunguji prilohy]" "anonym@example.com " "anonym@example.com; " "anonym@example.com anonym2@example.com" "anonym@example.com, anonym2@example.com" "anonym[zavinac]example.com" "anonym@example.com; anonym2@example.com" "anonym [zavinac] example.com" "anonym@example.com;" "5468"*) některé platné adresy by jím neprošly, ale zatím jsem na takové nenarazil a i kdyby ano, nějaký ten falešný poplach při ručním zpracování nevadí
"anonym@example.com "Klasický problém s mezerami. Velmi zhusta je zapříčiněn copy&paste, kdy se označí a zkopíruje i sousední mezera. Proto je dobré při přebírání e-mailové adresy na vstupu ještě před vlastní kontrolou vstupní řetězec oříznout od bílých znaků.