Portál AbcLinuxu, 29. května 2024 07:23


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Vložit další komentář
7.5.2012 16:22 hchkrdtn
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Odpovědět | Sbalit | Link | Blokovat | Admin
to bude na netu poradny bordel :D
deafboy avatar 7.5.2012 16:32 deafboy | skóre: 1
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Odpovědět | Sbalit | Link | Blokovat | Admin
Ešte niekto si myslí že nové domény sa budú využívať len minimálne, a ich vlastníci sa budú (až na výnimky) len snažiť dobre predať subdomény?
7.5.2012 19:41 victor8 | skóre: 24 | blog: blog | Košice
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Odpovědět | Sbalit | Link | Blokovat | Admin
nechcem si radsej ani predstavit ako dlho bude trvat, kym si vsetci poopravuju svoje regexpy na kontrolu validity mailboxov :)

...ked vezmem do uvahy ze sa stale najdu stranky, ktore maju problem s TLD .name alebo .info...
7.5.2012 21:39 Martin Mareš
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Pokud někdo používá z principu scestný regex na kontrolu mailové adresy, tak je jedině dobře, že se mu konečně rozbije pořádně a navždycky O:-)
xkucf03 avatar 7.5.2012 23:35 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
z principu scestný regex na kontrolu mailové adresy
A copak mezi
  1. nekontrolovat nic nebo kontrolovat jen přítomnost zavináče v řetězci a
  2. zkusit tam poslat e-mail (tím ověříme, že daná schránka existuje a přijímá)
není nějaký rozumný kompromis, který by šel popsat regulárním výrazem?
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
8.5.2012 00:01 d'areback
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Mily priteli, byl jste hybernovan prilis dlouho.
pavlix avatar 8.5.2012 00:02 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
není nějaký rozumný kompromis, který by šel popsat regulárním výrazem?

Není.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
xkucf03 avatar 8.5.2012 01:03 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
To je hodně odvážné tvrzení vzhledem k tomu, že variantě 1 odpovídá třeba ^.+@.+$, což je příliš benevolentní – a rozumný kompromis může být cokoli (i lehce) přísnějšího…
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
pavlix avatar 8.5.2012 01:20 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
A?
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
xkucf03 avatar 8.5.2012 10:26 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Proč lžeš? :-)
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
Jendа avatar 8.5.2012 06:47 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
že variantě 1 odpovídá třeba ^.+@.+$, což je příliš benevolentní
Ale ono to tak opravdu je (dastych+foo@[94.199.40.244], neřku-li IPv6).
xkucf03 avatar 8.5.2012 09:17 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Ale takové dastych+foo@;;; už platné není a tím regulárním výrazem to projde.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
8.5.2012 09:07 Jan Grmela | skóre: 45 | blog: Kilo šťávy z lachtana | Brno
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Nooo...ten správný regulární výraz dle specifikace mailové adresy vypadá v modulu Mail::RFC822::Address nějak takto:
(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t]
)+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:
\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(
?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ 
\t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\0
31]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\
](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+
(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:
(?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z
|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)
?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\
r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[
 \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)
?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t]
)*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[
 \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*
)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t]
)+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*)
*:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+
|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r
\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:
\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t
]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031
]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](
?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?
:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?
:\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?
:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?
[ \t]))*"(?:(?:\r\n)?[ \t])*)*:(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\] 
\000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|
\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>
@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"
(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t]
)*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?
:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[
\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000-
\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(
?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,;
:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([
^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\"
.\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\
]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\
[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\
r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] 
\000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]
|\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \0
00-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\
.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,
;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?
:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*
(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".
\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[
^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]
]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)(?:,\s*(
?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(
?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[
\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t
])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t
])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?
:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|
\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?:
[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\
]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n)
?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["
()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)
?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>
@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[
 \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,
;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t]
)*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)?
(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".
\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:
\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\[
"()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])
*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])
+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\
.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z
|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:(
?:\r\n)?[ \t])*))*)?;\s*)
Bedňa avatar 8.5.2012 09:14 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
V strede máš čiarku navyše. Ževraj taký regexp neexistuje a pritom je úplne jednoduchý a prehľadný.
KERNEL ULTRAS video channel >>>
8.5.2012 09:53 Martin Mareš
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Správný rozhodně není: abc@[def].ghi projde, i když by nemělo.
xkucf03 avatar 8.5.2012 10:03 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Tady právě záleží, co je to ten „rozumný kompromis“ – může to být třeba: projdou všechny platné adresy a odhalí co nejvíc neplatných.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
8.5.2012 10:18 Martin Mareš
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Já si právě myslím, že případy, kdy lidé někam napíší mailovou adresu, která není syntakticky správně (ale není evidentně nesmyslná, jako třeba a@b), jsou dost řídké. Daleko typičtější jsou překlepy v adrese, kterými vznikne syntakticky správná, ale neexistující adresa.

Takže mi vychází, že dává smysl buď jen naprosto triviální kontrola, nebo naopak test, že se na adresu opravdu něco dá poslat a uživatel si to přečte.
pavlix avatar 8.5.2012 11:21 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
+1
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
xkucf03 avatar 8.5.2012 11:39 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Viz #20 – tohle jsou schopní lidi napsat.

Když se někdo splete a zadá jmeno.prijmeni@example.com místo jnemo-prijmeni@example.com, tak se bohužel nedá nic dělat (není způsob, jak chybu odhalit, aniž bychom se tam pokusili poslat e-mail), ale bude dost případů, kdy překlep vede na odhalitelnou syntaktickou chybu a ne jen neexistující schránku/doménu.

E-mailových adres mi pod rukama prošlo už hodně a musím říct, že chyba typu example,com místo example.com je poměrně častá.

Co je vlastně ta „naprosto triviální kontrola“? Není to totéž jako „rozumný kompromis“? A jaký je důvod pro použití jednoduššího výrazu, který odhalí méně chyb? Ten ušetřený výpočetní výkon? Zatím stále věřím, že existuje něco lepšího než ^.+@.+$
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
pavlix avatar 8.5.2012 11:57 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Ty jsi udělal trochu podvod, nevím, jestli si to uvědomuješ. Zúžil si možnost použití té kontroly. Já mám za to (můžu se mýlit), že všichni ostatní v diskuzi si pod pojmem kontrola e-mailových adres představují něco, co lze mimojiné použít i jako automatická kontrola při vstupu. Tedy něco, co odmítne formulář s neodpovídajícím vstupem.
Co je vlastně ta „naprosto triviální kontrola“? Není to totéž jako „rozumný kompromis“
Nebylo náhodou několik variant výše uvedených?
Není to totéž jako „rozumný kompromis“?
Nazval bys rozumným kompromisem ^.+@.+$? Nebo ^\S+@\S+$ (jestli si správně pamatuju \S pro nebílé znaky v mnoha běžných regex jazycích).

Napadá mě ještě několik dalších věcí, kterým stále ještě říkám triviální kontrola, takže je nemůžu řadit ke kompromisům mezi triviální kontrolou a něčím jiným.
Ten ušetřený výpočetní výkon?
Vážně je nutné snižovat kvalitu diskuze vymýšlením fiktivních argumentů fiktivní protistrany?
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
xkucf03 avatar 8.5.2012 12:21 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Ty jsi udělal trochu podvod, nevím, jestli si to uvědomuješ. Zúžil si možnost použití té kontroly. Já mám za to (můžu se mýlit), že všichni ostatní v diskuzi si pod pojmem kontrola e-mailových adres představují něco, co lze mimojiné použít i jako automatická kontrola při vstupu. Tedy něco, co odmítne formulář s neodpovídajícím vstupem.
Špatně jsi to pochopil – mícháš dohromady dvě věci: 1) to, že používám ne zcela košer regulární výraz při ručním čištění dat (ale sám jsi uznal, že při ručním zpracování to nevadí), teď nechme stranou 2) to, že uživatelé zadávají místo e-mailů evidentní blbosti, což jsem doložil několika (anonymizovanými) příklady – toto je věc, na kterou jsem se tou #20 odkazoval.

Ano, bavíme se o automatické kontrole u které neasistuje člověk (ta moje ruční kontrola dat je jen poznámka bokem). A teď jde o to, najít regulární výraz, který odhalí co nejvíc chyb a nezpůsobí žádné falešné poplachy.
Nazval bys rozumným kompromisem ^.+@.+$? Nebo ^\S+@\S+$
Ne, protože tím projde např. i* anonym@example,com, což je podle mé zkušenosti častý překlep a hodně lidem by nechodila jejich pošta. Naopak ten perlovský Mail::RFC822::Address tuhle chybu odhalí, takže ho považuji za lepší. Možná existuje i něco ještě lepšího, ale ^\S+@\S+$ každopádně považuji za nedostatečné, zbytečně benevolentní.
Vážně je nutné snižovat kvalitu diskuze vymýšlením fiktivních argumentů fiktivní protistrany?
Jestli sis nevšiml, byla to otázka. Ptám se jaký je ten důvod. Chápu, když někdo odsoudí určitý regulární výraz kvůli tomu, že způsobuje falešné poplachy – s tím souhlasím. Ale co regulární výraz, který falešné poplachy nezpůsobuje a odhalí víc překlepů než jednodušší výraz? Jaký je důvod ho nepoužít?

*) nebo třeba  @anonym (na začátku je nedělitelná mezera). V dnešní době twitterové idiocie bych se ani nedivil, kdyby to někdo zadal místo e-mailu. Nemluvě o tom, že projde i nezakódovaná čeština nebo jiné unicode znaky.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
xkucf03 avatar 8.5.2012 13:32 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
nezakódovaná čeština nebo jiné unicode znaky
K tomu tedy existuje návrh standardu z února 2012: RFC 6530
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
pavlix avatar 8.5.2012 19:04 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Ano, bavíme se o automatické kontrole u které neasistuje člověk (ta moje ruční kontrola dat je jen poznámka bokem).
To nebylo úplně zřejmé, alespoň pro mě ne.
Ne, protože tím projde např. i* anonym@example,com, což je podle mé zkušenosti častý překlep a hodně lidem by nechodila jejich pošta.
Tak čárka by se dala ještě zahrnout mezi zakázané znaky, pokud je to až tak častý jev. Pokud by se nejednalo o chytání tohoto konkrétního překlepu, tak mi přijde už účelnější provést online ověření podle DNS.

Tak, já osobně proti tomu uvedenému regexu nemám, pokud nedává false positives. Ale sám bych se s ním nepsal.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
8.5.2012 12:42 Martin Mareš
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
A jaký je důvod pro použití jednoduššího výrazu, který odhalí méně chyb?
Ten, že je evidentní, že každá korektní mailová adresa projde. (Zatímco u naprosté většiny složitých regexů, které jsem potkal, bylo pracné, nicméně možné sestrojit korektní adresu, kterou regex zamítne.)

Navíc nevěřím tomu, že složitý regex odhalí navíc podstatné množství chyb, které by neodhalila triviální kontrola typu "mailová adresa obsahuje alespoň jeden zavináč, který není ani na začátku ani na konci, a vpravo od něj je aspoň jedna tečka".

Nedosti na tom, v životě potkáte mailové adresy, které nejsou podle striktní interpretace RFC 822 korektní, ale fungují a lidé je používají. Třeba a.b.c.@hell.org, nebo abc@hell.org. (s tečkou na konci). Ty také nejspíš odfiltrovat nechcete.
xkucf03 avatar 8.5.2012 13:01 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Ta tečka na konci domény je sporná, např. můj Postfix je ochotný takové zprávy přijmout, ale k čemu je dobré takové nestandardní adresy používat a tolerovat?

Ale budiž, dejme tomu, že takové adresy připustíme. Stále je tu ale široká škála možných výrazů přísnějších než ^.+@.+$, které jsou užitečné a odhalují překlepy uživatelů.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
8.5.2012 15:15 Filip Jirsák | skóre: 68 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Navíc nevěřím tomu, že složitý regex odhalí navíc podstatné množství chyb, které by neodhalila triviální kontrola typu "mailová adresa obsahuje alespoň jeden zavináč, který není ani na začátku ani na konci, a vpravo od něj je aspoň jedna tečka".
Problém té triviální kontroly je, že některé platné e-maily jí také neprojdou :-) Už jsem se setkal i s e-mailem v TLD. Obávám se, že většina chyb v kontrole e-mailu vzniká právě tím, že někdo odhadne, jak má asi e-mail vypadat, a podle toho kontrolu udělá. Když si někdo dá práci a napíše kontrolu opravdu podle standardu, šance, že bude napsaná špatně, je podle mne daleko menší.
8.5.2012 15:58 Martin Mareš
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Problém té triviální kontroly je, že některé platné e-maily jí také neprojdou :-)
Které?

E-mail v TLD je dost problematický, už proto, že si ho leckterý MTA vyloží jako relativní doménové jméno (to je přesně důvod, proč se na konec někdy píše tečka, byť ji RFC 822 nepřipouští).
Když si někdo dá práci a napíše kontrolu opravdu podle standardu, šance, že bude napsaná špatně, je podle mne daleko menší.
Problém je, že prakticky všechny pokusy o kontrolu podle standardu, jsou špatně. Nevím, jestli už jsem nějaký správný viděl.
8.5.2012 00:58 w4rr10r
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Viděl jsem kontrolu založenou na dotazování se na DNS, ale nevím, jak přesně to fungovalo.
xkucf03 avatar 8.5.2012 09:19 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Kontrolu existence MX záznamu domény jsem viděl taky. Nebo myslíš něco jiného – že by to kontrolovalo i existenci schránky (lokálního jména) nějakým zvláštním dotazem?
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
Jendа avatar 8.5.2012 15:38 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Kontrolu existence MX záznamu domény jsem viděl taky.
Neměl by jít e-mail doručit i na A záznam?
xkucf03 avatar 8.5.2012 17:44 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Měl, ale kdysi právě byla nějaká aféra, že někdo kontroloval jen MX a některým lidem se tam pak nešlo registrovat.

Teď to má třeba Rajče – kontroluje to online při vyplňování formuláře a bere to jak MX, tak A. Ale tečku na konci domény ani jména netolerují.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
xkucf03 avatar 8.5.2012 10:26 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
BTW: Občas čistím data a používám při tom velice primitivní a chybný* regulární výraz – důležité ale je, že odhalí evidentní chyby a je možné je opravit. Pár příkladů toho, co jsou lidé schopní zadat jako „e-mail“:
"anonym@example.com (nefunguji prilohy]"
"anonym@example.com "
"anonym@example.com; "
"anonym@example.com anonym2@example.com"
"anonym@example.com, anonym2@example.com"
"anonym[zavinac]example.com"
"anonym@example.com; anonym2@example.com"
"anonym [zavinac] example.com"
"anonym@example.com;"
"5468"
*) některé platné adresy by jím neprošly, ale zatím jsem na takové nenarazil a i kdyby ano, nějaký ten falešný poplach při ručním zpracování nevadí
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
pavlix avatar 8.5.2012 11:24 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
V tom problém nevidím. Spíš ho vidím v tom, že pak přijde nějaký blbec, vezme tvůj regulární výraz a udělá z něj formulářovou kontrolu. Zpoustu věcí dělám způsoby, které radši nezveřejňuju. Tohle by mezi ně mohlo patřit.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Luk avatar 9.5.2012 20:19 Luk | skóre: 47 | blog: Kacířské myšlenky | Kutná Hora
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
"anonym@example.com "
Klasický problém s mezerami. Velmi zhusta je zapříčiněn copy&paste, kdy se označí a zkopíruje i sousední mezera. Proto je dobré při přebírání e-mailové adresy na vstupu ještě před vlastní kontrolou vstupní řetězec oříznout od bílých znaků.
Šifrování je absolutní nutnost a pomáhá chránit před nekalými živly
Nikola Ciprich avatar 7.5.2012 22:53 Nikola Ciprich | skóre: 23 | blog: NiX_blog | Palkovice
Rozbalit Rozbalit vše Re: Nových TLD může být i přes 2 000
Odpovědět | Sbalit | Link | Blokovat | Admin
s/musi/musí/
Did you ever touch the starlight ? Dream for a thousand years? Have you ever seen the beauty Of a newborn century?

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.