Portál AbcLinuxu, 13. května 2024 14:46


Dotaz: select duplicit s vypisem 10ti polozek od kazdeho

8.2.2015 17:50 masi | skóre: 4
select duplicit s vypisem 10ti polozek od kazdeho
Přečteno: 648×
Odpovědět | Admin
Zdravim,

mam jednu tabulku, kde je 6tis polozek se strukturou viz nize:
+----------+-----------------------------+
| domain   | email                       |
+----------+-----------------------------+
| atlas.cz | karel@atlas.cz |
| atlas.cz | pepa@atlas.cz       |
| atlas.cz | borivoji@atlas.cz     |
| atlas.cz | magdalena@atlas.cz        |
+----------+-----------------------------+
mam zde hodne atlas.cz, seznam.cz gmail.com atd.. A potrebuju od kazde domeny vybrat pouze 10 emailu idealne v jednom selectu. Je to vubec mozne? Uz par hodin se snazim spravne zeptat google a zatim bez uspechu, Je mi jedno zda to bude postgre, nebo mysql. Projizdim dokumentaci, ale nenapada me ani moc jak bych to realizoval a kdyz to bude v kodu, bojim se spatneho vykonu, samozrejme me napadlo udelat neco takoveho:
adr_list = []
domains = db.query("select domain, count(email) as cnt from recipients group by domain having cnt > 10")

adr_list.append(db.query("""select email from recipients where domain not in (select domain from (select domain, count(email) as cnt from recipients group by domain having cnt > 10) as tmp);""")
for dom in domains:
    adr_list.append("select email from recipients LIMIT 10;" % dom)
ale radeji bych to udelal spravne a neco se rovnou priucil.

Predem dekuji za rady a postouchnuti...

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

8.2.2015 18:07 Filip Jirsák
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nedaly by se na to použít windowing funkce? Seskupit do jednoho okna všechny se stejnou doménou, a pak v okně vybrat prvních deset.
8.2.2015 18:27 masi | skóre: 4
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Dobry den,

dekuji vam za tip, ale uprimne slysim termin windowing funkce poprve, ale nasel jsem podle toho http://www.postgresql.org/docs/9.1/static/tutorial-window.html. Kazdopadne po precteni uvodu si nedokazu moc predstavit jak by to mohlo pomoci.

Ja mam predstavu, ze by se to mohlo udelat nejak prez subselect vhodne, ale nevim jak to napsat, pripadne urcite bude vhodnejsi reseni.

I tak vam moc dekuji
Řešení 1× (masi (tazatel))
8.2.2015 18:49 TTT
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Ten dotaz bude vypadat přibližně takto
SELECT 
 *
FROM (
    SELECT
        ROW_NUMBER() OVER (PARTITION BY domain ORDER BY email) AS rowno,
        email
    FROM 
        emails
) t
WHERE rowno <= 10
Nezkoušel jsem to, možná tam jsou nějaké detaily špatně. V MySQL to jde zprasit přes proměnnou, což většinou funguje. Dá se udělat i korelovaný poddotaz, který bude počítat rowno, ale efektivita jde do háje.
8.2.2015 19:23 Filip Jirsák
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Případně pokud se mají vybrat jen ty domény, které mají alespoň 10 e-mailů, ještě spojit (JOIN) s výsledkem toho prvního dotazu od tazatele.
8.2.2015 20:11 masi | skóre: 4
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Dekuji mnohokrat, to je presne ono... To je pouziti tech windowing?
8.2.2015 20:20 Filip Jirsák
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Ano. OVER ... PARTITION vytvoří okna (skupiny řádků), ROW_NUMBER() se pak provádí na té skupině řádků.
Josef Kufner avatar 10.2.2015 10:36 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: select duplicit s vypisem 10ti polozek od kazdeho
Odpovědět | | Sbalit | Link | Blokovat | Admin
ti ti ti No fuj.
Hello world ! Segmentation fault (core dumped)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.