abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:22 | Humor

    Asociace repair.org udělila anticeny těm nejhorším produktům představeným na veletrhu CES 2026. Oceněnými jsou například šmírující kamery Amazon Ring AI, chytrý běžecký pás od společnosti Merach, která otevřeně přiznává, že nedokáže zabezpečit osobní data uživatelů, případně jednorázové lízátko, které rozvibrovává čelisti uživatele a tak přehrává hudbu. Absolutním vítězem je lednička od Samsungu, která zobrazuje reklamy a kterou lze otevřít pouze hlasovým příkazem přes cloudovou službu.

    NUKE GAZA! 🎆 | Komentářů: 2
    dnes 12:00 | IT novinky

    Íránští protirežimní aktivisté si všímají 30% až 80% ztráty packetů při komunikaci se satelity služby Starlink. Mohlo by se jednat o vedlejší důsledek rušení GPS, kterou pozemní přijímače Starlinku používají k výpočtu polohy satelitů a kterou se režim rovněž snaží blokovat, podle bezpečnostního experta a iranisty Amira Rashidiho je ale pravděpodobnější příčinou terestrické rušení přímo satelitní komunikace Starlinku podobnou

    … více »
    NUKE GAZA! 🎆 | Komentářů: 1
    dnes 00:55 | IT novinky

    Evropská komise (EK) zvažuje, že zařadí komunikační službu WhatsApp americké společnosti Meta mezi velké internetové platformy, které podléhají přísnější regulaci podle unijního nařízení o digitálních službách (DSA). Firmy s více než 45 miliony uživatelů jsou podle DSA považovány za velmi velké on-line platformy (Very Large Online Platforms; VLOP) a podléhají přísnějším pravidlům EU pro internetový obsah. Pravidla po

    … více »
    Ladislav Hagara | Komentářů: 11
    dnes 00:44 | IT novinky

    Tržní hodnota technologické společnosti Alphabet poprvé v historii přesáhla čtyři biliony dolarů (83 bilionů Kč). Stalo se tak poté, co Apple oznámil, že bude na poli umělé inteligence (AI) spolupracovat s dceřinou firmou Alphabetu, společností Google.

    Ladislav Hagara | Komentářů: 3
    včera 11:11 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 161 (pdf).

    Ladislav Hagara | Komentářů: 0
    včera 10:44 | Nová verze

    Po delší době vývoje vyšla nativní linuxová verze virtuálního bubeníka MT-PowerDrumKit 2 ve formátu VST3. Mezi testovanými hosty jsou Reaper, Ardour, Bitwig a Carla.

    balda | Komentářů: 1
    11.1. 21:33 | Nová verze

    Desktopové prostředí Budgie bylo vydáno ve verzi 10.10. Dokončena byla migrace z X11 na Wayland. Budgie 10 vstupuje do režimu údržby. Vývoj se přesouvá k Budgie 11. Dlouho se řešilo, v čem bude nové Budgie napsáno. Budgie 10 je postaveno nad GTK 3. Přemýšlelo se také nad přepsáním z GTK do EFL. Budgie 11 bude nakonec postaveno nad Qt 6.

    Ladislav Hagara | Komentářů: 0
    11.1. 13:00 | Humor

    OpenChaos.dev je 'samovolně se vyvíjející open source projekt' s nedefinovaným cílem. Každý týden mohou lidé hlasovat o návrzích (pull requestech), přičemž vítězný návrh se integruje do kódu projektu (repozitář na GitHubu). Hlasováním je možné změnit téměř vše, včetně tohoto pravidla. Hlasování končí vždy v neděli v 9:00 UTC.

    NUKE GAZA! 🎆 | Komentářů: 3
    11.1. 03:00 | Nová verze

    Byl vydán Debian 13.3, tj. třetí opravná verze Debianu 13 s kódovým názvem Trixie a Debian 12.13, tj. třináctá opravná verze Debianu 12 s kódovým názvem Bookworm. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 a Debianu 12 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

    Ladislav Hagara | Komentářů: 0
    10.1. 03:00 | Komunita

    Na stránkách Evropské komise, na portálu Podělte se o svůj názor, se lze do 3. února podělit o názor k iniciativě Evropské otevřené digitální ekosystémy řešící přístup EU k otevřenému softwaru.

    Ladislav Hagara | Komentářů: 7
    Které desktopové prostředí na Linuxu používáte?
     (7%)
     (5%)
     (0%)
     (9%)
     (20%)
     (3%)
     (6%)
     (3%)
     (11%)
     (49%)
    Celkem 390 hlasů
     Komentářů: 11, poslední dnes 15:18
    Rozcestník

    Dotaz: C++ - AI a mining adries firiem

    hermes avatar 11.6.2022 13:30 hermes | skóre: 7 | blog: Elektro | BA
    C++ - AI a mining adries firiem
    Přečteno: 803×
    Ahojte mám taký nástroj, ktorý prejde niektoré stránky so zoznamami firiem napr.
    1. https://www.zoznam.sk/katalog/Spravodajstvo-informacie/Abecedny-zoznam-firiem/
    2. https://www.azet.sk/katalog/

    a nahodí firmy štruktúrovane do mojej SQL databázy. Nahadzuje ich podľa:

    krajina / kraj / mesto / firma

    Každá položka oobsahuje:

    1. Názov firmy
    2. Adresu
    3. Kontaktné údaje (tel, email)

    S mojou SQL DB potom môžem ďalej pracovať a používať tento zoznam firiem v mojich aplikáciách. Problém je, že som odkázaný len na hotové weby s katalógom firiem. A vždy pre každý nový katalóg musím pripraviť šablónu, podľa ktorej sa budú dáta minovať.

    Napadlo ma urobiť univerzálnejšie riešenie. Ktoré by fungovalo na akékoľvek weby. Nejakou heurestikou by sa mohla detegovať adresa. Adresa by sa dala nájsť podľa nejakého klúča. V adrese sú prítomné:

    1. Meno fyzickej osoby / Názov firmy (právnická osoba) - v niektorých prípadoch viem detegovať (ak je na konci názvu s.r.o. alebo a.s. inak neviem ako by som to detegoval)
    2. Ulica Číslo - viem detegovať regexom aj keď asi nie na 100%
    3. Mesto - viem detegovať podľa nejakého zoznamu miest (informácia o meste mi dáva aj ďalešie info o kraji a krajine)
    4. PSČ - viem detegovať regexom
    5. EMAIL(y) - viem detegovať regexom
    6. Telefón(y) - viem detegovať regexom

    Možno by bolo fajn detgovať aj logo firmy a uložiť ho do DB ako blob, ale to asi zatiaľ vynechám a budem sa tomu venovať až na záver, lebo ma nenapadá spôsob ako na to

    Rozmýšlam ako spraviť na jednej strane čo najpresnejšie a zároveň najuniverzálenejšie riešenie. Prechádzanie stránok, by fungovalo podobne ako pri google bote cez odkazy. To neni problém a viem si s tým ľahko poradiť. Ale ako na detekciu názvu firmy a jej adresy? Nedal by sa na detekciu použiť strojové učenie. Pozeral som si kedysi nejaké tutorialy pre technológiu CUDA a tam bolo dosť veľa deep learning frameworkov, neviete s ktorým začať niečo čo by bolo vhodné aj pre začiatočníka? Najlepšie nejaký framework pre C++

    Odpovědi

    11.6.2022 14:47 Olaf
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    Není ML na tohle -- alespoň z počátku -- trošku kanón na vrabce? Zkraje mě napadalo, že to je jak počítat průměrné telefonní číslo ze seznamu, ale to bych ti asi křivdil.

    Každopádně z počátku bych to zkusil z těch tvých zdrojů přes web scraping pomocí Pythonu (BeautifulSoup, Selenium, Pandas...). Pak tam můžeš zkusit nějaké ML pomocí SciKit-Learn či TensorFlow. A až si vybuduješ představu, jak by to mělo fungovat, přesuň se k C++ (ale k tomu asi nebude důvod).
    NUKE GAZA! 🎆 avatar 13.6.2022 14:30 NUKE GAZA! 🎆 | skóre: 37 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem

    hele spacy umí :O :O

    13.6.2022 17:59 Olaf
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    Ani jeden z nás mu vlastně neporadil. :-) Já to domotal úplně. Ale to asi ty moje horečky v tom období. ;-) Nicméně kdyby to chtěl řešit Pythonem, tak jsme mu to vyřešili.
    13.6.2022 19:34 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    Čo by mal byť výsledok? Na Slovensku máme Obchodný Register v ktorom sú tieto dáta pravidelne aktualizované. Pravda je že asi bez loga firmy, ale na ňom až tak nezáleží. A nejaké API by bolo tiež k dispozícii.
    AraxoN avatar 14.6.2022 12:31 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    V obchodnom registri nie je e-mail a telefón.
    14.6.2022 13:41 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    V Obchodnom registri sú zapísaní konatelia a vlastníci, ktorí majú obvykle utajený kontakt. Teda pokiaľ sa nejedná o živnostníkov alebo one man show sro.

    Kontakt (email, fax alebo telefón) má firma obvykle na svojej stránke, aj keď sa v dnešnej dobe skôr prechádza na chatboty alebo kontakt cez facebook. Živnostníci majú svoje kontakty v dnešnej dobe u centrálnych dispečingov nech si nehľadajú prácu.

    To je dôvod prečo som sa pýtal na účel takéhoto zberu údajov.

    Ak je to len vyťaženie už existujúcich štrukturálnych zoznamov z Azetu a Slovenských Telekomunikácií (kedysi kúpili Zoznam), tak by som sa poobzeral u nich na pobočke či nemajú k dispozícii v elektronickej forme Firemný Telefónny Zoznam známy aj ako yellow pages. Pamätám časy keď bol zdarma v papierovej podobe.

    A ak je to len budovanie zoznamu telefónnych čísel pre predaj bambusových ponožiek, tak sa zmenil Zákon o Reklame z roku 2005.
    AraxoN avatar 15.6.2022 07:40 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    Ja nie som OP, takže neviem, čo s tým zamýšľa...
    A ak je to len budovanie zoznamu telefónnych čísel pre predaj bambusových ponožiek, tak sa zmenil Zákon o Reklame z roku 2005.
    Do frasa, kde si teraz kúpim tie bambusové ponožky? Kde budem môcť vyhrať dovolenku pre dvoch?? Kde sa dozviem najnovšie investičné typy???
    15.6.2022 18:29 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: C++ - AI a mining adries firiem
    Ja nie som OP, takže neviem, čo s tým zamýšľa...
    Pýtal som sa jeho, odpovedal si ty. Predpokladám že má dosť chcochmesu aby len nevyťažil hotový katalóg. Pri tom ho s najväčšou pravdepodobnosťou zabanuje minimálne Captcha.
    Do frasa, kde si teraz kúpim tie bambusové ponožky? Kde budem môcť vyhrať dovolenku pre dvoch?? Kde sa dozviem najnovšie investičné typy???
    Neviem. Mne zavolajú automatické vyvolávacie systémy (ktoré to prepoja na operátorku) tak max 2x za rok. A už mi chceli predať aj lisované rybacie kože ako zázračný zdroj vitamínu D (chodím na slnko), alebo výborný olej s antioxidantom (najlacnejší repkový olej s vymáchanou mrkvou ktorý je napustený tokofenolom). Produkty týchto rádobypredajcov sú ozaj rôzneho, a nezriedka humorného charakteru.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.