Byla vydána (𝕏) květnová aktualizace aneb nová verze 1.101 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.101 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
V Brně na FIT VUT probíhá třídenní open source komunitní konference DevConf.CZ 2025. Vstup je zdarma, nutná je ale registrace. Na programu je celá řada zajímavých přednášek, lightning talků, meetupů a workshopů. Přednášky lze sledovat i online na YouTube kanálu konference. Aktuální dění lze sledovat na Matrixu, 𝕏 nebo Mastodonu.
Vyloučení technologií, které by mohly představovat bezpečnostní riziko pro stát, má umožnit zákon o kybernetické bezpečnosti, který včera Senát schválil spolu s novelami navazujících právních předpisů. Norma, kterou nyní dostane k podpisu prezident, počítá rovněž s prověřováním dodavatelů technologií pro stát. Normy mají nabýt účinnosti od třetího měsíce po jejich vyhlášení ve Sbírce zákonů.
Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.6.
Po Red Hat Enterprise Linuxu a AlmaLinuxu byl v nové stabilní verzi 10.0 vydán také Rocky Linux. Přehled novinek v poznámkách k vydání.
Bylo vydáno Eclipse IDE 2025-06 aneb Eclipse 4.36. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.
Americká filmová studia Walt Disney a Universal Pictures podala žalobu na provozovatele populárního generátoru obrázků pomocí umělé inteligence (AI) Midjourney. Zdůvodňují to údajným porušováním autorských práv. V žalobě podané u federálního soudu v Los Angeles označují firmu za „bezednou jámu plagiátorství“, neboť podle nich bez povolení bezostyšně kopíruje a šíří postavy z filmů jako Star Wars, Ledové království nebo Já, padouch, aniž by do nich investovala jediný cent.
Ultra Ethernet Consortium (UEC), jehož cílem je optimalizace a další vývoj Ethernetu s důrazem na rostoucí síťové požadavky AI a HPC, vydalo specifikaci Ultra Ethernet 1.0 (pdf, YouTube).
Francouzský prezident Emmanuel Macron chce zakázat přístup na sociální sítě pro děti do 15 let. Francie podle něj tento krok udělá sama do několika měsíců, i pokud se na něm neshodnou další státy Evropské unie. Reaguje tak na úterní vraždu vychovatelky, kterou ve východofrancouzském městě Nogent pobodal 14letý mladík. Jednotlivé sociální sítě podle něj mají možnost věk ověřit a vymáhat zákaz pomocí systémů na rozpoznávání tváří.
Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,742 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější český počítač C24 klesl na 165 místo. Karolina, GPU partition klesla na 195. místo a Karolina, CPU partition na 421. místo. Další přehledy a statistiky na stránkách projektu.
Ted jich ma pry pres milion.No taky už to není jen vyhledávač.
Seznam AFAIK indexuje jenom českou část webu.O tom se tady taky mluví. Aby hledal prozatim jen v TLD cz.
Přeju příjemnou zábavu ohledně návrhu algoritmů a nějakého distribuovaného výpočetního výkonu + úložiště.Zábava by to byla, ale open-source distribuované indexery a vyhledávače už existují. Pro amatérské použití dostačující až až. Link, odkud začít, jsem dával.
Zdar boyz, myslim ze minimal konfigurace pro ciste vyhledavani jen v .cz jsou tak 3-5 nabušené stroje. latence odpovědí ale nebudou moc růžový
V Seznamu nam ted bezi test (vydeje) hledani asi na 6 strojich; databaze by se dala jeste trochu zmensit.
Myslim ze pro maly setupy bude spis vetsi zahul na stroje pro robota - obnova stranek, indexace a tak...
-- stepan
p2p vyhledávač je utopie, prostě ty latenci to zabíjejíLatence vzniká jednak pomalým uploadem od domácích uživatelů a jednak nízkým výkonem/kapacitou jejich počítačů. Co se týče toho prvního, je jen otázka, co je pro nás přijatelná latence – ano, Google odpoví prakticky hned, ale je třeba zpoždění 2-3 vteřiny už nepřijatelné? Pokud bych dostal relevantní výsledky, tak za to budu rád a řádově vteřinovou dobu si bez problémů počkám. A co se týče výkonu počítačů – jde o to, jak dobře ten systém umí škálovat, Google má sice „hodně“ serverů, ale používá ho „hodně“ lidí. Pokud by všichni přestali používat Google a místo toho obětovali nějaké procento výkonu svého počítače P2P vyhledávači, byl by celkový výkon mnohem větší, než co má Google teď.
Nebo se tomu jen o pár řádů přiblížit?O pár řádů? Vždyť mi k tomu chybí jen jeden řád. A to google indexoval mnohem větší rozsah než pouhou .cz.
(Btw, zajímalo by mně, co si MJ myslí o Egothoru ...)
Egothor is ... written entirely in Java.Mám své podezření
No to uz by tady chybel akorat Jara Cimrman
+ nejaky strojovy vykonNějaké 5U pro 52 SATA disků , k tomu deska pro 4x XEON MP , ke každému tak 32GB ECC Ramky. Odhadem jsem u ceny kolem 700 000.- což by třeba pro začátek stačilo.
Case cca 100 000,- 52x disk 2000GB tj. cca 200 000.- , Deska + cpu + ram + Arecca zbytek + nějaká pořádná GB-FC kartaJako úložiště by to snad mělo prozatím stačit
marketing ech echV dnešní době kdy i seznam hledá kde by udal nějakou reklamu je toto jistě těžké a lokální vyhledávač se bez reklamy neuživí. Kdybych hodně spekuloval tak si musí na sebe vydělat aspoň na provozní náklady. Chtělo by to nějakého dobrého sponzora třeba stát
moorov zakon hovori, ze o dvadsat rokov mozes googlu konkurovat aj s domacim desktopom.To není tak úplně pravda... za 20 let totiž může konkurovat googlu tak, jak vypadal před 20 lety... jelikož ten objem dat stále roste, tak mu to zase stačit nebude :)
Výkony počítačů jdou natolik nahoru, že dnes není třeba na vyhledávač mít farmy tisíců počítačů – pro začátek to klidně může běžet na jediném, naostro pak na pouhých několika – pokud se omezíte na určitý výsek internetu.Jinými slovy pokud chcete navrhnout vyhledávač, který skoro nic nenajde, vystačíte si s jedním počítačem. Pravda pravdoucí
Napsat vyhledávač není těžké. Chce to určitou znalost teorie.V zásadě ano. A také si umět poradit s obrovským množstvím dat, což už tak snadné není. A také s hromadou podvodníků, kteří se vás stále snaží ošidit. A s autory webových stránek, serverů a operačních systémů, kteří jsou neobyčejně kreativní v tom, jak si lze libovolný standard vyložit. (Něco maličko bych o tom věděl ;) )
Já sám jsem se pokoušel v minulosti přidat k několika open source skupinám, ale už jsem poučen a už to nikdy neudělám.Nemohu se ubránit dojmu, že je to dobrá zpráva O
Rozumím, že chápání sousloví jako "pro začátek", nebo "pokud se omezíte na určitý výsek internetu" jsou nad Vaše mentální možnosti.Nikolivěk, jen říkám, že abyste podstatně ušetřil na objemu dat, bude ten výsek muset být tak malý, že v něm nic užitečného nenajdete. (Nebo budete prohledávat konkrétní skupinku několika webů, na což vám pak zase stačí grep.)
A jaký je rozdíl v případě jakýchkoli reálných dat y téměř jakéhokoli prostředí?Obvykle tvoří většinu dat náhodný šum, zde tvoří většinu zlomyslně vyráběný šum. To je velký rozdíl.
Web je o to hůře, že ho bohužel standartizuje fušerská organizace W3C, která nebyla schopná ani nevrhnout gramatiku a způsob parsování HTMLW3C se pokud vím standartizací nezabývá (není to spolek vexilologů), co se standardizace týče, není na tom zase tak špatně. Starší verze HTML dost jasně říkaly, že se jedná o speciální případ SGML, a SGML má parsovací pravidla definovaná přesně. Přesný standard existuje, jen ho zdá se skoro nikdo nedočetl do konce.
Ukládání velkého množství dat je dnes snadnější, než kdy jindy. Kromě toho velikost dat se setsakra liší podle použitých datových struktur, což je část architektury hledače. Klidně i o mnoho řádů. Zde právě tvrdě závisí na zkušenostech a talentu člověka velmi mnoho.Obecné řeči. Pokud tvrdíte, že to umíte lépe než všichni na světě, račte to předvést. Pakliže předvedete, smekám před vaším talentem. Pakliže nikoliv, nejspíš vás budou považovat za tlučhubu.
Tiskni
Sdílej: