Společnost OpenAI představila novou řadu svých AI modelů OpenAI o1 navržených tak, aby "strávily více času přemýšlením, než zareagují". Videoukázky na 𝕏 nebo YouTube.
Sailathon 24, tj. hackathon mobilního operačního systému Sailfish OS, proběhne od 27. do 30. září v Praze na Strahově ve školícím centru Silicon Hill.
Bylo vydáno Ubuntu 22.04.5 LTS, tj. páté opravné vydání Ubuntu 22.04 LTS s kódovým názvem Jammy Jellyfish. Stejně tak Kubuntu 22.04.5 LTS, Ubuntu Budgie 22.04.5 LTS, Ubuntu MATE 22.04.5 LTS, Lubuntu 22.04.5 LTS, Ubuntu Kylin 22.04.5 LTS, Ubuntu Studio 22.04.5 LTS a Xubuntu 22.04.5 LTS.
Byla publikována veřejná Výroční zpráva Bezpečnostní informační služby za rok 2023 (pdf).
Byla vydána nová verze 8.7 multiplatformní digitální pracovní stanice pro práci s audiem (DAW) Ardour. Přehled oprav, vylepšení a novinek v oficiálním oznámení.
Společnost Juno Computers prodávající počítače s předinstalovaným Linuxem má nově v nabídce linuxový tablet Juno Tab 3. Na výběr je Mobian Phosh, Ubuntu 24.04 (GNOME) a Kubuntu 24.04 (KDE Plasma). Cena začíná na 699 dolarech.
VirtualBox, tj. multiplatformní virtualizační software, byl vydán v nové verzi 7.1. Přehled novinek v Changelogu. Přináší modernizovaný vzhled a ovládání. Přepínat se lze mezi základním a rozšířeným uživatelským rozhraním. NAT nově podporuje IPv6. Linuxový hostitel a host mohou sdílet schránku na Waylandu.
Organizátoři konference LinuxDays 2024 vydali program a zároveň otevřeli registrace. Akce se uskuteční 12. a 13. října na FIT ČVUT v pražských Dejvicích, kde vás čekají přednášky, workshopy, stánky a spousta chytrých lidí. Vstup na akci je zdarma.
Blíží se vydání FreeCADu 1.0. Vydána byla první RC verze tohoto svobodného multiplatformního parametrického 3D CADu. Přehled novinek i s náhledy v poznámkách k vydání.
Bylo vydáno Eclipse IDE 2024-09 aneb Eclipse 4.33. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.
cat | reformime ....
4x se stejným souborem kvůli čtyřem hlavičkám mi přijde neefektivní ( emailů je kolem 180 GB ). Navíc jsem musel hlavičky stejně ošetřit pythonem (dekódovat).
Zkusil jsem tedy načtení hlaviček napsat kompletně v Pythonu. Python má nějaké rozšíření mail, ale nepřišel jsem mu na kloub, a způsoben, jakým jsem s ho snažil použít mi stále vyhazoval exceptions u dekódování "To :" ( tak jeden z 50-ti emailů mu neseděl .. ono to zlobilo i s tím reformime a následným dekódováním) ..
Tady chci představit mou práci (jsem pořád začátečník) požádat o korekce příp navrhnout jinou cestu.
předem díky.
Toto je jen funkce, která vytáhne hlavičky. na vzorku emailů se to chovalo korektně, ale možná narazím na nějaké exotické emaily, kde bude výsledek horší.
Funkce je lehce přizpůsobená z mail.headers (kde problém dělal použitý regulární výraz, jak jsem zjistil ) - regulární výraz je hahrazen otrockou smyčkou ..
def getheaders ( file_handler ): headers={} needed_headers = ["From: ", "To: ", "Subject: ", "Date: "] we_read = False for mail_line in file_handler: if ( we_read == True ): if( mail_line.startswith(' ') ): cur_header += " "+mail_line.strip(); else: headers[h] = cur_header[len(h):] needed_headers.remove(h) we_read = False if ( we_read == False ): for h in needed_headers: if( mail_line.startswith( h ) ): cur_header=mail_line.strip() we_read = True break if( len(needed_headers) == 0 ): break #print "headers - TO: " #print headers["To: "] return headers
def get_headers2( file_handler ): headers={} needed_headers = ["From", "To", "Subject", "Date"] msg = email.message_from_file( file_handler ) for h in needed_headers: curr_header = email.header.decode_header( msg.get( h ) ) header_sections = [unicode(text, charset or 'ASCII', "ignore") for text, charset in curr_header ] headers[ h ] = u"".join(header_sections) mail_date = msg.get( "Date" ) if ( mail_date ): tup_date = email.utils.parsedate_tz( mail_date ) if ( tup_date ): ts_date = email.utils.mktime_tz( tup_date ) if ( ts_date ): mail_date = datetime.datetime.fromtimestamp( ts_date ).strftime( '%Y-%m-%d %H:%M:%S' ) headers[ 'Date' ] = mail_date return headersZpracování datumu je tam odbyté, ale nepotřebuji na sekundu přesně čas, tak jsem to víc neřešil..
Tiskni Sdílej: