Portál AbcLinuxu, 26. dubna 2024 15:37


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Vložit další komentář
Bystroushaak avatar 17.5.2015 20:55 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Pomocou regulárnych výrazov je pomerne jednoduché tokenizovať text na slová:
Tohle nedoporučuji používat na nic složitějšího. Python k tomu má luxusní nltk knihovnu, která skutečně zná gramatická pravidla.

Jinak pěkné.
blog.rfox.eu
Fluttershy, yay! avatar 18.5.2015 00:35 Fluttershy, yay! | skóre: 92 | blog:
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
+1
🇵🇸Touch grass🇺🇦 ✊ no gods, no masters
mirec avatar 19.5.2015 07:58 mirec | skóre: 32 | blog: mirecove_dristy | Poprad
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu

Keby som mal trochu viacej času pohrať sa s nltk bola by celkom pecka rozanalyzovať jednotlivé vetné členy a skladať potom vety s reálnymi slovami so správnym slovosledom. Ako som spomínal nižšie ja používam generátor len pri vývoji ale ehm no viem si predstaviť že by som robil napr. inzertný portál, z nejakého už existujúceho portálu by som skopíroval pár inzerátov a podľa ich textu nechal vygenerovať pár tisíc a ukázal to zákazníkovi. Lenže momentálne už pekne dlho nerobím pre zákazníkov ale vlastné firemné projekty takže nič podobné momentálne nepotrebujem ;-).

LinuxOS.sk | USE="-fotak -zbytocnosti -farebne_lcd +vydrz +odolnost +java" emerge telefon
17.5.2015 21:50 manasekp | skóre: 29 | blog: manasekp | Brno
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Podobne texty jsem pred mnoha lety pouzival u automaticky generovanych webu pro seznamacky vyhledavac, tehdy to jeste slo :-)
BIOKOMP | Cas od casu se pokousim nekoho srazit k zemi abych se tam nevalel sam.
JiK avatar 18.5.2015 00:09 JiK | skóre: 13 | blog: Jirkoviny | Virginia
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Nestacilo by vzit existujici texty od te slovenske ucitelky?
Jirka Cech
Bedňa avatar 18.5.2015 01:03 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Alebo iných užívateľov Abička, cat /dev/ka
KERNEL ULTRAS video channel >>>
Bystroushaak avatar 18.5.2015 01:46 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Nestacilo by vzit existujici texty od te slovenske ucitelky?
Tam je výhoda, že by se ani nemusely upravovat. Byl by o ně zájem?
Bedňa avatar 18.5.2015 02:29 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Jasne, spravím ďalšie /dev
KERNEL ULTRAS video channel >>>
18.5.2015 10:39 Z.z.
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Bystroušiak, Ty protivná, jedovitá klebetná pavlačová baba! :)
18.5.2015 07:21 Z.z.
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
chcela som ešte pred včerjšou polnocou:) poznamenať, že tu fungujete ako generátory náhodne pozliepaných nezmyselných drístov viacerí, JiK-a nevynímajúc, ale nechcelo sa mi pôvodne sihnuť kvôli tomu na klávesnicu

hotová tragédia:)
18.5.2015 21:38 Muriel
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Všade vrchol sa neuvedomosti?
18.5.2015 23:50 Z.z.
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
slovo "neuvedomosť" neexistuje:)... len neuvedomelosť:)...
19.5.2015 01:16 Z.z.
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
tak som Tí, bystroušiak Muriel, ani nespravila radosť nepochopením Tvojho "dobrého vtipu"? :(

dúfam, že si z toho aspoň vyvrcholil

Blaazen avatar 18.5.2015 14:29 Blaazen | skóre: 24 | blog: BL
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Na tohle přece existuje specializovaný software.
Josef Kufner avatar 18.5.2015 20:56 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Něco podobného jsem nedávno viděl použité jako vycpávkové texty na rozdělaném webu a je to děsně otravné. Latinské Lorem ipsum má výhodu v tom, že není rozumět ani jednotlivým slovům, takže neruší ani malé úryvky z textu.
Hello world ! Segmentation fault (core dumped)
mirec avatar 19.5.2015 07:52 mirec | skóre: 32 | blog: mirecove_dristy | Poprad
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu

Ja to nemám určené na prezentáciu zákazníkovi. Keď generujem nejakú databázu s pár tisíc záznamami zaujíma ma pár vecí:

  • správna podpora unicode (áno v pythone je s tým občas problém ak niekde pracujem s latin1, inde s unicode, pri lorem ipsum to nevyhodí výnimku)
  • či funguje korektne fulltext, podľa možností aj s prevodom slov do základného tvaru, preto používam slovník myspell z ktorého genrujem slabiky, ak má nejaké slovo na konci prípony ktoré sú bežné v slovenčine stemmer ich vie odstrániť aj keď je slovo nezmyselné a môžem pekne testovať či fulltext funguje správne
  • podpora slovenčiny vo fontoch, áno niekedy by som najradšej grafika nakopal keď dodá font v ktorom nie sú znaky ako Ľ, s lorem ipsum by som sa ani nedozvedel, že nejaké znaky chýbajú, nerád síce používam fontforge ale keď musím tak dokreslím ;)
  • či sa grafika nerozletí / nevyteká keď sú všade použité náhodne generované texty s približne rovnakým rozdelením pravdepodobnosti ako pri reálnom texte
LinuxOS.sk | USE="-fotak -zbytocnosti -farebne_lcd +vydrz +odolnost +java" emerge telefon
Josef Kufner avatar 19.5.2015 19:58 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Na otestování unicode je lepší tam strčit nějaký smysluplný testovací řetězec, který ty znaky ověří všechny najednou. Pro češtinu se hodí například: Příliš žluťoučký kůň úpěl ďábelské ódy.

Na fulltext to zní jako rozumné, ale to jsem snad nikdy netestoval. Vždy jsem použil už odladěný nástroj.

Rozpadání grafiky by mělo nastávat zhruba stejně s lipsum jako s reálným textem. Délky slov až tak odlišné nejsou.
Hello world ! Segmentation fault (core dumped)
pavlix avatar 19.5.2015 20:35 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Pro češtinu se hodí například: Příliš žluťoučký kůň úpěl ďábelské ódy.
Tak jestli všichni zkoušejí češtinu na tomto řetězci, tak to vysvětluje, proč se mi tak často špatně zobrazují pouze velká písmena s diakritikou.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Josef Kufner avatar 19.5.2015 22:34 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Jo, na tom něco bude. Asi je ta věta potřeba dvakrát ;-)
Hello world ! Segmentation fault (core dumped)
25.5.2015 13:38 xm | skóre: 36 | blog: Osvobozený blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
A co takhle pro trochu zajímavější výsledky použít rekurentní neuronovou síť? Viz aktuální článek The Unreasonable Effectiveness of Recurrent Neural Networks, výsledky dává fakt dechberoucí ;-) Obzvláště C kód generovaný RNN naučenou podle kódu Linuxového kernelu je pěkný, ale Shakespeare nebo Wikipedia také stojí za to :-)
Svoboda je tím nejdůležitějším, co máme. Nenechte se o ní připravit, podporujte Pirátskou stranu!
25.5.2015 13:40 xm | skóre: 36 | blog: Osvobozený blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
(btw. zdrojový kód a zdrojová data té RNN v článku included)
Svoboda je tím nejdůležitějším, co máme. Nenechte se o ní připravit, podporujte Pirátskou stranu!
Bystroushaak avatar 25.5.2015 15:47 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
To je dost dobrý.
mirec avatar 25.5.2015 16:04 mirec | skóre: 32 | blog: mirecove_dristy | Poprad
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu

Vďaka za ďalšiu hračku ;)

LinuxOS.sk | USE="-fotak -zbytocnosti -farebne_lcd +vydrz +odolnost +java" emerge telefon
25.5.2015 20:51 dooku | skóre: 4
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
Odpovědět | Sbalit | Link | Blokovat | Admin
Na tohle jsou docela pekne Markovovy retezce. Neni to nic prevratneho, proste se projde text a vytvori se tabulka s pravdepodobnostmi vyskytu slov (tj, s jakou pravdepobnosti je slovo svete za slovem ahoj), z te tabulky se pak daji skladat pekne nahodne texty (celkem vtipna ukazka je treba King James Programming.
I run Linux!
Bystroushaak avatar 25.5.2015 20:59 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Generátor pseudonáhodneho textu
To je v podstatě to co udělal, až na to že na nižší úrovni.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.