TenGO - polski słownik

  • 16 Odpowiedzi
  • 3012 Wyświetleń

0 użytkowników i 1 Gość przegląda ten wątek.

*

Offline qrees

  • **
  • 133
  • Płeć: Mężczyzna
  • Sprzęt: HTC Desire
TenGO - polski słownik
« dnia: Październik 24, 2006, 22:11:25 »
Ostatnio szukałem jakiejś dobrej polskiej klawiatury niestety bez większych efektów. Są polskie słowniki do zwykłych klawiatur, ale wpisywanie tekstów za pomocą tak małych literek jest raczej uciążliwe. TenGO w pewnym sensie rozwiązuje ten problem, ale nie ma polskiej wersji. Po odrobinie zmagań wystrugałem polski słownik do tego programu.

Słownik jest wyciągnięty z Aspell'a. Niestety nie udało mi się zmusić polskich literek do działania, zatem wyrzyski litery typu ą, ś, ć są zamienione na a, s, c itd. (może uda się to później rozwiązać). Kolejny problem to brak odmiany słów, których wydaje się, że TenGo nie obsługuje, a wpisywanie każdej formy wyrazów zajęłoby ładnych paręnaście MB.

http://strony.aster.pl/qrees/tengo.rar

*

Offline piopawlu

  • **
  • 109
  • Płeć: Mężczyzna
    • piopawlu.net
  • Sprzęt: iPhone 3G, Nexus One
TenGO - polski słownik
« Odpowiedź #1 dnia: Październik 25, 2006, 09:03:30 »
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.

Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)

*

Offline qrees

  • **
  • 133
  • Płeć: Mężczyzna
  • Sprzęt: HTC Desire
TenGO - polski słownik
« Odpowiedź #2 dnia: Październik 25, 2006, 17:22:00 »
Cytat: "piopawlu"
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.

Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)
dobry pomysł, aczkolwiek w SMS'ach mogą się zdarzyć słowa nie do końca poprawne (no chyba, że też były z jakimś słownikiem pisane).

Co do bazy, to nie wiem dlaczego ale czasem działa, a czasem nie. Mi np nie chciała działać po skompaktowaniu. Słownik oczywiście nie jest doskonały, a co do aspella, to jest on podzielony na 3 części. W podanym wyżej pliku zamieściłem wszystkie 3, ale można umieścić np tylko dwie części (jak ktoś ściągnie słownik do aspella, to mówię o plikach A, B i C).

Mimo wszystko, mi o wiele łatwiej się pisze w ten sposób.

TenGO - polski słownik
« Odpowiedź #3 dnia: Październik 29, 2006, 00:05:35 »
Dobra robota.

Dla tych ktorzy chcieliby moc zmieniac slownik np polski/angielski w trakcie pracy programu nalezy:

1) skopiowac podany plik do katalogu windows pod inna nazwa np tengo.db.polski
2) wpisac w rejestrze HKLM\Software\Xrgomics\TenGO\Dictionary
   klucz "Polski" o wartosci string: "tengo.db.polski" - bez cudzysłowów oczywiscie
3) Potem mozemy juz standardowo wybierac slownik podczas pracy z TenGO.

pzdr
W.

*

Offline piopawlu

  • **
  • 109
  • Płeć: Mężczyzna
    • piopawlu.net
  • Sprzęt: iPhone 3G, Nexus One
TenGO - polski słownik
« Odpowiedź #4 dnia: Listopad 02, 2006, 14:30:31 »
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.

Odp: TenGO - polski słownik
« Odpowiedź #5 dnia: Kwiecień 22, 2007, 19:43:33 »
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.

Nie ma to jak odkopać wątek, ale mam do Ciebie prośbę. Masz może przygotowany słownik z polskimi znakami diakrytycznymi? Mógłbyś go udostępnić?

*

Offline >>Devasto>>

  • ****
  • 543
  • Płeć: Mężczyzna
  • Sprzęt: I9000, Nexus7 3G
Odp: TenGO - polski słownik
« Odpowiedź #6 dnia: Kwiecień 22, 2007, 21:32:03 »
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Pozdr. Dev
Były MDA I, Dell X51v, MDA Pro, Palm TX, Samsung I600, Eclicto, Samsung I780, I5700, jest , I9000, PSP, ASUS eee 901, Kindle 3, Nexus7 3G

Odp: TenGO - polski słownik
« Odpowiedź #7 dnia: Kwiecień 22, 2007, 21:49:52 »
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P

*

Offline qrees

  • **
  • 133
  • Płeć: Mężczyzna
  • Sprzęt: HTC Desire
Odp: TenGO - polski słownik
« Odpowiedź #8 dnia: Kwiecień 23, 2007, 17:25:22 »
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P
podziel się z nami ;)

Odp: TenGO - polski słownik
« Odpowiedź #9 dnia: Kwiecień 23, 2007, 20:10:58 »
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.

Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P

Jest jeden minus, słownik niestety trochę urośnie :(

*

Offline qrees

  • **
  • 133
  • Płeć: Mężczyzna
  • Sprzęt: HTC Desire
Odp: TenGO - polski słownik
« Odpowiedź #10 dnia: Kwiecień 25, 2007, 13:21:50 »
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.

Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P

Jest jeden minus, słownik niestety trochę urośnie :(
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.

Odp: TenGO - polski słownik
« Odpowiedź #11 dnia: Kwiecień 25, 2007, 13:34:14 »
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.
Cała idea działania TenGo to to że nie masz olbrzymiej ilości klawiszy, tylko 6 i większość am załatwiać dobry słownik. Kończę właśnie budować słownik z OpenOffice, ale tylko na test, gdyż jest tam nadmiar słów, przez co TenGo nie będzie efektywne oraz rozmiar takiego słownika będzi olbrzymi. Tu pasowałby mi słownik na bazie rozmów z komunikatorów dzieki czemu słownik byłby pewnie wielkości 1-1,5MB.

*

Offline loos

  • **
  • 175
  • Płeć: Mężczyzna
  • Sprzęt: glofiish M800
Odp: TenGO - polski słownik
« Odpowiedź #12 dnia: Kwiecień 25, 2007, 17:03:52 »
witam.

a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ?  (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)

pzdr

Odp: TenGO - polski słownik
« Odpowiedź #13 dnia: Kwiecień 25, 2007, 17:17:47 »
witam.

a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ?  (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)

pzdr

Problemem by nie było :) Aktualnie robię test czy wszystko działa jak należy i zaraz pewnie zrobię edita i relase'a (jak będzie działał poprawnie).

------
EDIT

Słownik na bazie słownika OpenOffice działa i udostępniam go narazie tu: http://rapidshare.com/files/27867119/tengo.rar.

Plusy:
+ działa :)
+ są polskie znaki diakrytyczne,
+ olbrzymi słownik (ok 240-250tyś wpisów)

Minusy:
- rozmiar (~9MB)
- DUŻA część wpisów jest całkowicie bezsensowna :/ lub nie potrzebna
- nie było jak ułożyć wpisów względem częstości używania,
- ... cos tu miało jeszcze być ale zapomniałem :P


Tak więc jak ktoś kto używa polskich znaczków przy komunikatorach (gg, tlen, jaber i inne) ma duża bazę rozmów to nich się podzieli nią lub zrobi słownik do TenGO :P Między czasie spróbuję zobaczyć na swoją bazę rozmów z tlena, tyle że zwykle nie stosowałem polskich znaczków i jak będzie za dużo roboty to odpada :P
« Ostatnia zmiana: Kwiecień 25, 2007, 17:49:01 wysłana przez Sanjuro »

*

Offline Gorbo2004

  • *
  • 56
  • Płeć: Mężczyzna
  • Sprzęt: XDA Exec
Odp: TenGO - polski słownik
« Odpowiedź #14 dnia: Wrzesień 09, 2007, 02:58:18 »
A powie ktoś może  jak zainstalować to tengo  ? :-D

*

Offline kocurek

  • *
  • 66
  • Płeć: Mężczyzna
  • Sprzęt: Samsung Galaxy S2 + Nokia E71
Odp: TenGO - polski słownik
« Odpowiedź #15 dnia: Wrzesień 14, 2007, 22:32:20 »

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.

Nie bardzo działa mi ten plik .cab (ktoś wie jak to uruchamiać?)
Czy mógłbym prosić o plik .db tego słownika na maila - kocurek@post.pl - z góry dzięki.

Pozdrawiam
Moje poprzednie PDA:
HP iPAQ 4150 -> MDA Compact II -> HTC Touch Cruise -> HP iPAQ hx4700 -> HTC Athena X7500 -> DELL x51v -> HTC Touch HD -> Samsung Galaxy S2

Odp: TenGO - polski słownik
« Odpowiedź #16 dnia: Sierpień 18, 2008, 14:31:54 »
Sorry za odkopanie tematu, ale...
Zainstalowalem ostatnio Tengo dla testow. Swietna klawiatura ekranowa, 100 razy bardziej funkcjonalna od PCM Keyboard i nie sprawia u mnie problemow. Przetestowalem rowniez zamieszczony tutaj przez piopawlu polski slownik, ale mam jedno zastrzezenie. We wbudowanej angielskiej wersji slownika, jest mozliwosc wstawiania polskich znakow i nauki nowych slow z polskimi znakami poprzez skreslanie liter, np. skreslajac 's' jestesmy w stanie otrzymac 'ś' (oraz inne znaki specjalne) itd. Niestety po uaktywnieniu slownika polskiego i "przekreslaniu" liter, nie mozna juz takiego efektu uzyskac. Wiec moje pytanie jest nastepujace, czy jest mozliwosc uzupelnienia tegoz slownika o taka funkcjonalnosc. Byloby wtedy idealnie, no prawie, bo producent programu powinien sam wypuscic oficjalna polska wersje.

Pozdrawiam