Forum POLSZCZYZNA Strona Główna  Forum POLSZCZYZNA Strona Główna  
  POLSZCZYZNA
FAQ  FAQ   Szukaj  Szukaj   Użytkownicy  Użytkownicy   Grupy  Grupy  Galerie  Galerie
 
Rejestracja  ::  Zaloguj Zaloguj się, by sprawdzić wiadomości
 
Forum POLSZCZYZNA Strona Główna->KTO PYTA NIE WIELBŁĄDZI->fonemy języka polskiego

Napisz nowy tematOdpowiedz do tematu
fonemy języka polskiego <-Zobacz poprzedni temat :: Zobacz następny temat->
Autor Wiadomość
johnyjj2
PostWysłany: Sob 17:18, 14 Lis 2009 Temat postu: fonemy języka polskiego




Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów


Witam!

Potrzebna jest mi wiedza dotycząca fonemów występujących w języku polskim. Otóż pracuję nad pewnym projektem informatycznym związanym z rozpoznawaniem mowy. Na stronie VoxForge są darmowe modele akustyczne dla kilku języków, m.in. angielskiego, hiszpańskiego, włoskiego, ale nie ma języka polskiego, stąd też zamierzam wspomóc ten projekt Smile.

Chciałbym stworzyć listę fonemów podobną do tej ht [link widoczny dla zalogowanych] w.speech.cs.cmu.edu/cgi-bin/cmudict . Pewna osoba zasugerowała mi książkę Wiśniewskiego "Fonetyka i fonologia", do której jednak nie mam dostępu. Muszę przygotować słownik języka polskiego, w którym dostępne będą wyrazy na dwa sposoby - ich zwykły zapis oraz fonetyczna wymowa, przy użyciu listy fonemów, którą zamierzam wykonać. Stąd też byłbym wdzięczny, jeśli może mi ktoś pomóc ze stworzeniem takiej listy fonemów i wskazaniem elektronicznej wersji słownika j. polskiego z zapisem fonetycznym.

Tak sobie myślę, że mając słownik z rozpisem słów w IPA oraz tabelkę, w której bym porównał moją listę fonemów z listą IPA (ht [link widoczny dla zalogowanych] rg/wiki/Wikipedia:IPA_for_Polish), nie byłoby większych problemów ze stworzeniem takiego modelu akustycznego. Może taką listę fonemów dałoby się stworzyć najzwyczajniej w świecie, wymyślając dwuliterowe skróty (składające się tylko z liter alfabetu łacińskiego) dla znaczków IPA. Niemniej konieczny byłby wtedy słownik z wymową fonetyczną, stąd też proszę o wskazanie mi takiego, najlepiej w wersji elektronicznej.

Pewna osoba zasugerowała mi pomoc w stworzeniu takiego modelu dla j. polskiego i zadała mi pytanie "które fonemy eSpeak odpowiadają polskim fonemom IPA?". Nie do końca zrozumiałem, o co tej osobie chodzi. Swoje pytanie zawarłem tutaj: ht tps:/ /sourceforge.n et/projects/espeak/forums/forum/538922/topic/3458345 .

Podsumowując, przede wszystkim potrzebuję elektroniczną wersję słownika j. polskiego z zapisem fonetycznym słów, na drugim zaś miejscu pomocy w stworzeniu listy fonemów lub sugestii (np. czy dobrym pomysłem jest po prostu wykorzystać IPA, zamieniając nazwy skrótów).

Pozdrawiam!

PS We wszystkich adresach należy usunąć spacje.


Post został pochwalony 0 razy
Powrót do góry
Zobacz profil autora
Karen
PostWysłany: Czw 16:15, 19 Lis 2009 Temat postu:




Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów

Pomógł: 12 razy

johnyjj2,

listę fonemów języka polskiego znajdziesz w wikipedii pod hasłem "Fonetyka języka polskiego". Są tam też ciekawe podnośniki do poszczególnych głosek, w tym także odwołania do podobnie brzmiących głosek w innych językach. Szukać możesz także w każdej książce do gramatyki opisowej języka polskiego.

Co do CMU Pronouncing Dictionary, to zwróć uwagę, że jest to słownik na bazie języka angielskiego: czy tworząc polską listę również oprzesz się na nim? ciekawie to będzie wyglądać. Pozostałabym przy IPA (w końcu po to go opracowano).

Inicjatywa ciekawa, powodzenia!


Post został pochwalony 1 raz
Powrót do góry
Zobacz profil autora
johnyjj2
PostWysłany: Nie 22:26, 20 Gru 2009 Temat postu:




Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów


Dzięki za odpowiedź!

Czy są jakieś słowniki (najlepiej w wersji elektronicznej), które zawierają listę wszystkich słów wraz z ich zapisem fonetycznym IPA? Tylko niewielka grupa słow jest dostępna wraz z transkrypcją na wikisłowniku (wikidictionary).

Tak wygląda moja lista IPA (na wikipedii nie znalazłem kompletnego wykazu fonemów, informacje były porozrzucane po całym artykule): ht tp:/ /images40.fotosik.p l/236/3e440e25ee439bcd.jpg . Ponieważ transkrypcje zapisuję w pliku tekstowym, byłem zmuszony zamienić znaki IPA na jedno- lub dwuliterowe skróty.

Czy mógłbym prosić o zapisanie mi przy pomocy IPA pewnej listy słów? Niestety, nie jest to takie proste, jak najzwyczajniej przepisanie liter bądź dźwięków zapisywanych dwiema literami, za to w innej formie. Trochę bardziej skomplikowanie wygląda tworzenie zapisu IPA, niż zwykłe odwzorowanie jeden do jednego. (Choć i tak dla j. polskiego jest to dużo prostsze, niż np. dla j. angielskiego, w którym większość wyrazów czyta się inaczej, niż pisze).

Lista słów jest następująca: pomoc nastepna szczegoly okej pomin koniec podstawowy rozszerzony wyslij potwierdzam blad pomylka zle gliwice katowice wroclaw pyskowice wróć pierwsza druga trzecia czwarta piata szosta siodma osma dziewiata ostatnia poczatkowa srodkowa bocznica kolejowa cofnij ponow zapisz wczytaj rozpoznaj szukaj zamknij pomocnicze nagraj odtworz przeskocz nierozpoznana dodatkowa seria wagonow numery ilosc osi ladowanych proznych obliczen tony waga ładunku ogolny ciezar rzeczywisty hamowania stacja nadania przeznaczenia skrot dyrektora wezla uwagi.

Moja dotychczasowa lista wygląda tak:

ZERO Z E R O
JEDEN J E D E N
DWA D W A
TRZY T SZ Y
CZTERY CZ T E R Y
CZTERY(2) T SZ T E R Y
PIEC P J EE NG CI
SZESC SZ E SI CI
SZESC(2) SZ E SI T SI
SIEDEM SI E D E M
OSIEM O SI E M
DZIEWIEC D ZI E W J EE NG CI
TAK T A K
NIE NG E
KONIEC K O NG E C
DALEJ D A L E J
POMYLKA P O M Y LY K A

Z góry dziękuję!
Pozdrawiam!

PS Proszę usunąć spacje w linku do strony fotosik.pl.


Post został pochwalony 0 razy

Ostatnio zmieniony przez johnyjj2 dnia Śro 4:19, 30 Gru 2009, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Karen
PostWysłany: Wto 13:53, 29 Gru 2009 Temat postu:




Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów

Pomógł: 12 razy

johnyjj2, mieszasz systemy językowe; IPA jest pewnym międzynarodowym uśrednieniem dźwięków, które pozwala zapisać wszystkie głoski; IPA to alfabet, jeśli zmieniasz to na litery alfabetu łacińskiego, to nie jest to już IPA.
Ponadto Twoje propozycje opierają się na różnych systemach:
jeżeli zapisujesz "trzy" jako "tszy", wyrażasz tylko tzw. ubezdźwięcznienie, które występuje w "rz" pod wpływem t; poza Polakiem nikt tego nie zrozumie, ponieważ "sz" występuje jako zapis głoski [sz] tylko w naszym języku.
A zapis "ng" jako "ń" - nie wiem, czy to zrozumiałe.


Post został pochwalony 0 razy
Powrót do góry
Zobacz profil autora
johnyjj2
PostWysłany: Śro 4:13, 30 Gru 2009 Temat postu:




Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów


Witam!

Rzecz jest prosta, wystarczy rzucić okiem tutaj: ht tp:/ /images40.fotosik.p l/236/3e440e25ee439bcd.jpg (proszę usunąć spacje). Żeby jednak nie było niejasności, wyjaśnię to trochę dokładniej:

Otóż rzecz wygląda tak, że w pliku tekstowym (txt, tworzony w notatniku) nie zapiszę wszystkich znaków używanych w IPA, właściwie to większości z nich nie zapiszę, jeśli chcę używać standardowego kodowania znaków. Problemy z kodowaniem znaków pojawiają się czasem już z polskimi literami (ąęłó itd.). Problemów z kodowaniem w plikach uniknąć da się w najprostszy sposób - używając jedynie liter z j. angielskiego.

Ja bym się upierał, że jednak to jest IPA. Najzwyklejsze odwzorowanie jeden do jednego. Jeden konkretny znak IPA - jeden konkretny skrót jedno- lub dwuliterowy, zapisany alfabetem łacińskim. Mając takie odwzorowanie jeden do jednego dla każdego ze znaków IPA, który występuje w j. polskim, mogę zapisać co chcę w IPA. Mając długi fragment tekstu zapisany przy pomocy IPA, mogę każdy symbol IPA zamienić na swój łaciński skrót danego symbolu IPA. Czyli mam teraz długi fragment tekstu zapisany przy pomocy pseudo-IPA (mojego odwzorowania IPA jeden do jednego, przy pomocy tylko liter alfabetu łacińskiego, bez użycia symboli IPA). Mogę teraz zrobić procedurę odwrotną - każdy symbol pseudo-IPA zamienić na znaki IPA. I co otrzymam? Dokładnie to samo, co było na początku, ponieważ - jak już wspomniałem - odwzorowanie jest jeden do jednego. Żadnych informacji nie tracę, więc jednak jest to IPA, tylko zapisane w dziwny sposób, żeby uniknąć problemów z kodowaniem niestandardowych znaków w pliku tekstowym.

No a skąd wziąłem tszy zamiast trzy? Otóz sprawdziłem sobie na wikisłowniku (wikidictionary) jaki jest zapis IPA dla wyrazu trzy. Zapis ten składał się z trzech symboli IPA. Teraz użyłem swojego odwzorowania IPA, czyli każdy z tych trzech symboli zamieniłem na równoważny dla nich skrót jedno- lub dwuliterowy. Innymi słowy "sz" oznacza ten symbol IPA, który sobie akurat tak, a nie inaczej zapisałem (co można zobaczyć w pliku jpg, do którego link dałem na górze).

Co do ubezdźwięcznienia, to nie będę wnikał w to, kto zapisał "trzy" w taki, a nie inny sposób na wikisłowniku. Widocznie ten ktoś, kto zapewne był polonistą lub hobbystycznie zajmował się j. polskim, stwierdził, że jednak w języku mówionym nadspodziewanie często się to całe rz zmiękcza i wychodzi sz. Czy miał rację, czy nie, to tego już nie wiem. Próbuję sobie wymówić słowo "trzy" i jednak trochę sztucznie to brzmi, gdy próbuję na siłę "rz". Częściej wychodzi "sz". Tak jak wspomniałem, jest to bardziej pytanie, czy na wikisłowniku ktoś prawidłowo napisał wymowę słowa "trzy" przy pomocy IPA, a nie żadnych moich zabiegów.

No a problem pojawił się wtedy, gdy zdałem sobie sprawę, że bardzo niewiele wyrazów jest zapisanych przy pomocy IPA na wikisłowniku. Innymi słowy, mając zapis IPA dla tych wyrazów, dalej sobie samemu poradzę.

Z góry dzięki za pomoc,
pozdrawiam!


Post został pochwalony 0 razy

Ostatnio zmieniony przez johnyjj2 dnia Śro 4:18, 30 Gru 2009, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Karen
PostWysłany: Śro 9:40, 30 Gru 2009 Temat postu:




Dołączył: 14 Lut 2008
Posty: 225
Przeczytał: 0 tematów

Pomógł: 12 razy

Cóż, nie do końca rozumiem, w jaki sposób funkcjonuje kodowanie mowy, o którym tu mówisz. Mimo to upieram się, że Twoje "symbole" nie są International Phonetic Alphabet, ponieważ symbole te nie są takimi, jakie występują w IPA.
Ponadto, Twoje symbole mogą być niezrozumiałe dla użytkownika nie-Polaka lub nie-polonisty, więc nie spełniają podstawowego zadania, jakie ma IPA, a więc bycie dostępnym i zrozumiałym także dla uczących się języka.
Stworzyłeś własne przyporządkowanie głosek i symboli, na potrzeby pewnego oprogramowania. Nie nazywaj tego IPA.


Post został pochwalony 0 razy
Powrót do góry
Zobacz profil autora
johnyjj2
PostWysłany: Nie 16:18, 03 Sty 2010 Temat postu:




Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów


Koniec końców to żadna różnica jak nazwiemy to kodowanie, IPA czy nie IPA. Kwestia jest taka, że aby system działał potrzebuję znaleźć IPA dla tej grupy wyrazów, którą podałem na początku, a nigdzie znaleźć nie jestem w stanie. Wikisłownik nie posiada większości słów, a dostępu do biblioteki z filologii polskiej nie mam.

Pozdrawiam i szczęśliwego Nowego Roku Smile!


Post został pochwalony 0 razy
Powrót do góry
Zobacz profil autora
johnyjj2
PostWysłany: Sob 15:41, 16 Sty 2010 Temat postu:




Dołączył: 13 Lis 2009
Posty: 5
Przeczytał: 0 tematów


Witam!
Mogę poprosić pewną osobę, żeby mi znalazła taki słownik zawierający zapis IPA dla wszystkich słów w Bibliotece Śląskiej lub bibliotece Uniwersytetu Śląskiego. Rzecz w tym, że ta osoba prosi mnie o konkretny tytuł książki. Czy możesz, Karen, podać mi tytuł i autora słownika, w którym będę w stanie znaleźć zapis IPA dla tej listy słów ("pomoc nastepna szczegoly"...)? Te biblioteki zapewne mają elektroniczny katalog.
Pozdrawiam!


Post został pochwalony 0 razy
Powrót do góry
Zobacz profil autora
Wyświetl posty z ostatnich:
Napisz nowy tematOdpowiedz do tematu Strona 1 z 1

Forum POLSZCZYZNA Strona Główna->KTO PYTA NIE WIELBŁĄDZI->fonemy języka polskiego
Skocz do:  



Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
 
 


fora.pl - załóż własne forum dyskusyjne za darmo
DAJ Glass (1.0.5) template by Dustin Baccetti
EQ graphic based off of a design from www.freeclipart.nu
Powered by phpBB Š 2001, 2002 phpBB Group