Jak wspomniałem już wcześniej, celem badań fonetycznych jest analiza zjawisk znamiennych dla tekstów języka mówionego. Choć dostępne są one bezpośrednio, z istoty rzeczy mają przemijający charakter. Mowa rozwija się bowiem tylko w jednym wymiarze, a mianowicie jedynie na osi czasowej. Jest zatem nietrwała. Jednowymiarowe zjawiska mowy brzmiącej, dostępne dla badacza zasadniczo wyłącznie w określonym odcinku czasowym, stoją w opozycji do tekstów pisanych. Te z natury rzeczy mają przestrzennie dwuwymiarowy charakter, przez co fizycznie istnieją w sposób trwały.
Wykorzystanie różnych urządzeń technicznych — np. magnetofonu — pozwala utrwalać, a co za tym idzie, powielać poszczególne akty mowy. W postaci nagrań magnetofonowych stają się one doskonałym materiałem analizy. Nie są jednak dobrym środkiem utrwalania wyników obserwacji przeprowadzonych przez badaczy mowy ludzkiej. Z. Saloni zauważył, że „nasza cywilizacja jest w ogromnym stopniu pisana [...]. Ze względu na rozmaite uwarunkowania obiektywne i kulturowe najbardziej naturalną formą przechowywania i prezentowania wyników działalności intelektualnej jest tekst pisany” (Saloni 1991: 84). Nie powinien zatem dziwić fakt, że każda praca naukowa, a więc także z zakresu fonetyki i fonologii, jest właśnie tekstem pisanym (na temat graficyzmu zob. Weinsberg 1983: 137— 158). Językoznawcy, rozpatrując zjawiska głosowego komunikowania się, siłą rzeczy muszą zatem utrwalać wyniki analiz w postaci napisów. Obserwowane przez siebie zjawiska utrwalają natomiast w postaci graficznych ekwiwalentów. W swojej pracy zmuszeni są stosować system symboli będących graficzną reprezentacją tych zjawisk, które słuchowo można postrzegać w rzeczywistości.
Powstaje zatem swoisty paradoks. Pierwotną postać istnienia języka, czyli porozumiewanie się głosem fonetyk musi bowiem rejestrować za pomocą pisma, zajmującego w stosunku do opisywanej mowy wyraźnie wtórną pozycję. O prymacie języka mówionego świadczy fakt, że żaden spośród znanych systemów pisma nie ma historii dłuższej niż 6000—7000 lat, podczas gdy nawet w najbardziej odległych czasach nie istniała grupa ludzka pozbawiona umiejętności mówienia. Można przypuszczać, że mowa jest równie stara jak istnienie społeczeństw ludzkich. Pismo niewątpliwie powstało później. Przekonuje o tym obserwacja niektórych grup ludzkich, które — posługując się językiem w sferze brzmieniowej — pismo poznały dopiero w naszych czasach, np. za sprawą misjonarzy lub językoznawców.
Dowodem świadczącym o wtórności pisma względem mowy jest także fakt, że podstawą wszelkich znanych na świecie systemów pisma są określone jednostki języka mówionego, a mianowicie wyrazy, sylaby lub głoski. Wyróżnia się bowiem trzy następujące typy systemów graficznych:
1. Pismo ideograficzne —jego istota polega na tym, że znak pisany odpowiada określonemu pojęciu. Typowym przykładem są tu hieroglify czy powszechnie stosowane cyfry.
2. Pismo sylabiczne — czyli sylabariusz to taki system, w którym znakowi tekstu pisanego odpowiada sylaba. Taki charakter miało np. najstarsze znane pismo Greków, używane w III wieku przed naszą erą.
3. Pismo literowe — czyli alfabetyczne (alfabet) jest to system, którego znakom spośród wszystkich jednostek tekstu mówionego najściślej odpowiadają różne głoski (fonemy). Przykładami takich systemów są różne odmiany alfabetu łacińskiego, używane przez większość narodów europejskich (także i przez Polaków).
Poza tym istnieją systemy mieszane, np. ideograficzno-sylabiczne (np. pismo japońskie) lub sylabiczno-literowe (np. różne pisma hinduskie) (por. Weinsberg 1983: 40).
Można byłoby zatem przypuszczać, że opisywane przez nas teksty mówione będziemy graficznie utrwalać w wersji ortograficznej opartej na dobrze znanych nam znakach alfabetu. Przypuszczenia takie nie są jednak słuszne. Istnieje bowiem tylko nieliczna grupa wyrażeń, w których obserwujemy całkowitą zbieżność wymowy i pisowni. Oto przykłady takich jednostek, w których każda litera odpowiada jednej głosce i zarazem odzwierciedla wszystkie jej cechy artykulacyjne:
guma — 4 litery, 4 głoski — [guma]
sowa — 4 litery, 4 głoski — [sova]
zator — 5 liter, 5 głosek — [zator]
Jednakże w większości wypadków obserwujemy bądź to ilościowe, bądź lo jakościowe różnice między wymową jakiegoś tekstu a jego wersją ortograficzną. Oto najistotniejsze argumenty nakazujące odrzucić zapis ortograficzny i poszukiwać nieco innych sposobów graficznej ekwiwalentyzacji mowy:
1. W języku mówionym w ogóle nie znajduje odzwierciedlenia zróżnicowanie wielkości liter dyktowane przez jedną z konwencjonalnych zasad ortograficznych. Wyrażenia ula lub Ula w tekstach mówionych zawsze realizowane będą tak samo, a mianowicie jako ciąg trzech głosek [ula]. Dzieje się tak bez względu na to, czy uznamy je za nazwę własną, czy też zinterpretujemy je jako dopełniaczową formę pospolitego rzeczownika ul. Głoska [p] w zdaniu Pan Paweł przysłał pani Pelasi pudełko pralinek za każdym razem realizowana będzie w ten sam sposób, mimo że odpowiadają jej dwa różne znaki graficzne. Wielka litera — na początku zdania i w nazwach własnych, mała litera — w pozostałych wypadkach.
2. Przy jednakowej liczbie liter i głosek w wielu wypadkach obserwujemy lozbieżności polegające na tym, że litery nie odzwierciedlają cech poszczególnych głosek, por.:
19