08.01.2008
Wykład 12
Badania statystyczne i ich możliwości
Statystyka języka
(informacyjność)
Ile pytań trzeba zadać, by odgadnąć, jaka litera zostanie zaraz zapisana?
5
Polak jest w stanie domyślić się, jakie słowo zostało zapisane, kiedy pozbawimy je samogłosek.
Statystyczne występowanie poszczególnych części mowy w zdaniu
Rzeczownik – przymiotniki – czasowniki – zaimki (tekst pisany)
Czasowniki – zaimki – rzeczowniki – przymiotniki (tekst mówiony)
Liczebność składników zdania:
Zdania pojedyńcze,5-6 wyrazów, niewiele czasowników (dziś)
Zdania wielokrotnie złożone, bardzo duże stężenie czasowników(niegdyś)
Liczebność wyrazów:
Trudno ocenić, od 150, do 250 tysięcy jednostek wyrazowych
Wykształcony człowiek zna i potrafi używać około 20 tysięcy, a rozumie znaczenie 50 tys. Tumokowi wystarcza znajomość 10 tys. słów i umiejętność użycia 1 tys.
Lista rangowa (najczęściej używane wyrazy w języku polskim)
1. W
2. I
3. być
4. sie
6. ma
7. Nie
8. On
9. To
10. Że
Stopień oryginalności tekstu:
Stopień stereotypowości
Bogactwo synonimów
Średnia długość zdania
Stopień trudności tekstu
Język stenograficzny