Frekwencja liter

Tabela zawiera statystyki wyliczone na podstawie bazy prawie 3 milionów wyrazów i ich odmian używanych w języku polskim. Częstość występowania uwzględnia małą i dużą wersję litery.

Przedstawiamy ją jako swoistą ciekawostkę. Dla każdego języka tego typu statystyki będą zupełnie inne. Z tego względu, na podstawie częstości występowania liter można łamać proste szyfry lub identyfikować język.

 

litera ilość wyrazów na literę częstość występowania
a 60213 2.23% 10.01%
b 68560 2.54% 1.54%
c 57715 2.13% 3.81%
ć 1422 0.05% 1.50%
d 105447 3.90% 2.47%
e 28633 1.06% 6.18%
ę 1 0.00% 0.40%
f 36282 1.34% 0.71%
g 46087 1.70% 1.45%
h 27651 1.02% 0.95%
i 23807 0.88% 7.68%
j 17296 0.64% 1.41%
k 122661 4.54% 4.90%
l 32023 1.18% 3.08%
ł 11254 0.42% 1.03%
litera ilość wyrazów na literę częstość występowania
m 78293 2.90% 2.36%
n 610123 22.57% 6.00%
o 162945 6.03% 8.91%
ó 88 0.00% 0.46%
p 395799 14.64% 2.82%
r 107706 3.98% 5.74%
s 163836 6.06% 4.55%
ś 13411 0.50% 0.60%
t 60511 2.24% 4.25%
u 75215 2.78% 2.17%
w 196543 7.27% 4.56%
y 191 0.01% 4.52%
z 189030 6.99% 4.77%
ź 593 0.02% 0.06%
ż 10072 0.37% 0.41%