Tabela zawiera statystyki wyliczone na podstawie bazy prawie 3 milionów wyrazów i ich odmian używanych w języku polskim. Częstość występowania uwzględnia małą i dużą wersję litery.
Przedstawiamy ją jako swoistą ciekawostkę. Dla każdego języka tego typu statystyki będą zupełnie inne. Z tego względu, na podstawie częstości występowania liter można łamać proste szyfry lub identyfikować język.
litera | ilość wyrazów na literę | częstość występowania | |
---|---|---|---|
a | 60213 | 2.23% | 10.01% |
b | 68560 | 2.54% | 1.54% |
c | 57715 | 2.13% | 3.81% |
ć | 1422 | 0.05% | 1.50% |
d | 105447 | 3.90% | 2.47% |
e | 28633 | 1.06% | 6.18% |
ę | 1 | 0.00% | 0.40% |
f | 36282 | 1.34% | 0.71% |
g | 46087 | 1.70% | 1.45% |
h | 27651 | 1.02% | 0.95% |
i | 23807 | 0.88% | 7.68% |
j | 17296 | 0.64% | 1.41% |
k | 122661 | 4.54% | 4.90% |
l | 32023 | 1.18% | 3.08% |
ł | 11254 | 0.42% | 1.03% |
litera | ilość wyrazów na literę | częstość występowania | |
---|---|---|---|
m | 78293 | 2.90% | 2.36% |
n | 610123 | 22.57% | 6.00% |
o | 162945 | 6.03% | 8.91% |
ó | 88 | 0.00% | 0.46% |
p | 395799 | 14.64% | 2.82% |
r | 107706 | 3.98% | 5.74% |
s | 163836 | 6.06% | 4.55% |
ś | 13411 | 0.50% | 0.60% |
t | 60511 | 2.24% | 4.25% |
u | 75215 | 2.78% | 2.17% |
w | 196543 | 7.27% | 4.56% |
y | 191 | 0.01% | 4.52% |
z | 189030 | 6.99% | 4.77% |
ź | 593 | 0.02% | 0.06% |
ż | 10072 | 0.37% | 0.41% |