Частотні словники

Історія укладання частотних словників не налічує і століття, але за цей час їх видано понад 500 більш як для сорока мов (майже для всіх індоєвропейських, а також для мов інших сімей). Виникла нова галузь лексикографія - статистична лексикографія. В україністиці вже укладені:

- Частотний словник художньої прози;

- Частотний словник сучасної поетичної мов;

- Частотний словник публіцистики.

Інтерес до статистичного обстеження великих сукупностей текстів зумовлюється, з одного боку необхідністю глибше пізнати закономірності функціонування мовних одиниць у тексті. З другого боку, статистична лексикографія викликана до життя потребами суспільства, практичними застосуваннями надбань мовознавства. Використання частотних словників може бути різноманітним та ефективним, якщо знати певні статистичні правила і закони, нескладні й цілком доступні тим, хто не має вищої математичної освіти.

Частотний словник можна використати і для відбору лексичного мінімуму при вивченні даної мови як іноземної, і для стилістичних студій, і для атрибуції не підписаних рукописів, і для автоматичного опрацювання текстової інформації.

Вашій увазі пропонуються такі частотні словники:

Кожний частотний словник вносить щось нове у статистичну лексикографію:

· одиниці підрахунку - словоформи та лексеми;

· обсяг вибірки: в частотному словнику сучасної української художньої прози - 500 000 словоживань

- в частотному словнику сучасної української поетичної мови - 300 000 слововживань.

- в частотному словнику сучасної української публіцистики - 300 000 слововживань

· обсяг словника - повний список усіх одиниць підрахунку, що зустрілися у вибірці;

· характер вибірки кожного словника визначається хронологічними та жанрово-тематичною приналежністю;

· характер подачі матеріалу в усіх частотних словниках - алфавітно-частотний (звичайний та інверсійний). У частотному словнику поетичного мовлення, крім інтегрованого, представлені 15 авторських словників;

· статистичні характеристики ( у словниках публіцистики та поетичного мовлення вони однакові):

- абсолютна частота;

- середня частота;

- міра коливання середньої частоти;

- коефіцієнт стабільності.

у художньому словнику художньої прози представлено:

- абсолютна частота вживання у прямій мові;

- абсолютна частота вживання в авторські мові;

- кількість підвибірок, у яких зустрілося дане слово/словоформа (максимальна кількість - 500)

- кількість джерел, у яких зустрічається слово/словоформа (максимальна кількість - 25)

- Середнє квадратичне відхилення середньої частоти.