Форма для генерации N-грамм
Форма N-граммы предназначена для быстрого анализа текстовых данных на листе Excel и создания частотных списков словосочетаний (N-грамм) различной длины. Это полезно для SEO-анализа, поиска популярных фраз и оптимизации контента.
- Выбор столбца с текстом: В верхней части формы выберите букву столбца, в котором находятся ваши фразы или ключевые слова (например, A).
-
Тип N-грамм: Во втором выпадающем списке выберите, какие N-граммы вы хотите получить:
- Униграммы — отдельные слова
- Биграммы — сочетания из двух слов
- Триграммы — сочетания из трёх слов
- Четырёхграмма — из четырёх слов
- Пятиграмма — из пяти слов
- Все вместе — сразу все варианты
- Взвешивание по частоте: Можно указать дополнительный столбец с частотами (например, если у вас есть данные о количестве показов или поисковых запросов). Если не нужно учитывать частоту — выберите «Не использовать».
- Удаление предлогов и союзов: Можно включить опцию, чтобы из анализа исключались самые частые служебные слова (например, «и», «в», «на», «of», «and» и т.д.), чтобы результат был более чистым.
- Лемматизация: При включении этой опции слова будут приводиться к начальной форме (например, «купить», «купил», «куплю» будут считаться одним словом). Это помогает объединять похожие фразы.
- Тип N-грамм: Можно выбрать, анализировать ли только последовательные слова (например, «купить телефон») или любые сочетания слов из фразы.
- Запуск анализа: После настройки параметров нажмите кнопку «Старт». Программа создаст новый лист в вашей книге Excel, где будут перечислены все найденные N-граммы, их частота и дополнительная информация.
- Статистика: После завершения работы появится окно с краткой статистикой по найденным N-граммам.
Важно: Все сообщения и подсказки в форме отображаются на русском языке. Форма автоматически учитывает занятость Excel и не допускает сбоев при работе с большими объёмами данных.






















