Skip to content

akalandiya/mod-lab05-gen

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

МИПиС

mod-lab05-gen

GitHub pull requests GitHub closed pull requests

Срок выполнения задания:

до 17.04.22 Relative date

Lab 05. Генератор текста на основе n-грамм

В данной работе нужно разработать три класса, каждый из которых представляет собой генератор текста, работающий по определенному алгоритму. Входные данные для алгоритмов скачиваются по адресам, указанным в задании.

Метод Main должен последовательно вызывать методы генерации из 3-х классов и создавать 3 выходных файла с текстом, объемом не менее 1000 единиц. Эти файлы прикладываются к заданию.

Задача №1

Разработать генератор текста на основе пар букв (биграмм). Используются вероятностные свойства сочетаний пар символов.

Данные по биграммам можно взять отсюда: http://statistica.ru/local-portals/data-mining/analiz-tekstov/

Они представлены в виде таблицы и сведены к весам, что облегчает обработку для случайного генерирования.

Задача №2

Разработать генератор текста на основе частотных свойств слов

Данные о частотах (топ-100) можно взять отсюда:

https://ruscorpora.ru/new/1grams.top.html

Задача №3

Разработать генератор текста на основе частотных свойств пар слов

Данные о частотах (топ-100) можно взять отсюда:

https://ruscorpora.ru/new/2grams.top.html

Задача №4 (Тестирование)

  • Добавить в решение .NET проект с тестами (за основу взять пример из mod-lab02-fa-csharp)
  • Разработать не менее 6 тестов (чем больше, тем лучше)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages