Система проверки на плагиат "Plagiarism Detection".
Цель системы: нахождение процентого количества плагиата в тексте в сравнении с другими документами, находящимся в локальной (внутренней) базе данных.
Подробнее на вики проекта - https://github.com/alexandrmazur96/PlagiarismDetection/wiki
What todo?
- Возможность проверять файлы отличные от .doc & .docx
- Больше заполнить/улучшить словари стоп-слов
- Возможность вывода на печать результатов
- Возможность изменять время проверки на наличие непроверенных документов
- Возможность выбора "сохранять ли документ в БД?" после успешной проверки его на плагиат
- Возможность добавить удаленный репозиторий с данными (например по ftp-протоколу)
- Улучшить интерфейс системы