#1 20.07.06 08:27
[Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов
Xalyava over
Студенты больше не смогут качать рефераты и дипломы из интернета.
В Рунете теперь можно проверить подлинность реферата/статьи/ чего угодно еще с помощью уникальной разработки российских ученых. Сайт АнтиПлагиат.ру появился при поддержке Министерства образования и Мининформсвязи. Его появление обусловлено перспективой всеобщей информатизации — подключения всех российских школ к сети интернет.
Уже сейчас многие ученики и студенты охотно пользуются Сетью — скачивают рефераты, доклады, курсовые, дипломные… А определить подлинность этих работ чрезвычайно сложно, особенно если ученик не просто скопировал нужный документ, а подошел к делу творчески: составил работу из кусков разных рефератов по заданной теме.
Теперь проверить документ на «эксклюзивность» станет просто. Достаточно загрузить студенческую работу на сайт — и программа в течение нескольких секунд покажет информацию о степени оригинальности ученика и документа. База данных АнтиПлагиата постоянно обновляется. Робот ежедневно находит кандидатов на цитирование в Рунете и добавляет в свой список. Поэтому нежелающим писать самостоятельно теперь придется потрудиться. Или воспользоваться не общедоступными источниками Рунета. Или скачать нужную работу с сайтов других стран, а потом перевести на русский…
Создатели АнтиПлагиата говорят, что руководствовались благими побуждениями: «Нашлась группа инициаторов, которые захотели помочь российскому образованию».
Этот проект уже был опробован в Московском институте экономики, менеджмента и права (МИЭМП). В результате многим студентам пришлось переделывать свои курсовые. А половину будущих экономистов вынудили переписывать дипломные работы — в них выявили слишком большой процент интернет-материалов. Проректор по учебно-методической работе МИЭМПа Олег Орчаков говорит, что сначала студенты не оценили разработки российских программистов — и на почве АнтиПлагиата возникали мелкие конфликты. Но резвость студентов заметно поубавилась, когда им стали предоставлять доказательства. Конфликты уладились, «студенты привыкли». В будущем руководство МИЭМПа планирует проверять все письменные работы. Скоро АнтиПлагиатом вооружатся и другие вузы страны.
Ирина Бойцова
19.07.2006
© Новая газета
Offline
#6 20.07.06 18:30
Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов
Да уж, бредятина полнейшая. Если чел сам делал реферат "А" и пользовался определенной литературой (брал куски из книжек), то высока вероятность, что кто-либо также пользовался той же самой литературой (так же дергал куски из книжек) для составления реферата "Б", и реферат "Б" выложен в инете, то получится типо плагиат... Обидно, блин. Дурная система.
Исправлено Bream (20.07.06 18:31)
Offline
#7 20.07.06 19:23
Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов
Bream,когда дёргают куски из текста то пишут исходник.
а вообще :
Шинглы - алгоритм шинглов (shingles) - обнаружение нечетких копий и дубликатов текстов (шингл - чешуйка)
Илья Сегалович из Яндекса о шинглах (отрывок из статьи)
Рост базы, кроме технических проблем с дисками и серверами, ограничивается логическими: необходимостью адекватно реагировать на мусор, повторы и т.п. Не могу удержаться, чтобы не описать остроумный алгоритм, применяемый в современных поисковых системах для того, чтобы исключить «очень похожие документы».
Происхождение копий документов в Интернете может быть различным. Один и тот же документ на одном и том же сервере может отличаться по техническим причинам: быть представлен в разных кодировках и форматах; может содержать переменные вставки – рекламу или текущую дату.
Широкий класс документов в вебе активно копируется и редактируется – ленты новостных агентств, документация и юридические документы, прейскуранты магазинов, ответы на часто задаваемые вопросы и т.д. Популярные типы изменений: корректура, реорганизация, ревизия, реферирование, раскрытие темы и т.д. Наконец, публикации могут быть скопированы с нарушением авторских прав и изменены злонамеренно с целью затруднить их обнаружение.
Кроме того, индексация поисковыми машинами страниц, генерируемых из баз данных, порождает еще один распространенных класс внешне мало отличающихся документов: анкеты, форумы, страницы товаров в электронных магазинах
Очевидно, что с полными повторами проблем особых нет, достаточно сохранять в индексе контрольную сумму текста и игнорировать все остальные тексты с такой же контрольной суммой. Однако этот метод не работает для выявления хотя бы чуть-чуть измененных документов.
Для решения этой задачи Udi Manber (Уди Манбер) (автор известной программы приближенного прямого поиска agrep) в 1994 году предложил идею [manber1994], а Andrei Broder (Андрей Бродер) в 1997 [broder] придумал название и довел до ума алгоритм «шинглов» (от слова shingles, «черепички, чешуйки»). Вот его примерное описание.
Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!
Очевидно, что так можно определять процент перекрытия текстов, выявлять все его источники и т.п. Этот изящный алгоритм воплотил давнюю мечту доцентов: отныне мучительный вопрос «у кого студент списывал этот курсовик» можно считать решенным! Легко оценить долю плагиата в любой статье.
Чтобы у читателя не создалось впечатление, что информационный поиск исключительно западная наука, упомяну про альтернативный алгоритм определения почти-дубликатов, придуманый и воплощенный у нас в Яндексе [ilyinsky]. В нем используется тот факт, что большинство поисковых систем уже обладают индексом в виде инвертировнного файла (или инвертировнным индексом) и этот факт удобно использовать в процедуре нахождения почти-дубликатов.
Offline

