Список

St · 20.07.06 08:27

Xalyava over
Студенты больше не смогут качать рефераты и дипломы из интернета.

В Рунете теперь можно проверить подлинность реферата/статьи/ чего угодно еще с помощью уникальной разработки российских ученых. Сайт АнтиПлагиат.ру появился при поддержке Министерства образования и Мининформсвязи. Его появление обусловлено перспективой всеобщей информатизации — подключения всех российских школ к сети интернет.

Уже сейчас многие ученики и студенты охотно пользуются Сетью — скачивают рефераты, доклады, курсовые, дипломные… А определить подлинность этих работ чрезвычайно сложно, особенно если ученик не просто скопировал нужный документ, а подошел к делу творчески: составил работу из кусков разных рефератов по заданной теме.

Теперь проверить документ на «эксклюзивность» станет просто. Достаточно загрузить студенческую работу на сайт — и программа в течение нескольких секунд покажет информацию о степени оригинальности ученика и документа. База данных АнтиПлагиата постоянно обновляется. Робот ежедневно находит кандидатов на цитирование в Рунете и добавляет в свой список. Поэтому нежелающим писать самостоятельно теперь придется потрудиться. Или воспользоваться не общедоступными источниками Рунета. Или скачать нужную работу с сайтов других стран, а потом перевести на русский…

Создатели АнтиПлагиата говорят, что руководствовались благими побуждениями: «Нашлась группа инициаторов, которые захотели помочь российскому образованию».

Этот проект уже был опробован в Московском институте экономики, менеджмента и права (МИЭМП). В результате многим студентам пришлось переделывать свои курсовые. А половину будущих экономистов вынудили переписывать дипломные работы — в них выявили слишком большой процент интернет-материалов. Проректор по учебно-методической работе МИЭМПа Олег Орчаков говорит, что сначала студенты не оценили разработки российских программистов — и на почве АнтиПлагиата возникали мелкие конфликты. Но резвость студентов заметно поубавилась, когда им стали предоставлять доказательства. Конфликты уладились, «студенты привыкли». В будущем руководство МИЭМПа планирует проверять все письменные работы. Скоро АнтиПлагиатом вооружатся и другие вузы страны.

Ирина Бойцова

19.07.2006

© Новая газета

Дым · 20.07.06 11:02

то есть преподам придется сканить или набирать текст раферата и загружать его...
хе-хе повезло нам, тем кто учился в пору, когда инет для препода был просто-таки сумраком...

Дым · 20.07.06 11:14

проверил пару рефератов, что помог сделать брату
у обоих 99% оригинального текста )))))) хотя я только ощибки исправил и слова поменял чуть-чуть....
НЕ РАБОТАЕТ

iDrum · 20.07.06 13:40

просто в базу первоисточники не попали пока...но если там технлогия "черепиц", обмануть такую систему можно будет "синонимизируя" текст

-=X=- · 20.07.06 18:08

Да бред всяко.

Bream · 20.07.06 18:30

Да уж, бредятина полнейшая. Если чел сам делал реферат "А" и пользовался определенной литературой (брал куски из книжек), то высока вероятность, что кто-либо также пользовался той же самой литературой (так же дергал куски из книжек) для составления реферата "Б", и реферат "Б" выложен в инете, то получится типо плагиат... Обидно, блин. Дурная система.

Исправлено Bream (20.07.06 18:31)

iDrum · 20.07.06 19:23

Bream,когда дёргают куски из текста то пишут исходник.
а вообще :
Шинглы - алгоритм шинглов (shingles) - обнаружение нечетких копий и дубликатов текстов (шингл - чешуйка)

Илья Сегалович из Яндекса о шинглах (отрывок из статьи)

Рост базы, кроме технических проблем с дисками и серверами, ограничивается логическими: необходимостью адекватно реагировать на мусор, повторы и т.п. Не могу удержаться, чтобы не описать остроумный алгоритм, применяемый в современных поисковых системах для того, чтобы исключить «очень похожие документы».

Происхождение копий документов в Интернете может быть различным. Один и тот же документ на одном и том же сервере может отличаться по техническим причинам: быть представлен в разных кодировках и форматах; может содержать переменные вставки – рекламу или текущую дату.

Широкий класс документов в вебе активно копируется и редактируется – ленты новостных агентств, документация и юридические документы, прейскуранты магазинов, ответы на часто задаваемые вопросы и т.д. Популярные типы изменений: корректура, реорганизация, ревизия, реферирование, раскрытие темы и т.д. Наконец, публикации могут быть скопированы с нарушением авторских прав и изменены злонамеренно с целью затруднить их обнаружение.

Кроме того, индексация поисковыми машинами страниц, генерируемых из баз данных, порождает еще один распространенных класс внешне мало отличающихся документов: анкеты, форумы, страницы товаров в электронных магазинах

Очевидно, что с полными повторами проблем особых нет, достаточно сохранять в индексе контрольную сумму текста и игнорировать все остальные тексты с такой же контрольной суммой. Однако этот метод не работает для выявления хотя бы чуть-чуть измененных документов.

Для решения этой задачи Udi Manber (Уди Манбер) (автор известной программы приближенного прямого поиска agrep) в 1994 году предложил идею [manber1994], а Andrei Broder (Андрей Бродер) в 1997 [broder] придумал название и довел до ума алгоритм «шинглов» (от слова shingles, «черепички, чешуйки»). Вот его примерное описание.

Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!

Очевидно, что так можно определять процент перекрытия текстов, выявлять все его источники и т.п. Этот изящный алгоритм воплотил давнюю мечту доцентов: отныне мучительный вопрос «у кого студент списывал этот курсовик» можно считать решенным! Легко оценить долю плагиата в любой статье.

Чтобы у читателя не создалось впечатление, что информационный поиск исключительно западная наука, упомяну про альтернативный алгоритм определения почти-дубликатов, придуманый и воплощенный у нас в Яндексе [ilyinsky]. В нем используется тот факт, что большинство поисковых систем уже обладают индексом в виде инвертировнного файла (или инвертировнным индексом) и этот факт удобно использовать в процедуре нахождения почти-дубликатов.

#1 20.07.06 08:27

[Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#2 20.07.06 11:02

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#3 20.07.06 11:14

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#4 20.07.06 13:40

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#5 20.07.06 18:08

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#6 20.07.06 18:30

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

#7 20.07.06 19:23

Re: [Образование] АнтиПлагиат.ru - защита преподавателя от плагиатных рефератов

Пользователь

Список активных форумов

Банный лист

ФутЕр:)