Лента новостей
Путин одобрил существенное увеличение зарплат рядовым и сержантам Политика, 03:20 СМИ нашли россиянина в схеме поставок дорогих машин Ким Чен Ыну Политика, 03:17 Число госпитализированных из детского лагеря в Крыму превысило 40 человек Общество, 02:54 Лавров назвал условие отмены запрета на полеты в Грузию Политика, 02:17 Читай по ногам: как работает язык тела. Тест Партнерский материал, 01:57 NYT узнала об отказе России в визах для учителей Англо-американской школы Политика, 01:49 Лавров назвал непростым вопрос «разбора завалов» в отношениях с США Политика, 01:47 Аргентинский полузащитник «Зенита» заявил о желании покинуть клуб Спорт, 01:16 Лавров нашел ответственных в раскручивании «мифа о китайской угрозе» Политика, 00:53 Россиянина Макеева приговорили к 37,5 годам тюрьмы за убийство в Мексике Общество, 00:27 В Крыму ехавший по серпантину автобус с пассажирами врезался в отбойник Общество, 00:24 Из горящей гостиницы возле «Москва-Сити» эвакуировали 70 человек Общество, 16 июл, 23:54 Более 30 детей госпитализировали из-за отравления в крымском лагере Общество, 16 июл, 23:49 «Чикаго Блэкхокс» обменял российского нападающего на канадца Спорт, 16 июл, 23:21
Технологии и медиа ,  
0 
Правообладатели раскритиковали работу «антипиратского» робота «Яндекса» Он «не обладает ни точностью, ни корректностью работы»
Робот «Яндекса», который должен был стать одним из основных инструментов поиска пиратского контента в интернете, не оправдал ожиданий правообладателей. «Яндекс» обещает «повысить точность» программы
Фото: Станислав Тихомиров / ТАСС

Подписавшие в ноябре прошлого года антипиратский меморандум правообладатели направили в «Яндекс» письмо, в котором высказали свое мнение относительно созданной интернет-компанией программы для поиска ссылок на пиратский контент. В письме, датированном мартом, правообладатели указывают, что «Яндекс» не предложил действенного инструмента выявления ссылок с нелегальным видео. Об этом РБК рассказали три источника в медиакомпаниях.

Ассоциация «Интернет-видео», объединяющая онлайн-кинотеатры ivi.ru, Okko, Megogo, TVZavr, Amediateka и VIP Viasat Play, не использует робот «Яндекса» для выявления пиратских ссылок для их последующего внесения в реестр, сообщил РБК гендиректор ассоциации Алексей Бырдин (ему также известно о письме правообладателей). По его словам, предложенный «Яндексом» инструмент не обладает ни точностью, ни корректностью работы с данными.

В чем претензии правообладателей и насколько они обоснованны, разбирался РБК.

Что такое антипиратский робот «Яндекса»

Правообладатели и владельцы интернет-ресурсов 1 ноября подписали так называемый антипиратский меморандум. От имени правообладателей под документом поставили свои подписи руководители ВГТРК, «Газпром-Медиа», Национальной медиа группы, «Первого канала», «СТС Медиа», объединяющей онлайн-кинотеатры ассоциации «Интернет-видео», Ассоциации продюсеров кино и телевидения и принадлежащего «Яндексу» сервиса «Кинопоиск». Со стороны интернет-площадок — «Яндекс», Rambler Group, Mail.Ru Group и RuTube.

В соответствии с меморандумом ссылки на пиратский контент по заявлению правообладателей вносятся в специальный реестр, после чего они в течение шести часов должны быть удалены из поисковой выдачи. Кроме того, подписавшие меморандум интернет-площадки должны удалять внесенный в реестр пиратский контент из своего видеохостинга и других сервисов. Срок действия меморандума ограничен 1 сентября 2019 года: к этому времени в антипиратское законодательство должны быть подготовлены поправки, соответствующие положениям меморандума.

Робот от «Яндекса» появился по собственной инициативе интернет-холдинга в марте этого года, в антипиратском меморандуме он не упоминается.

Как пояснил представитель «Яндекса», созданная программа позволяет искать интернет-страницы с контентом, которые похожи на те, что уже попали в антипиратский реестр, — для этого применяются принципы машинного обучения, рассказал «Ведомостям» представитель интернет-компании, не объяснив принцип работы робота.

Благодаря новой программе «Яндекс» за короткое время нашел несколько миллионов страниц с пиратским контентом, рассказывал операционный и финансовый директор компании Грег Абовски. По его мнению, это «ускорит процесс формирования реестра, а борьба с пиратством станет эффективнее».

Почему робот не нравится правообладателям

Робот действительно находит ссылки на сайты с признаками нарушения (например, на этих сайтах может быть запись «Игра престолов» смотреть онлайн»), но самого нарушения — наличия видеоплеера — на выявленных «Яндексом» страницах не оказалось, рассказывает Алексей Бырдин.

«Яндекс» разослал правообладателям файл с 3 млн URL-адресов, который у части правообладателей открылся в текстовой программе «Блокнот», а у части компаний не открылся совсем, утверждают представители двух медиакомпаний. По их словам, этот контент в первой версии файла не был разделен по принадлежности тому или иному правообладателю, во второй раз «Яндекс», выполнив просьбу компаний, рассортировал ссылки лишь частично.

Но и к найденным ссылкам у правообладателей возникли претензии. Один из них, как рассказывают собеседники РБК, провел выборочную проверку 1 тыс. ссылок, 67% из них оказались нерелевантными: на этих сайтах вообще не было никакого видео либо оно было легальным. Прочие ссылки не имели отношения к контенту данного правообладателя. И только две содержали пиратское видео.

Робот «Яндекса» был бы полезным, если бы не просто находил ссылки, но еще и анализировал их, указывают собеседники РБК. По их словам, эту работу для некоторых правообладателей сейчас выполняет специализирующаяся на кибербезопасности Group-IB.

Какова версия «Яндекса»

«Мы будем постоянно работать над повышением точности инструмента», — заверил РБК представитель интернет-холдинга. Он настаивает, что буквально на днях компания улучшила разметку ссылок. «В результате объем новых выборок заметно сократился и стал релевантнее. Новую выгрузку мы уже отправляем нашим партнерам», — добавил представитель «Яндекса».

Как еще ищут нелегальные ссылки

Руководитель департамента инновационной защиты бренда и интеллектуальной собственности Group-IB Андрей Бусаргин рассказал, что в поисках нелегального контента страницы проверяют на два параметра. «Во-первых, речь идет именно о том фильме, который ищем и защищаем. Для этого работает ML-алгоритм, анализирующий содержимое страницы, — пояснил Бусаргин. — Во-вторых, на этой странице действительно можно посмотреть онлайн или скачать фильм: страница анализируется на присутствие непосредственно пиратского контента — ищутся торрент-файлы, плееры для онлайн-просмотра и т.д. Полученные видео и видеопотоки сверяются с эталоном».

По его словам, для успешного функционирования системы оценки наличия пиратского контента на странице решаются две принципиально разные задачи — это оценка соответствия страницы контенту, а также оценка наличия несанкционированного доступа к нему. «Первая задача — классический алгоритм поисковой системы — в среднем занимает непродолжительное время. После успешного установления соответствия страница может перейти на вторую стадию — установление несанкционированного доступа к контенту», — рассказывает собеседник РБК. При решении второй задачи проявляется главная сложность — интеграция технологии «компьютерного зрения» и других методов анализа. «Но в случае грамотного применения алгоритма машинного обучения вердикт может быть выдан на лету», — добавил он.

Магазин исследований: аналитика по теме "Интернет-торговля"