Перейти к основному контенту
Технологии и медиа ,  
0 
Эксклюзив

Правообладатели раскритиковали работу «антипиратского» робота «Яндекса»

Он «не обладает ни точностью, ни корректностью работы»
Робот «Яндекса», который должен был стать одним из основных инструментов поиска пиратского контента в интернете, не оправдал ожиданий правообладателей. «Яндекс» обещает «повысить точность» программы
Фото: Станислав Тихомиров / ТАСС
Фото: Станислав Тихомиров / ТАСС

Подписавшие в ноябре прошлого года антипиратский меморандум правообладатели направили в «Яндекс» письмо, в котором высказали свое мнение относительно созданной интернет-компанией программы для поиска ссылок на пиратский контент. В письме, датированном мартом, правообладатели указывают, что «Яндекс» не предложил действенного инструмента выявления ссылок с нелегальным видео. Об этом РБК рассказали три источника в медиакомпаниях.

Ассоциация «Интернет-видео», объединяющая онлайн-кинотеатры ivi.ru, Okko, Megogo, TVZavr, Amediateka и VIP Viasat Play, не использует робот «Яндекса» для выявления пиратских ссылок для их последующего внесения в реестр, сообщил РБК гендиректор ассоциации Алексей Бырдин (ему также известно о письме правообладателей). По его словам, предложенный «Яндексом» инструмент не обладает ни точностью, ни корректностью работы с данными.

В чем претензии правообладателей и насколько они обоснованны, разбирался РБК.

Что такое антипиратский робот «Яндекса»

Правообладатели и владельцы интернет-ресурсов 1 ноября подписали так называемый антипиратский меморандум. От имени правообладателей под документом поставили свои подписи руководители ВГТРК, «Газпром-Медиа», Национальной медиа группы, «Первого канала», «СТС Медиа», объединяющей онлайн-кинотеатры ассоциации «Интернет-видео», Ассоциации продюсеров кино и телевидения и принадлежащего «Яндексу» сервиса «Кинопоиск». Со стороны интернет-площадок — «Яндекс», Rambler Group, Mail.Ru Group и RuTube.

В соответствии с меморандумом ссылки на пиратский контент по заявлению правообладателей вносятся в специальный реестр, после чего они в течение шести часов должны быть удалены из поисковой выдачи. Кроме того, подписавшие меморандум интернет-площадки должны удалять внесенный в реестр пиратский контент из своего видеохостинга и других сервисов. Срок действия меморандума ограничен 1 сентября 2019 года: к этому времени в антипиратское законодательство должны быть подготовлены поправки, соответствующие положениям меморандума.

Робот от «Яндекса» появился по собственной инициативе интернет-холдинга в марте этого года, в антипиратском меморандуме он не упоминается.

Как пояснил представитель «Яндекса», созданная программа позволяет искать интернет-страницы с контентом, которые похожи на те, что уже попали в антипиратский реестр, — для этого применяются принципы машинного обучения, рассказал «Ведомостям» представитель интернет-компании, не объяснив принцип работы робота.

Благодаря новой программе «Яндекс» за короткое время нашел несколько миллионов страниц с пиратским контентом, рассказывал операционный и финансовый директор компании Грег Абовски. По его мнению, это «ускорит процесс формирования реестра, а борьба с пиратством станет эффективнее».

Почему робот не нравится правообладателям

Робот действительно находит ссылки на сайты с признаками нарушения (например, на этих сайтах может быть запись «Игра престолов» смотреть онлайн»), но самого нарушения — наличия видеоплеера — на выявленных «Яндексом» страницах не оказалось, рассказывает Алексей Бырдин.

«Яндекс» разослал правообладателям файл с 3 млн URL-адресов, который у части правообладателей открылся в текстовой программе «Блокнот», а у части компаний не открылся совсем, утверждают представители двух медиакомпаний. По их словам, этот контент в первой версии файла не был разделен по принадлежности тому или иному правообладателю, во второй раз «Яндекс», выполнив просьбу компаний, рассортировал ссылки лишь частично.

Но и к найденным ссылкам у правообладателей возникли претензии. Один из них, как рассказывают собеседники РБК, провел выборочную проверку 1 тыс. ссылок, 67% из них оказались нерелевантными: на этих сайтах вообще не было никакого видео либо оно было легальным. Прочие ссылки не имели отношения к контенту данного правообладателя. И только две содержали пиратское видео.

Робот «Яндекса» был бы полезным, если бы не просто находил ссылки, но еще и анализировал их, указывают собеседники РБК. По их словам, эту работу для некоторых правообладателей сейчас выполняет специализирующаяся на кибербезопасности Group-IB.

Какова версия «Яндекса»

«Мы будем постоянно работать над повышением точности инструмента», — заверил РБК представитель интернет-холдинга. Он настаивает, что буквально на днях компания улучшила разметку ссылок. «В результате объем новых выборок заметно сократился и стал релевантнее. Новую выгрузку мы уже отправляем нашим партнерам», — добавил представитель «Яндекса».

Как еще ищут нелегальные ссылки

Руководитель департамента инновационной защиты бренда и интеллектуальной собственности Group-IB Андрей Бусаргин рассказал, что в поисках нелегального контента страницы проверяют на два параметра. «Во-первых, речь идет именно о том фильме, который ищем и защищаем. Для этого работает ML-алгоритм, анализирующий содержимое страницы, — пояснил Бусаргин. — Во-вторых, на этой странице действительно можно посмотреть онлайн или скачать фильм: страница анализируется на присутствие непосредственно пиратского контента — ищутся торрент-файлы, плееры для онлайн-просмотра и т.д. Полученные видео и видеопотоки сверяются с эталоном».

По его словам, для успешного функционирования системы оценки наличия пиратского контента на странице решаются две принципиально разные задачи — это оценка соответствия страницы контенту, а также оценка наличия несанкционированного доступа к нему. «Первая задача — классический алгоритм поисковой системы — в среднем занимает непродолжительное время. После успешного установления соответствия страница может перейти на вторую стадию — установление несанкционированного доступа к контенту», — рассказывает собеседник РБК. При решении второй задачи проявляется главная сложность — интеграция технологии «компьютерного зрения» и других методов анализа. «Но в случае грамотного применения алгоритма машинного обучения вердикт может быть выдан на лету», — добавил он.

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.

  

Лента новостей
Курс евро на 29 марта
EUR ЦБ: 99,71 (-0,56)
Инвестиции, 28 мар, 16:51
Курс доллара на 29 марта
USD ЦБ: 92,26 (-0,33)
Инвестиции, 28 мар, 16:51
Разработчик уволился и забрал ПО с собой: как избежать такой ситуации Pro, 11:16
Во Львове сообщили о повреждении объекта критической инфраструктуры Политика, 11:09
УАЗ возобновил выпуск «экспедиционных буханок» Авто, 11:02
Mango Office выяснил, как изменятся коммуникации сотрудников в 2024 году Компании, 11:00
АвтоВАЗ начал производство Lada в Азербайджане Бизнес, 11:00
Провалы в памяти: когда забывчивость становится тревожным сигналом Pro, 10:57
ЦБ продлил ограничения на перевод средств за границу Финансы, 10:53
Здоровый сон: как легче засыпать и просыпаться
Интенсив РБК Pro поможет улучшить качество сна и восстановить режим
Подробнее
Простор и логика: какая квартира подойдет большой семье 10:50
Над Белгородской областью сбили дрон Политика, 10:49
Первый квартал стал рекордным для индекса S&P 500 за 5 лет Инвестиции, 10:43
С памятного мемориала у «Крокуса» начали убирать свечи Общество, 10:43
Дефицит людей рождает роботов: как ИИ трудится в российских компаниях Pro, 10:41
Вторая ракетка мира Алькарас сенсационно проиграл в 1/4 финала в Майами Спорт, 10:40
Третий фигурант дела о теракте в «Крокусе» обжаловал арест Общество, 10:40