Лента новостей
Орешкин посоветовал не спешить с вопросом о единой с Белоруссией валюте Экономика, 17:36 ЦИК Украины не смог объяснить низкую явку на выборах в Раду Политика, 17:18 Вандалы изрисовали краской памятник генералу Ватутину в Полтаве Общество, 17:10 Удар Кейна с центра поля принес «Тоттенхэму» победу над «Ювентусом» Спорт, 17:06 ЦИК Украины обновила данные о явке на выборах в Раду Политика, 16:59 Сочное питание: как получить максимум пользы из фруктов, овощей и зелени РБК и Philips, 16:45 Стендап-комик умер на сцене во время выступления в Дубае Общество, 16:43 В партии Зеленского заявили о политических клонах на выборах в Раду Политика, 16:37 «Урал» разгромил «Ахмат» и возглавил таблицу РПЛ Спорт, 16:26 Экзитполы выявили победителя выборов в верхнюю палату парламента Японии Политика, 16:23 Кокорин и Мамаев назвали уроком пребывание в колонии Общество, 16:07 Дипломаты сообщили о запрете россиянам покидать задержанный Ираном танкер Общество, 16:04 Кучма на выборах в Раду заявил о шансе Украины на перезапуск Политика, 15:53 Определились потенциальные соперники «Спартака» в Лиге Европы Спорт, 15:47
Технологии и медиа ,  
0 
Правообладатели раскритиковали работу «антипиратского» робота «Яндекса» Он «не обладает ни точностью, ни корректностью работы»
Робот «Яндекса», который должен был стать одним из основных инструментов поиска пиратского контента в интернете, не оправдал ожиданий правообладателей. «Яндекс» обещает «повысить точность» программы
Фото: Станислав Тихомиров / ТАСС

Подписавшие в ноябре прошлого года антипиратский меморандум правообладатели направили в «Яндекс» письмо, в котором высказали свое мнение относительно созданной интернет-компанией программы для поиска ссылок на пиратский контент. В письме, датированном мартом, правообладатели указывают, что «Яндекс» не предложил действенного инструмента выявления ссылок с нелегальным видео. Об этом РБК рассказали три источника в медиакомпаниях.

Ассоциация «Интернет-видео», объединяющая онлайн-кинотеатры ivi.ru, Okko, Megogo, TVZavr, Amediateka и VIP Viasat Play, не использует робот «Яндекса» для выявления пиратских ссылок для их последующего внесения в реестр, сообщил РБК гендиректор ассоциации Алексей Бырдин (ему также известно о письме правообладателей). По его словам, предложенный «Яндексом» инструмент не обладает ни точностью, ни корректностью работы с данными.

В чем претензии правообладателей и насколько они обоснованны, разбирался РБК.

Что такое антипиратский робот «Яндекса»

Правообладатели и владельцы интернет-ресурсов 1 ноября подписали так называемый антипиратский меморандум. От имени правообладателей под документом поставили свои подписи руководители ВГТРК, «Газпром-Медиа», Национальной медиа группы, «Первого канала», «СТС Медиа», объединяющей онлайн-кинотеатры ассоциации «Интернет-видео», Ассоциации продюсеров кино и телевидения и принадлежащего «Яндексу» сервиса «Кинопоиск». Со стороны интернет-площадок — «Яндекс», Rambler Group, Mail.Ru Group и RuTube.

В соответствии с меморандумом ссылки на пиратский контент по заявлению правообладателей вносятся в специальный реестр, после чего они в течение шести часов должны быть удалены из поисковой выдачи. Кроме того, подписавшие меморандум интернет-площадки должны удалять внесенный в реестр пиратский контент из своего видеохостинга и других сервисов. Срок действия меморандума ограничен 1 сентября 2019 года: к этому времени в антипиратское законодательство должны быть подготовлены поправки, соответствующие положениям меморандума.

Робот от «Яндекса» появился по собственной инициативе интернет-холдинга в марте этого года, в антипиратском меморандуме он не упоминается.

Как пояснил представитель «Яндекса», созданная программа позволяет искать интернет-страницы с контентом, которые похожи на те, что уже попали в антипиратский реестр, — для этого применяются принципы машинного обучения, рассказал «Ведомостям» представитель интернет-компании, не объяснив принцип работы робота.

Благодаря новой программе «Яндекс» за короткое время нашел несколько миллионов страниц с пиратским контентом, рассказывал операционный и финансовый директор компании Грег Абовски. По его мнению, это «ускорит процесс формирования реестра, а борьба с пиратством станет эффективнее».

Почему робот не нравится правообладателям

Робот действительно находит ссылки на сайты с признаками нарушения (например, на этих сайтах может быть запись «Игра престолов» смотреть онлайн»), но самого нарушения — наличия видеоплеера — на выявленных «Яндексом» страницах не оказалось, рассказывает Алексей Бырдин.

«Яндекс» разослал правообладателям файл с 3 млн URL-адресов, который у части правообладателей открылся в текстовой программе «Блокнот», а у части компаний не открылся совсем, утверждают представители двух медиакомпаний. По их словам, этот контент в первой версии файла не был разделен по принадлежности тому или иному правообладателю, во второй раз «Яндекс», выполнив просьбу компаний, рассортировал ссылки лишь частично.

Но и к найденным ссылкам у правообладателей возникли претензии. Один из них, как рассказывают собеседники РБК, провел выборочную проверку 1 тыс. ссылок, 67% из них оказались нерелевантными: на этих сайтах вообще не было никакого видео либо оно было легальным. Прочие ссылки не имели отношения к контенту данного правообладателя. И только две содержали пиратское видео.

Робот «Яндекса» был бы полезным, если бы не просто находил ссылки, но еще и анализировал их, указывают собеседники РБК. По их словам, эту работу для некоторых правообладателей сейчас выполняет специализирующаяся на кибербезопасности Group-IB.

Какова версия «Яндекса»

«Мы будем постоянно работать над повышением точности инструмента», — заверил РБК представитель интернет-холдинга. Он настаивает, что буквально на днях компания улучшила разметку ссылок. «В результате объем новых выборок заметно сократился и стал релевантнее. Новую выгрузку мы уже отправляем нашим партнерам», — добавил представитель «Яндекса».

Как еще ищут нелегальные ссылки

Руководитель департамента инновационной защиты бренда и интеллектуальной собственности Group-IB Андрей Бусаргин рассказал, что в поисках нелегального контента страницы проверяют на два параметра. «Во-первых, речь идет именно о том фильме, который ищем и защищаем. Для этого работает ML-алгоритм, анализирующий содержимое страницы, — пояснил Бусаргин. — Во-вторых, на этой странице действительно можно посмотреть онлайн или скачать фильм: страница анализируется на присутствие непосредственно пиратского контента — ищутся торрент-файлы, плееры для онлайн-просмотра и т.д. Полученные видео и видеопотоки сверяются с эталоном».

По его словам, для успешного функционирования системы оценки наличия пиратского контента на странице решаются две принципиально разные задачи — это оценка соответствия страницы контенту, а также оценка наличия несанкционированного доступа к нему. «Первая задача — классический алгоритм поисковой системы — в среднем занимает непродолжительное время. После успешного установления соответствия страница может перейти на вторую стадию — установление несанкционированного доступа к контенту», — рассказывает собеседник РБК. При решении второй задачи проявляется главная сложность — интеграция технологии «компьютерного зрения» и других методов анализа. «Но в случае грамотного применения алгоритма машинного обучения вердикт может быть выдан на лету», — добавил он.

Магазин исследований: аналитика по теме "Интернет-торговля"