21.10.2008 00:00
Новости.
Просмотров всего: 3978; сегодня: 2.

RIW «Проблема навигации и каталогизации контента в Интернете»

RIW «Проблема навигации и каталогизации контента в Интернете»

23 октября в рамках Российской недели Интернета RIW состоится круглый стол «Проблема навигации и каталогизации контента в Интернете».

Это реально жгучая проблема, поскольку объем контента в Интернете – как профессионального, так и user generated – возрастает в геометрической прогрессии. Возникли целые новые контент-области: интерент-телевидение, видео-записи, лекции, блоги, короткие литературные формы… Как найти нужную и важную информацию среди необозримого множества?

Обычные средства поиска (каталогизация, многоуровневая рубрикация, тегирование) – спасают лишь отчасти. Поскольку даже на самом последнем уровне рубрикатора возможны выборки с тысячами и десятками тысяч позиций.

Дмитрий Олеринский, директор проектов Имхонета:

Привычные средства навигации (метки, авто контекст и каталогизация) хорошо работают только тогда, когда они активно расставляются пользователями, либо когда возможен качественный семантический анализ контента с выделением высокоточных ключевых слов. Но это крайне слабо работает со звуками, видео и статичными изображениями, а также в тех контент-областях, где семантический анализ невозможен (например, из-за того, что сам контент кроме заголовка недоступен роботу), а у пользователей недостаточно мотивации для UGC тегирования. Кроме того, даже обильные пользовательские теги всегда носят субъективный характер, и редко когда корректно описывают суть контента. А нанимать армию модераторов неоправданно дорого.

Можно прибегнуть к поиску по атрибутам объекта. Что нередко практикуется по отношению к кинофильмам: их ищут по названию + актеру в главной роли или режиссеру. Но и это не панацея, поскольку связи между атрибутами часто не прописаны.

Способы упрощения навигации

Самый распространенный путь выделения наиболее востребованных и популярных объектов – это рейтинги. Но они настолько усредняют информацию, что результат на выходе – средняя температура по больнице. Еще один общепринятый метод – сокращение перечня объектов. Принципы вивисекции разные: список наиболее покупаемых товаров, фильмы, транслирующиеся по телевидению сей момент и т.д. Ограничения очевидны.

Артем Лебедев, глава департамента web-разработки Имхонета:

Все это не решает проблему «хвоста» – не пользующихся массовым спросом, но очень важных объектов. Как быть, например, с документальным кино, востребованность которого ничтожно мала по сравнению с художественными фильмами? Или образовательным контентом: материалами лекций, докладов, сообщений, презентаций? Их не так мало в интернете, но найти что-либо на разрозненных ресурсах крайне сложно.

Поэтому в последнее время стремительно возрастает актуальность новых способов структуризации всех типов данных и удобной навигации по ним.

Поиск контента с помощью искусственного интеллекта

Один из вариантов – автоматический анализ мультимедийных данных. Это особенно актуально для поиска визуальной информации, где стандартные средства работают плохо. Интеллектуальная система анализа содержания мультимедийного контента может быть реализована на основе технологии компьютерного зрения, которые разрабатывает компания SeeStorm (seestorm.com).

Александр Крайнов, директор по продуктам SeeStorm:

Технологии компьютерного зрения позволяют в автоматическом режиме распознавать содержание графических данных: определять наличие на изображении человеческого лица или нескольких ли; идентифицировать заданный объект по признакам подобия; находить изображения, соответствующие определенным визуальным характеристикам и т.д.

Другой путь решения проблемы – совмещение привычных способов поиска контента с его персонификацией. Носителем этой идеологии является рекомендательный сервис Имхонет (imhonet.ru).

Персонификация контента: применение рекомендательных систем для решения проблемы навигации

Артем Лебедев, глава департамента web-разработки Имхонета:

Сильная сторона рекомендательных систем в том, что, оперируя большими массивами данных, они позволяют каждому отдельному пользователю находить контент в соответствии с его личными предпочтениями и вкусами. Благодаря этому юзеры могут отыскать среди множества объектов те, которые не пользуются массовым спросом. Плюс сервис выдает не только списки рекомендованных объектов, но и перечень единомышленников данного человека.

Еще одно важнейшее преимущество рекомендательных систем – они совмещают разные способы расфасовки контента. К стандартному упорядочиванию множества объектов по полочкам тематических подмножеств (областей потребления, развлекательных или потребительских товаров и т.д.) добавляется многоуровневая рубрикация, тегирование, рейтинги, поиск по атрибутам. Плюс на полученные выборки накладывается фильтр по пользовательским предпочтениям (рекомендательный функционал). Таким образом рекомендательный сервис способен выступать значимой надстройкой поисковых систем – поисковиком нового поколения.

Существуют и иные варианты решения проблемы – обо всех них и пойдет речь на круглом столе RIW.


Ньюсмейкер: Имхонет — 9 публикаций
Поделиться:

Интересно:

Сегодня в Москве проходит фестиваль «Цифровая история»
20.04.2024 13:27 Мероприятия
Сегодня в Москве проходит фестиваль «Цифровая история»
20 апреля в Москве в Концертном зале МПГУ стартовал Шестнадцатый научно-популярный фестиваль «Цифровая история»  — «Неизвестная Вторая мировая». В мероприятии принимают участие российские историки, которые обсудят последние открытия в мире военной истории, расскажут о...
К годовщине окончания битвы за Москву в 1942 году
20.04.2024 09:02 Новости
К годовщине окончания битвы за Москву в 1942 году
Начавшаяся 30 сентября 1941 года битва за Москву завершилась 20 апреля 1942 года. Германия потерпела первое крупное поражение во Второй мировой войне. Враг потерял убитыми, ранеными и пропавшими без вести более 500 тысяч человек, 1300 танков, 2500 орудий и другой...
20 млн учащихся приняли участие в уроке о геноциде советского народа
19.04.2024 16:10 Новости
20 млн учащихся приняли участие в уроке о геноциде советского народа
Накануне Дня единых действий в память о жертвах преступлений против советского народа, совершенных нацистами и их пособниками в годы Великой Отечественной войны, который отмечают 19 апреля, в российских школах прошли занятия «Разговоры о важном».  В рамках «Разговоров о...
Подмосковье - в числе регионов-лидеров по объему закупок у самозанятых
19.04.2024 09:21 Новости
Подмосковье - в числе регионов-лидеров по объему закупок у самозанятых
С 1 апреля 2020 года самозанятым гражданам разрешили участвовать в закупках по 223-Федеральному закону «О закупках товаров, работ, услуг отдельными видами юридических лиц» на равных условиях с малым и средним бизнесом. Это способствовало значительному приросту объёма закупок у граждан, применяющих...
День единых действий в память о геноциде советского народа в годы ВОВ
19.04.2024 07:40 Интервью, мнения
День единых действий в память о геноциде советского народа в годы ВОВ
В деле сохранения исторической правды есть особая дата - 19 апреля. В этот день в 1943 году был издан Указ Президиума Верховного Совета СССР N39 "О мерах наказания для немецко-фашистских злодеев, виновных в убийствах и истязаниях советского гражданского населения и пленных красноармейцев, для...