Поиск по блогу

среда, 29 июня 2011 г.

Конференция WIMS'11

Главной целью поездки было участие в International Conference on Web Intelligence, Mining and Semantics (WIMS'11), которая проводилась впервые в этом году и обещает стать традиционной. По крайней мере, место проведения следующей WIMS'12 уже известно: г. Крайова (Румыния). По тематике WIMS укладывается в широкий спектр направлений Semantic Web и, видимо, призвана занять свою нишу после ведущих конференций этой области: ISWC и ESWC.
В этом году конференция была приурочена к 10-летию публикации основополагающей статьи T. Berners-Lee, O. Lassila, J. Hendler "Semantic Web" в журнале Scientific American. Собственно, подведению промежуточных итогов был посвященный пленарный доклад одного из соавторов данной статьи.



Следующие тезисы удалось уловить из его выступления:

  • Семантический Веб стал реальностью. В частности, много внимания было уделено развитию этих идей ведущими компаниями: приводились примеры Facebook Open Graph Protocol (более известный как кнопка Like, заполонившая весь Веб), поддержка Google словаря Good Relations посредством технологии Rich Snippets (про важную инициативу schema.org трех ведущих поисковиков станет известно несколькими днями позднее), модуль для управления семантическими метаданными в СУБД Oracle 11g и др.
  • Можно констатировать зрелость лишь нижней части стека технологий Семантического Веба, т.е. RDF, RDFa, RDFS, SPARQL и отчасти OWL. В этой связи делается вывод, что перспективнее (особенно для целей бизнеса) делать акцент на генерацию и обработку растущих объемов данных (например, в канве того же проекта Linked Data), чем на разработку новых дорогостоящих онтологий.
  • Семантический Веб добавляет семантику к функциональности традиционного Веба, т.е. Веб 3.0 представляет собой не альтернативу, а полезное развитие Веба 1.0 и Веба 2.0. Этот факт демонстрируют приложения семантического поиска и разнообразные мэшапы данных, работающие поверх существующей технологической инфраструктуры.
Следующий пленарный докладчик - Петер Мика (Yahoo Research).



Он представил подробный обзор области семантического поиска. Вот основные моменты:
  • под семантическим поиском понимается парадигма поиска, которая: (i) использует структуру данных или явную схему данных для понимания намерений пользователя и значения содержимого; (ii) использует это понимание в некоторой части поискового процесса (например, при индексации или ранжировании).
  • Семантический поиск призван улучшить современные поисковые техники, ориентированные на методы машинного обучения. Существуют категории плохо разрешаемых информационных нужд: запросы со множеством интерпретаций (paris hilton), редкие «запросы длинного хвоста» (george bush — пивовар из Аризоны, а не экс-президент США), мультимедийный поиск, неточный или сверхточный поиск, поиск описаний (countries in Africa) и т.д.
  • В связи с использованием данных Семантического Веба появляются новые поисковые задачи: агрегирование поисковых результатов (сравнение цен на разных сайтах); анализ и оценка (оценить мировую температуру в 2020); семантическое профилирование (рекомендации, основанные на определенных интересах пользователя); семантический анализ поисковых логов (понимание поведения пользователя в терминах объектов); поддержка более сложных задач (например, заказ билетов для отпуска через комбинацию сервисов).
  • Интепретация запросов в семантическом поиске: использование онтологий для извлечения структуры из запросов; взаимодействие с пользователем при написании запроса (как в Freebase), отображение интепретации запроса (как в TrueKnowledge).
  • Горизонтальная и вертикальная структура семантического индекса, т.е. каким образом расширять стандартный инвертированный индекс, сохраняя масштабируемость механизма индексации.
  • Оценка семантического поиска: было объявлено о создании инициативы Yahoo SemSearch Challenge - это своего рода TREC для семантического поиска, который покрывает: поиск по ключевым словам для RDF данных; поиск сущностей; листовой поиск (когда ищется класс объектов). При этом используются реальные поисковые логи Yahoo и Microsoft Bing, производится оценка в стиле TREC, причем акцент ставится на ранжирование, а не на вопросно-ответный поиск. Кроме того, с помощью Amazon Mechanical Turk для оценивания привлекается ручной труд.
  • Разработка поисковых интерфейсов: генерация поисковых сниппетов, адаптивное и интерактивное представление результатов (по типу запроса), группировка похожих результатов, фильтрация по фасетам, помощь пользователю в запросах.
  • В заключение был обрисован горизонт будущих работ: полуавтоматические способы создания метаданных (как снизить долю ручного труда с 95% до 5%); оценка качества данных; логический вывод; масштабируемость; повторное использование онтологий; отображение данных.
Сорен Ауэр (Leipzig University), один из авторов DBPedia - краеугольного ресурса "облака" Linked Data, рассказал о развитии проекта LOD2, над которым работают не только исследователи из университетов, но и коммерческие компании, например, такие как OpenLink, известная по своему детищу - Virtuoso


Так, в рамках LOD2 разрабатываются инструменты для поддержки всего жизненного цикла "связанных данных": 1) извлечение; 2) хранение/обработка запросов; 3) ручная проверка/создание; 4) связывание/объединение; 5) классификация; 6) анализ качества; 7) восстановление; 8) поиск/просмотр/исследование. Вся цепочка работы с данными замкнута, и каждая подзадача выполняется циклично по принципу стиральной машины (аллегория самого Ауэра). Основными терминологическими ресурсами, помимо DBPedia, являются также LinkedGeoData, который, как утверждается, вместе с данными из OpenStreetMap способен составить конкуренцию известным коммерческим решениям вроде Google Maps, и словарь статистических данных DataCube. В качестве решения второй подзадачи разрабатываются инструменты для ускорения работы RDF хранилищ, которые пока в 5-50 раз медленнее реляционных СУБД согласно DBPedia benchmark. Кроме того, особенно подчеркивалась важность разработки средств вроде семантических вики, например, таких как OntoWiki. В заключение был сделан анонс: уже в сентябре будут свободно доступны Debian дистрибутивы для решения вышеупомянутых подзадач.


Марко Гробельник (Josef Stefan Institute) построил свой пленарный доклад практически целиком на демонстрации любопытных приложений для обработки текста. Особенно запомнился SearchPoint - контекстно-зависимый поисковик.


Несколько выбился из общего контекста доклад Ашвина Рама (Georgia Tech Univesity) об OpenStudy, платформе для вовлечения учеников в образовательный процесс через механизм социальных сетей. Идея проекта в том, что бы через специальный виджет, доступный, например, на таких сайтах, как MIT OpenCourseWare и videolectures.net, предоставить возможность людям обсуждать и задавать вопросы/получать ответы по просматриваемому конспекту лекции, видео или др. учебному материалу. Выглядело любопытно, но, мне кажется, концепция того же Khan Academy выглядит более инновационной и полезной и, в том числе, в смысле социального аспекта в образовании.
Мой доклад "Анализ логической структуры математических научных публикаций" (слайды, ACM, препринт статьи доступен на персональной странице) состоялся в первый же день в рамках секции "Semantics and Ontology Engineering". Прошел он неплохо: не каждый докладчик получает возможность ответить сразу на 4 адекватных вопроса после доклада. Также, накануне доклада удалось перехватить упоминавшегося П. Мику и пригласить его на свою секцию (конференция, как обычно, проходила в несколько секций параллельно). Позже, уже на кофе-брейке, было интересно пообщаться с ним по поводу темы доклада.


Так случилось, что из Бергена я прилетел одним самолетом с другими участниками, в частности, Джонгом Паком (KAIST, Korea & University of Edinburgh, Scotland) и Томашом Влодарчиком (University of Stavanger, Norway).


Профессор Пак со своим студентом представили работу по анимации языков жестов для веб документов. Томаш - аспирант, получил магистерcкую степень в Польше, сейчас работает и готовится к защите Ph.D. тезиса в Норвегии (женат, кстати, на русской девушке). Интересно, что у него был отличный опыт стажировок в ведущих американских университетах - Carnegie Mellon и Стэнфорде (в частности, он рассказывал и про работу с одним из авторов Protege Наташей Ной, а на конференции у них была совместная статья с Мартином О'Коннором по специальному расширению языка правил SWRL).
А это уже на обеде конференции с Цабой Верешом и Николаем Нефедовым.


Профессор Вереш - "человек мира": он венгр, сын выдающегося тяжелоатлета, двухкратного чемпиона мира Дьезе Вереша, вырос в Австралии, учился в США, работает сейчас в Университете Бергена (Норвегия). Николай - сотрудник Nokia Research - родом из Кисловодска, окончил питерский политех, 15 лет проработал в Финляндии, сейчас работает в Швейцарии. Он представил интересную работу по анализу топологии социальных графов, извлеченных из телекоммуникационных логов. По сути, из русскоговорящих участников, кроме нас, был еще Алексей Чепцов из Украины, исследователь из проекта LarKC, работающий в Германии.

----
Пожалуй, все, что хотел рассказать. Многие материалы (слайды, видео) доступны на сайте конференции. Ясно, что невозможно в данном формате покрыть весь объем представленных работ, поэтому лучше обратиться к первоисточникам.
Больше фотографий доступно в альбоме Picasa.

воскресенье, 5 июня 2011 г.

Поездка в Норвегию (часть 2)

Продолжаю подробный рассказ о недавней поездке в Норвегию (см. часть 1).

Берген

От Осло до Бергена, крупного норвежского порта и авиаузла, лететь 55 минут. Причем по пути, уже ближе к Бергену, мы пролетали над живописной снежной грядой, которую интересно было разглядывать с высоты полета. Про сам город, увы, я ничего не могу рассказать (и показать) в подробностях, так как был только в аэропорту. Тем не менее, необходимо указать - и это информация для туристов - что именно от Бергена до Согндала есть очень популярный туристический маршрут (некоторые участники конференции даже проследовали им, как выяснилось) на корабле. Это плавание занимает около 5 часов и пролегает по второму в мире по величине фьорду - Согнефьорду (Sognefjord).
Кстати, по поводу авиасообщения. В SAS'овском журнале увидел карту связности норвежских населенных пунктов в смысле авиарейсов и был поражен: аэропорты есть едва ли не в каждом более-менее серьезном городке, в том числе, и в малонаселенных территориях на севере страны. Как мне объяснили, очевидно, что они убыточны, однако правительство финансирует их для поддержания связности. Вообщем, про людей и здесь не забыли.

Согндал

Самолетом от Бергена до Согндала практически подать рукой - около 30 минут. Надо признать, что красоту здешних мест уже можно было наблюдать на подлете: внизу фьорды, горы; аэропорт как будто где-то затерялся среди них. Наш самолет садился при проливном дожде и небольшом тумане, казалось, едва не задевая кроны деревьев. Было довольно прохладно: +4°C.


Далее нас везли автобусом по горному серпантину от аэропорта до отеля Quality Hotel, места проведения конференции. Сам же я разместился в Hofslund Hotel.


Подозреваю, что флаг справа - все же российский. А вот и вид из моего номера. Впечатляет!


И если выйти из номера, открывается вид на фьорд Согндала (Sogndalsfjorden) во всем великолепии.


В этот же вечер удалось немного прогуляться по городку. 


Картина представилась идиллическая: очень чисто (впрочем, как и в Осло), уютные домики, вежливые водители, вокруг - изумительные виды.

Не считая аэропорта, в Согндале есть магазины, большой молл, футбольный стадион, строящийся университетский кампус, небольшая гавань и много чего еще - все это на город с населением примерно 3 тыс. жителей.  В одном из магазинчиков купил фигурки троллей - самые популярные сувениры в Норвегии (из съедобного норвежцы рекомендовали сыр). Кстати, знаменитое слово "викинг" означает "охотник на троллей". А это местная речка (Sogdnalselva), впадающая в Sogndalsfjorden.


На следующий день участников конференции повезли в национальный заповедник (Jostedalsbreen Nasjonalpark) на ледник Bøyabreen с экскурсией. Поездка в одну сторону заняла примерно час, по пути мы проехали два туннеля, по одному из которых ехали, наверно, минут 10. Что интересно, даже в отдаленные деревушки тянулись линии ЛЭП.


На фото вверху видна часть ледника (бледно-голубоватая). От экскурсовода-геолога из местного музея ледников (Norsk Bremuseum) мы узнали об истории и характеристиках данного ледника, а также об общих принципах образования и изменения ледников.



И располагается Bøyabreen в замечательной одноименной долине.


Эти места чрезвычайно напоминают пейзажи из толкиеновского "Властелина Колец", скажем, где-то вблизи Мории. А любая группа из девяти человек неизбежно будет здесь чувствовать себя Братством Кольца (кто читал - тот поймет).


 На обратном пути в Согндал мы посетили музей ледников.


Надо сказать, что организован он очень грамотно. Вначале в небольшом кинозале нам показали видеофильм, снятый с вертолета, о захватывающих дух панорамах заповедника. Затем провели по декорированной экскурсионной галерее с тематическими информационными видео. И, наконец, в основном павильоне можно было наблюдать различные модели, описывающие структуру и природу ледников. А также сами посетители могли поучаствовать в интересных экспериментах, например, по получению сухого льда или изучению распространения жидкости внутри ледника


Еще нам позволили сделать небольшую остановку и запечатлеть красивейшую панораму другого фьорда - Fjærlandsfjorden.


----
Пожалуй, все. Резюмируя выше сказанное, Норвегия - совершенно потрясающая страна. Норвегия, как и Россия: нефтяная страна с достаточно образованным населением (плотность которого также невелика), уникальной природой и сложной историей. Было бы здорово, если бы каждый россиянин мог ее посетить. Так как, находясь там, ты понимаешь, чего может достигнуть наша страна, если во главе будет адекватное правительство, а не случайные, зачастую вороватые, люди. Вот так, извините, за резкость и пафос.

Больше фотографий можно найти в альбомах Picasa: 
  1. Осло
  2. Согндал
В ближайшем посте расскажу о самой конференции WIMS'11...
Oktogo Bravoavia

Собираетесь путешествовать? Получите от меня скидку на Airbnb.

Рекомендую срочное изготовление гербовых печатей в Санкт-Петербурге:  http://srochnoe-izgotovlenie.ru/pechatej-gerbovyh

Поездка в Норвегию (часть 1)

В этом и следующем посте задался целью описать недавнюю поездку на конференцию WIMS'11 (Согндал, Норвегия). В отличие от прошлогоднего вояжа в Грецию, на этот раз поменяю порядок описания впечатлений от страны и от самой конференции. Стало быть, в этом - о Норвегии.
\begin{disclaimer}
 Необходимо сделать два замечания: а) я не специалист по данной стране, и все мои суждения будут носить поверхностный характер (иное могут рассказать люди, живущие там на постоянной основе); б) в виду нехватки времени ехал абсолютно не подготовленным в плане информации о туристических маршрутах и достопримечательностях, поэтому их описание никак не претендует на полноту.
\end{disclaimer}
Итак, обо всем по порядку. В начале, немного общих соображений: Норвегия - северная страна, и брать теплые вещи, как я убедился на своем опыте, стоит в любом случае. Кроме того, это не только страна с одним из самых высоких уровней жизни, но и одна из самых дорогих стран Европы. Норвегия - страна Шенгенского договора с соответствующими визовыми требованиями по въезду. Валюта - норвежская крона (1 NOK ~ 5 RUB). Путешествовать можно, в принципе, без наличных: везде (магазины, кафе, поезда, автобусы и т.д.) принимаются пластиковые карточки. Также почти все норвежцы (именно обычные люди, а не только люди в сервисе) хорошо говорят по-английски, что, вообще-то, немаловажно для туристов-иностранцев. Как удалось выяснить в личной беседе, это достигается преподаванием в школе обязательного английского на таком же уровне, как и норвежского, кроме того, многие берут в качестве третьего языка, например, немецкий (как говорится, Фурсенко - на заметку). Что интересно, как выяснилось из аэрофлотовского журнальчика, две самые непопулярные страны для российских туристов - Сингапур и Норвегия. Поэтому, думаю, мой рассказ будет любопытен публике в любом случае.

Осло

Прилетев из Шереметьева, я оказался в аэропорту Gardermoen в пол-двенадцатого по местному времени (лететь 2,5 часа, разница с Москвой - 2 часа).


 Длинное продолговатое здание аэропорта обладает очень внятной организацией передвижения пассажиров, в отличие, скажем, от Шереметьева с его запутанными лабиринтами коридоров между терминалами. Далее, убедившись, что со следующим рейсом на Берген (промежуточная точка на пути к Согндалу, в принципе, необязательная, но не было прямых билетов на тот момент) все в порядке, я оставил вещи в камере хранения и направился непосредственно в город. Flytoget Airport Express Train - аналог московского "аэроэкспресса" - курсирует с интервалом минут 15 между Gardermoen и Осло и является, как говорят, хоть и не самым дешевым, но уж точно весьма комфортным способом добраться от одного пункта до другого.



В частности, меня интересовал центр города - ж/д вокзал Central Station - вторая остановка, сразу после Лиллестрема.


Далее, воспользовавшись наземным переходом, можно сразу добраться до одного из самых известных достопримечательностей Осло - здание оперы (Operahuset).


Это творение современной архитектуры на берегу фьорда Осло (Oslofjord). Продвигаясь к следующей цели по узким улочкам центра города (в которые, тем не менее, умудряется втиснуться трамвай), встречаю улыбчивых женщин-полицейских (конная полиция).


Полиция - не для антуража, а действующая: сам видел, как они разбирались с каким-то бродягой, сидевшим возле магазина. Далее, меня привлекает витрина галереи миниатюрных бутолычек.


Еще пару кварталов и попадаем на площадь Christiania Torv с фонтаном и скульптурой в виде указующего перста, которая увековечила волю короля Кристиана IV отстроить в этом месте город заново после грандиозного пожара в 1624 году.


Оставив по левую руку какой-то парк, один из многих в этом городе, выхожу на открытое пространство - площадь перед мэрией (Rådhusplassen).


Это памятник военно-морскому офицеру Петеру Торденшельду, национальному герою Дании и Норвегии - уникальному человеку, упоминаемому в гимнах обеих стран. Развернувшись на 180 градусов, видим здание самой мэрии (Rådhuset), впрочем, не самое привлекательное с точки зрения общепринятых эстетических норм.


Тем не менее, именно в нем проводится церемония вручения Нобелевской Премии Мира. Напротив мэрии расположился недавно построенный центр Премии, который играет скорее роль музея и в котором проводятся тематические выставки и встречи. 


Огибаем здание мэрии с левой стороны и обнаруживаем на его стене любопытную табличку, посвященную идее нансеновского паспорта (да, знаменитый полярник Фритьоф Нансен был еще и выдающимся филантропом). Оказывается, одними из первых его получателей были наши соотечественники из белой эмиграции. Поэтому в правой части таблички можно видеть надпись на русском языке.


Проходим площадь Ф. Нансена (Fridtjof Nansens plass) и квартал по улице, носящей имя другого знаменитого полярного исследователя Руаля Амундсена. По правую руку оказывается парк Eidsvolls plass с декоративным прудом, который зимой заливается под каток, а в остальное время здесь работает фонтан, на который слетаются жирные чайки (буквально секунды не хватило мне, чтобы запечатлеть одну из них на фоне фонтана прямо между скульптур).


Где-то недалеко располагалось здание парламента, популярное у туристов и фотографов, но, каюсь, на тот момент оно совсем вылетело у меня из головы.
Также в Осло замечаешь наличие велосипедных дорожек, достаточно много велосипедистов и вот таких стоянок велосипедов, которые можно брать напрокат, если у вас имеется специальная карточка, заказываемая по Интернету.


Продолжая прогулку, конечно, я не мог пропустить здание Университета Осло. Забавно, однако, выясняется, что он даже моложе нашего Казанского университета на несколько лет.


Как видно из фотографий, погода была довольно пасмурной, кроме того, прохладной и ветряной. Учитывая, что я был одет легко, решил поворачивать обратно к Central Station. На этом пути привлекло внимание здание главной церкви Осло (Oslo Domkirke).


Палатка с эфиопским флагом у подножия церкви - это вовсе не традиционная часть ансамбля. При ближайшем рассмотрении выяснилось, что в ней демонстративно живут несколько беженцев из этой страны (позже видел, как оттуда вышли две женщины с коляской). Я как бы все понимаю - нищета и войны в родной стране делают жизнь невыносимой, вот только причем тут Норвегия? 
Позволю себе небольшое лирическое отступление, надеясь все же избежать упреков в ксенофобии. Вообще, иммигранты и нелегалы из Сомали, Пакистана уже становятся проблемой для Норвегии. Сами норвежцы в приватных беседах неохотно это признают: большинство иммигрантов не обладают хорошим образованием (обычно они работают в обслуге), плохо встраиваются в общество, вовлекаются в криминал, их дети отказываются ходить в обычные школы. И, судя по всему, наплыв продолжается: женщины в платках на улицах Осло - вовсе не редкость. Конечно, самим норвежцам решать, кого и зачем пускать себе в страну. Однако, замечу, что будет досадно, если такое преуспевающее общество, построенное людьми совершенно определенной идентичности, будет размыто засчет новых порядков, привносимых представителями совсем других, чуждых культур (Ю. Латынина, наверно, оперировала бы здесь еще и понятием failed states, "несостоявшихся государств", в отношении упомянутых). По крайней мере, в этот раз несколько человек независимо подтвердили, что вечером гулять по Осло не совсем безопасно.
Увы, как отмечалось, я пропустил несколько важных достопримечательностей города. Упомяну здесь только всеми рекомендуемый вид, открывающийся с Holmenkollen, и находящийся там же знаменитый трамплин. Тем временем, вернувшись на том же поезде в аэропорт, я дожидался своего рейса Осло-Берген-Согндал. 
Продолжение следует - см. часть 2.

Собираетесь путешествовать? Получите от меня скидку на Airbnb.

Hotellook City.Travel Aviasales.ru


Рекомендую посетить вебсайт интернет-магазина товаров для легковых автомобилей.