ПоискПочтаКалендарьДеньгиМой КругФоткиНародОткрытки
Войти


Чтобы получить доступ ко всем возможностям Я.ру, создайте страницу или , если у вас она уже есть.
userpic

премодерируемый клуб  

Присоединившись к клубу, вы сможете вывешивать фотки в галерее и создавать новые темы для обсуждения. Обсуждаемые темы клуба будут появляться на странице «Что нового».
Вступить в клуб

записи по  

месяцам · меткам · типам

выделить все / снять выделение

Показать
Зебра написала
изменено 27 января, в 13:30
userpic
Семинар Томми Яаккола и Регины Барзилай


31 января в московском офисе Яндекса состоится открытый семинар Томми Яаккола и Регины Барзилай

Томми Яаккола - профессор MIT, один из ведущих специалистов в области машинного обучения. Его работы охватывают очень широкий спектр задач и приложений, включая информационный поиск, биоинформатику, анализ текстов, коллаборативную фильтрацию, обучение с подкреплением (reinforcement learning). Он один из разработчиков и популяризаторов таких подходов как вариационный вывод в графических моделях, метод фишеровских векторов, передача сообщений на деревьях с достижением согласия (tree reweighted message passing), двойственное разложение.

Тема доклада: Масштабирование структурных предсказаний

 

( Тезисы доклада )

Томми расскажет о следующих вещах:

- Использовании структурного предсказания в приложениях, связанных с обработкой естественного языка, компьютерным зрением, вычислительной биологией.

- Использовании методов двойственного разложения в качестве точных алгоритмов предсказания.

- Изучении методов для эффективной оценки моделей структурного предсказания, не требующих решения единой комбинаторной задачи высокой сложности.

 

Регина Барзилай - профессор MIT, один из ведущих специалистов в областях анализа текстов на естественном языке и построения их статистических моделей, моделирования структур текстов, извлечения фактов из веб документов и social media данных. Например, ее последние исследования посвящены анализу текстов (аннотаций) на одном языке с использованием разметки похожих текстов на другом языке, выделению событий и установлению связей между событиями в Твиттере и новостных потоках, определению отношения пользователей к отдельным свойствам товаров по их рецензиям на товары.

Тема доклада: Извлечение информации из социальных медиа

( Тезисы доклада )

Регина расскажет нам о:

- Методах машинного обучения в применении к извлечению информации из сетевого пользовательского контента.

- Рассмотрении набора задач, связанных с извлечением информации, таких как анализ рецензий по составляющим и создание базы событий по твитам.

- Автоматическом построении контентной структуры документа на основе большого потока пользовательского контента с сильным шумом.

-  Об автоматической агрегации содержимого рецензий и извлечении событий из потока сообщений в твиттере.

 

ВНИМАНИЕ! Докладчик будет читать на английском языке.

Зарегистрироваться на семинар можно, написав нам на ya-events@yandex.ru с темой "научный семинар". В теле письма необходимо указать ваши имя, фамилию и место работы/учебы.

Начало мероприятия в 18:00, а подтвердить свою регистрацию вы сможете с 17:30 (лучше подойти к этому времени, чтобы успеть к началу лекции.

Наталия Монахова,
Группа конференций и внешних мероприятий

.
Зебра написала
13 декабря 2011 года, 17:22
userpic
Семинар "On Context-Dependent Bayesian Networks and Their Applications", Irad Ben-Gal

14 декабря в московском офисе Яндекса состоится открытый семинар Ирада Бен-Гала на котором Ирад прочитает две лекции: "On Context-Dependent Bayesian Networks and Their Applications" и "Algorithms of On-line Search for Static or Moving Target".


О лекторе:

Professor Irad Ben-Gal is the head of the IEM program in the Department of Industrial Engineering at Tel Aviv University. His research interests include statistical methods for control and analysis of stochastic processes; applications of information theory and machine learning to industrial and service systems. He holds a B.Sc. (1992) degree from Tel-Aviv University, M.Sc. (1996) and Ph.D. (1998) degrees from Boston University. He wrote and edited five books, published more than 80 scientific papers, patents and book chapters and received several best papers awards. His papers have been published in IIE Transactions, Technometrics, IEEE Transaction, Quality and Reliability Engineering International, Journal of Statistical Planning and Inference, IJPR as well as Bioinformatics and BMC Bioinformatics. 


О чем:


( On Context-Dependent Bayesian Networks and Their Applications )

This talk introduces some generalization of Bayesian Networks (BN). In particular, we consider the Variable Order Bayesian Networks (VOBN) and the Targeted Bayesian Network Learning (TBNL) method. The VOBN allows for flexible position-specific and context-specific dependence structure and, thus, has great flexibility in optimizing under/over fitting effects. The TBNL is a BN learning method designed to best approximate the marginal probability distribution of a predefined target variable, conditioned on other variables over the domain.

Applications of the VOBN and TBNL include pattern classification, clustering and statistical process control in areas such as bioinformatics, financial time series, e-commerce and Telecom. Some of these applications will be discussed.    

       

( Algorithms of On-line Search for Static or Moving Target )

In the talk, we consider problems of search and screening. We present an overview of the main algorithms and approaches to solve such problems for finding static and moving targets in a discrete space. On the basis of Stone procedure and previously suggested informational-search algorithms over graphs, we propose a real-time algorithm of search and path planning for a static or a moving target in a discrete probabilistic space.

The search is conducted by an autonomous mobile agent given an initial probability distribution of the target's location. At each search step the search agent obtains information regarding target's location in the agent's local neighborhood. The suggested algorithm implements a decision-making procedure of a probabilistic local search with estimated global distances. The suggested algorithm finds both static and moving targets efficiently, as well as targets that change their movement patterns during the search. Additional information regarding the target locations, which is unknown at the beginning of the search, can be integrated in the search in real-time. Some applications are cellular paging, traffic planning and quality control.

 

 ВНИМАНИЕ!  Докладчик будет читать на английском языке.


Зарегистрироваться на семинар можно, написав нам на ya-events@yandex.ru с темой "научный семинар". В теле письма необходимо указать ваши имя, фамилию и место работы/учебы.


Начало мероприятия в 19:00, а подтвердить свою регистрацию вы сможете с 18:30 (лучше подойти к этому времени, чтобы успеть к началу лекции.


Наталия Монахова,

Группа конференций и внешних мероприятий

 

.
Зебра написала
6 октября 2011 года, 17:30
userpic
Материалы с семинара RUSSIR Summer School Best Practices. Michael Thelwall, Julia Stoyanovich.

22 августа в рамках семинара RUSSIR Summer School Best Practices, который проходил в Московском офисе Яндекса, мы познакомились с докладом Майка Телволла "Sentiment strength detection for the social web: From YouTube arguments to Twitter praise" и докладом Юлии Стоянович "Making interval-based clustering rank-aware".

Благодарим всех, кто пришел!

Ниже выложены материалы этих лекций (видео и презентации):

 

 


Наталия Монахова,
Группа конференций и внешних мероприятий

.
Зебра написала
5 октября 2011 года, 18:30
userpic
Материалы с семинара RUSSIR Summer School Best Practices. Evangelos Kanoulas, Ben Carterette "Advances in Information Retrieval Evaluation"

22 августа в рамках семинара RUSSIR Summer School Best Practices, который проходил в Московском офисе Яндекса, мы познакомились с докладом Бена Картеретте и Евангелоса Канолуса "Advances in Informational Retrieval Evaluation".

Благодарим всех, кто пришел!

Ниже выложены видеозаписи и презентации этой лекции:

 

Evangelos Kanoulas

 

 

Наталия Монахова,

Группа конференций и внешних мероприятий

.
Зебра написала
3 октября 2011 года, 18:24
userpic
Материалы с семинара RUSSIR Summer School Best Practices.

22 августа в рамках семинара RUSSIR Summer School Best Practices, который проходил в Московском офисе Яндекса, мы познакомились с докладом Фабрицио Сильвестри "Efficient Diversification of Web Search Results" и докладом Раффаэля Перего "Efficient Query Suggestions in the Long Tail".

Благодарим всех, кто пришел!

Ниже выложены видеозаписи и презентации этой лекции:

 

 

 

 
 
С уважением, Монахова Наталия
группа конференций и внешних мероприятий
.
Зебра написала
15 сентября 2011 года, 12:58
userpic
Материалы с семинара RUSSIR Summer School Best Practices. Salvatore Orlando "Beyond Query Suggestions: Recommending Tasks to SE Users"

22 августа в рамках семинара RUSSIR Summer School Best Practices, который проходил в Московском офисе Яндекса, мы познакомились с докладом Сальваторе Орландо "Beyond Query Suggestions: Recommending Tasks to SE Users".

Благодарим всех, кто пришел!

Ниже выложены видеозапись и презентация этого доклада:

Наталия Монахова,
Группа конференций и внешних мероприятий
.
Зебра написала
8 сентября 2011 года, 14:29
userpic
Материалы с семинара "Быстрый динамический анализ программ на примере поиска гонок (data races)", Константин Серебряный

20 мая в московском офисе Яндекса прошел семинар Константина Серебряного "Быстрый динамичекский анализ программ на примере поиска гонок (data races)".

Мы благодарим тех, кто пришел!

Ниже выложена материалы с этого семинара (видео и презентация):

Fasdynamic analysis  Kostya Serebryany

Наталия Монахова,

Группа конференций и внешних мероприятий

.
Зебра написала
7 сентября 2011 года, 14:11
userpic
Материалы с семинара "Adapting Rankers Online", Maarten de Rijke

29 июня в московском офисе Яндекса состоялся семнар Мартина де Райке "Adapting Rankers Online".

Мы благодарим тех, кто пришел!

Ниже выложены материалы с этого семинара (видео и презентация):

Наталия Монахова,
Группа конференций и внешних мероприятий
.
Зебра написала
6 сентября 2011 года, 15:24
userpic
Материалы с семинара "Peer-to-peer search that works", Djoerd Hiemstra

27 апреля 2011 года в московском офисе Яндекса состоялся семинар Дьорда Химстры "Peer-to-peer search that works".

Дьорд остался очень доволен аудиторией и теми вопросами, которые были заданы после лекции.

В свою очередь мы благодарим всех, кто присутствовал на семинаре и задавал интересные вопросы!

Ниже выложены материалы (видео и презентация):





Наталия Монахова,
Группа конференций и внешних мероприятий

.
Зебра написала
5 сентября 2011 года, 17:06
userpic
Материалы с научного семинара "The Optimum Clustering Framework: Implementing the Cluster Hypothesis", Norbert Fuhr

30 марта в московском офисе Яндекса состоялся семинар Норберта Фура "The Optimum Clustering Framework: Implementing the Claster Hypothesis".

Мы благодарим всех, кто пришел.

Ниже выложены материалы с этого семинара (видео и презентация):

Наталия Монахова,
Группа конференций и внешних мероприятий
.
Зебра написала
15 августа 2011 года, 13:01
userpic
Ударное начало учебного года в Яндексе

Каникулы подходят к концу. Мы надеемся, что вы уже успели хорошо отдохнуть и настроены на продуктивный лад.

Предлагаем вам начать учебный год в московском офисе Яндекса чуть раньше сентября и сразу на высокой ноте.

22 и 23 августа в рамках Цикла научных семинаров состоится первая встреча RUSSIR Summer School Best Practices.

На этой встрече у вас будет уникальная возможность послушать лучшие выступления летней школы RUSSIR.

Этот семинар отличается по формату от всех остальных, к которым мы и вы успели привыкнуть: полноценные учебные лекции, которые читаются несколькими преподавателями на различные темы.

Перед вами выступят: Salvatore Orlando, Raffaele Perego, Fabrizio Silvestri, Evangelos Kanoulas, Ben Carterette, Michael Thelwall, Julia Stoyanovich.

Все лекции читаются на английском языке.

Чтобы попасть на любую из лекций, нужно зарегистрироваться. 

 График лекций:

22 августа

16:00-18:00 Salvatore Orlando, Raffaele Perego, Fabrizio Silvestri — Mining query logs to improve web search engines' operations

( Тезисы )High Performance Computing, HPC, is a research group at the ISTI institute in Pisa. One of the main activity of HPC-Lab consists in studying applications of query log mining to search. In the last years several results have been proposed by members of the lab. In this talk we will present three recent results: i) A novel effective and efficient query recommendation method based on the concept of Search Shortcuts; ii) A novel recommendation paradigm based on the concept of user task instead of the well-known concept of user query, and iii) A very efficient result diversification algorithm that is based on results from i) and ii).
 

18:30-20:30 Evangelos Kanoulas, Ben Carterette — Advances in Information Retrieval Evaluation

( Тезисы )There is great interest in producing effectiveness measures that model user behavior in order to better model the utility of a system to its users.  These measures are often formulated as a sum over the product of a discount function of ranks and a gain function mapping relevance assessments to numeric utility values.  We develop a conceptual framework for analyzing such effectiveness measures based on classifying members of this broad family of measures into four distinct families, each of which reflects a different notion of system utility.  This is a theory of model-based measures within which we can hypothesize about the properties that such a measure should have and test those hypotheses against user and system data. 

After presenting a theory, we turn to modeling complex user behavior:  query reformulations.  Real users often begin an interaction with a search engine with a sufficiently under-specified query that they will need to reformulate before they find what they are looking for.  We consider the problem of evaluating retrieval systems over test collections of multi-query sessions. We propose two families of measures: a model-free family that makes no assumption about the user's behavior over a session, and a model-based family with a simple model of user interactions over the session. In both cases we generalize traditional evaluation metrics such as average precision to multi-query session evaluation. We demonstrate the behavior of the proposed metrics by using the new TREC 2010 Session track collection and simulations over the TREC-9 Query track collection.

 
23 августа

18:00-19:00 Michael Thelwall — Sentiment strength detection for the social web: From YouTube arguments to Twitter praise

( Тезисы )This talk will describe simple methods for detecting positive and negative sentiment strength in the informal language that is common in the social web. The Java program SentiStrength will be described, demonstrated and evaluated for English language text. SentiStrength will also be applied to large scale social web text from Twitter and YouTube to show how its results can be used. The talk will explain how SentiStrength is language-neutral but can be adapted to different languages by changing the linguistic input files and some of the algorithm parameters.

 
19:15-20:15 Julia Stoyanovich — Making interval-based clustering rank-aware

( Тезисы )In online applications such as Yahoo! Personals and Trulia.com, users define structured profiles in order to find potentially interesting matches. Typically, profiles are evaluated against large datasets and produce thousands of ranked matches. Highly ranked results tend to be homogeneous, which hinders data exploration. For example, a dating website user who is looking for a partner between 20 and 40 years old, and who sorts the matches by income from higher to lower, will see a large number of matches in their late 30s who hold an MBA degree and work in the financial industry, before seeing any matches in different age groups and walks of life.  An alternative to presenting results in a ranked list is to find clusters in the result space, identified by a combination of attributes that correlate with rank. Such clusters may describe matches between 35 and 40 with an MBA, matches between 25 and 30 who work in the software industry, etc., allowing for data exploration of ranked results.

We refer to the problem of finding such clusters as rank-aware interval-based clustering and argue that it is not addressed by standard clustering algorithms.  We formally define the problem and, to solve it, propose a novel measure of locality, together with a family of clustering quality measures appropriate for this application scenario. These ingredients may be used by a variety of clustering algorithms, and we present BARAC, a particular subspace-clustering algorithm that enables rank-aware interval-based clustering in domains with heterogeneous attributes.  We validate the effectiveness of our approach with a large-scale user study, and perform an extensive experimental evaluation of efficiency, demonstrating that our methods are practical on the large scale.  Our evaluation is performed on large datasets from Yahoo! Personals, a leading online dating site, and on restaurant data from Yahoo! Local.

 
Если у вас есть вопросы к докладчикам, напишите их при регистрации (указав, кому именно они предназначены). Все вопросы будут переданы лекторам, и они обязательно на них ответят в рамках семинара.

Для тех, кто не сумеет лично попасть на лекции, мы организуем онлайн-трансляцию – смотрите её тут. Также мы ждем вопросов  в Twitter по хэштегу #yasmn.

Подтвердить регистрацию и выпить чашечку кофе вы сможете за полчаса до начала лекций.



.
КиМ написало
5 июля 2011 года, 19:26
userpic
Семинар "Интеллектуальные зрительные системы. Опыт научно-исследовательской группы Оклендского университета в Новой Зеландии"

Сегодня открывается регистрация на семинар Георгия Львовича Гимельфарба, который состоится в московском офисе Яндекса 11 июля в 15:00.

Тема доклада: "Интеллектуальные зрительные системы. Опыт научно-исследовательской группы Оклендского университета в Новой Зеландии"

Докладчик: д.т.н. Георгий Львович Гимельфарб, доцент Оклендского университета

Содержание: Георгий Гимельфарб расскажет об итогах работы в области машинной обработки данных и распознавания изображений. Опыт исследователей из Оклендского университета в Новой Зеландии дает решение двух проблем, возникающих в интеллектуальной обработке данных –

1) разделение смешанного распределения вероятностей одномерных сигналов на компоненты, относящиеся к разным классам;

2) статистическое обучение в случае, когда модель сигналов представляет собой пространственно-однородное марковское случайное поле с гиббсовским распределением вероятностей, но неизвестными потенциалами и геометрией взаимодействий между сигналами.

Экспериментальные исследования группы подтверждают практическую значимость полученных теоретических решений.

Зарегистрироваться на мероприятие можно в будние дни с 10:00 до 19:00 по телефону: (495) 739-7000 у Дианы Евсеевой или Наталии Монаховой.

Начало лекции в 15:00, но лучше подойти к 14:30, чтобы подтвердить регистрацию и успеть выпить чашечку кофе.

.
КиМ написало
23 июня 2011 года, 17:02
userpic
Семинар "Adapting Rankers Online", Maarten de Rijke

Сегодня мы открываем регистрацию на семинар Мартена де Рaйкекоторый состоится 29 июня 2011 года  в  московском офисе  Яндекса.

Тема доклада: Adapting Rankers Online.

О чем: At the heart of many effective approaches to the core information retrieval problem - identifying relevant content - lays the following three-fold strategy: obtaining content-based matches, inferring additional ranking criteria and constraints, and combining all of the above so as to arrive at a single ranking of retrieval units.


As retrieval systems become more complex, learning to rank approaches are being developed to automatically tune the parameters for integrating multiple ways of ranking documents. Using online learning to rank approaches, retrieval systems can learn directly from interactions with users, while they are running.  Such systems can continuously adapt to user preferences throughout their lifetime, leading to better search performance in settings where expensive manual tuning is infeasible.

 

Maarten de Rijke about his presentation: «In the talk I will focus on two issues related to online learning to rank. First, I will discuss the issue of balancing exploitation (that is, using what has been learned so far) and exploration (i.e., trying our alternatives so as to learn effectively). Second, present a new method for comparing retrieval functions using implicit feedback. Our method is based on a probabilistic model of such comparisons. Our analytical and experimental results show that our method is more accurate, and more robust to noise than existing methods».


О докладчике: Maarten de Rijke, Full professor Information Processing and Internet (University of Amsterdam), Director Center for Creation, Content and Technology, Director Intelligent Systems Lab Amsterdam.


ВНИМАНИЕ!  Докладчик будет читать на английском языке, но свои вопросы на английском или русском языке вы можете задать уже сегодня.  


Во время семинара будет доступна онлайн-трансляция, которую можно будет посмотреть тут

Регистрация 

Начало мероприятия в 19.00, а подтвердить регистрацию вы можете с 18.30 (лучше подойти к этому времени, чтобы успеть к началу лекции).

 

 

.
КиМ написало
27 мая 2011 года, 13:01
userpic
Летняя школа RuSSIR/EDBT 2011 — продлен срок приема заявок

 

Объединенная летняя школа по информационному поиску и базам данных RuSSIR/EDBT 2011 пройдет 15-19 августа в Санкт-Петербурге.

В этом году у нас отличная программа — лучшие преподаватели, два потока лекций, большая конференция молодых ученых, много грантов для участников и насыщенная культурная программа. Регистрироваться можно до 1 июня. 

 

До встречи на школе!

 

.
КиМ написало
29 апреля 2011 года, 20:08
userpic
Семинар "From Speech Recognition to Audio Search", Dirk Van Compernolle

ВНИМАНИЕ! Уважаемые слушатели!

По независящим от нас причинам семинар  «From Speech Recognition to Audio Search», Dirk Van Compernolle  переносится на другой месяц.

Обновленный анонс с информацией о дате, времени и месте проведения мы опубликуем чуть позже.

Приносим извинения за неудобства!

С уважением,
Группа конференций и мероприятий


11 мая  в московском офисе Яндекса в рамках Цикла научных семинаров выступит Dirk Van Compernolle, эксперт в области технологий распознавания речи.


Тема доклада: From Speech Recognition to Audio Search.

О чем: Web search technology has been a main contributor to the success of the internet.  That a single query may generate millions of hits is sometimes annoying; but despite this seemingly poor result 'searching on the web' has become one of the top daily activities of many people. Capabilities of today's systems are still largely restricted to text based search, while searching via images or audio is still in its infancy.
Dirk Van Compernolle about his presentation: «In this talk we will focus on the problem of audio search and the underlying speech recognition technology.  In the first part of the talk we will review the principles of statistical speech recognition. 
In the second part of the talk we will review some new developments in the speech recognition field that allow for searching audio files with no and/or incomplete transcriptions. This is either achieved by performing the search at an intermediate level (phonetic transcription level) or by doing a search directly at the acoustic level».

О докладчике:
Dirk Van Compernolle is a Professor at the K.U.Leuven where he is teaching on speech recognition; his current research focuses on novel paradigms in speech recognition, most notably the usage of example based techniques.

ВНИМАНИЕ! Докладчик будет читать на английском языке, но свои вопросы на английском или русском языке вы можете задать уже сегодня. 
Во время семинара будет доступна онлайн-трансляция, которую можно будет посмотреть тут.

Начало мероприятия в 18:30, а подтвердить регистрацию вы можете с 18.00 (лучше подойти к этому времени, чтобы успеть к началу лекции).

.
КиМ написало
29 апреля 2011 года, 20:06
userpic
Семинар " Быстрый динамический анализ программ на примере поиска гонок (data races)", Константин Серебряный

20 мая  в московском офисе Яндекса в рамках Цикла научных семинаров выступит Константин Серебряный, кандидат технических наук, ведущий инженер ПО Google Russia.

Тема доклада: Быстрый динамический анализ программ на примере поиска гонок (data races).

О чем: Доклад посвящен динамическому анализу программ и, в частности, поиску гонок (data races). В рамках семинара будут рассмотрены следующие темы:
•    Динамический анализ программ. Введение в теорию поиска гонок. Анализ потока событий программы. Требования по производительности.
•    Базовый алгоритм инструмента ThreadSanitizer. Анализ производительности или почему алгоритм медленный?
•    Ускорение и параллелизация базового алгоритма ThreadSanitizer.
•    War stories: опыт внедрения регулярного тестирования для поиска гонок в Google Russia.

О докладчике:  Константин Серебряный закончил механико-математический факультет Московского государственного университета в 2000 году. Семь лет работал над оптимизирующими компиляторами (4 года в SUN и 3 года в Intel). В 2004 защитил диссертацию на степень кандидата технических наук по теме «Методы высокоуровневой оптимизации циклов». С 2007 года Константин работает в московском отделении Google и занимается динамическим анализом программ, в том числе поиском ошибок многопоточного кода.

Во время семинара будет доступна онлайн-трансляция, которую можно будет посмотреть тут. Ваши вопросы вы можете задать уже сегодня. 

Регистрация 
Начало мероприятия в 18:00, а подтвердить регистрацию вы можете с 17.30 (лучше подойти к этому времени, чтобы успеть к началу лекции).

.
КиМ написало
13 апреля 2011 года, 15:09
userpic
Семинар "Peer-to-peer search that works", Djoerd Hiemstra

Сегодня мы открываем регистрацию на следующий семинар, который состоится  27 апреля  2011 года  в московском офисе Яндекса.

В рамках Цикла научных семинаров выступит Djoerd Hiemstra, эксперт в области использования языковых моделей для информационного поиска, автор множества статей и публикаций на эту тему.

Тема доклада: Peer-to-peer search that works.

О чем: Dr. Djoerd Hiemstra presents a new generation of peer-to-peer search systems inspired by BitTorrent. In his peer-to-peer search approach, each peer is both a search client (a system that submits queries to the network) and a search server (a system that answers queries). Peers that submit a lot of queries, will have to answer a lot of queries as well. Peers may answer queries by providing their own indexed collection, or by caching search results.
Dr. Djoerd Hiemstra about his presentation: «I present simulations that show the effects of search result caching on query load balancing. I also show how the network can learn from the search result snippets without downloading or crawling the documents themselves. Finally, I will show an approach to include results from structured databases and other deep web search sites into the peer-to-peer search network.

О докладчике: Dr. Djoerd Hiemstra is associate professor at the database group of the University of Twente. He wrote an often cited Ph.D. thesis on language models for information retrieval and contributed to over 100 research papers in the field of information retrieval.

ВНИМАНИЕ!  Докладчик будет читать на английском языке, но свои вопросы на английском или русском языке вы можете задать уже сегодня. 
Во время семинара будет доступна онлайн-трансляция, которую можно будет посмотреть тут.

Регистрация
Начало мероприятия в 18:30, а подтвердить регистрацию вы можете с 18.00 (лучше подойти к этому времени, чтобы успеть к началу лекции).

.
КиМ написало
24 марта 2011 года, 16:09
userpic
Стартовала «Интернет-математика 2011»

Тема этого года — обработка и анализ изображений. Данные для конкурса мы сформировали из панорам Яндекс.Карт: «нарезали» серии фотографий с перекрытием, а потом подмешали к ним «лишние». Задача участников — найти картинки, составляющие панораму.

В этом году мы немного изменили правила конкурса: для финальной оценки мы будем использовать набор данных, который станет доступен участникам за сутки до окончания конкурса. Как и раньше, участвовать можно в одиночку или командой, победителя ждет приз. Подробная информация о конкурсе, данные и рейтинг решений — на сайте imat2011.yandex.ru, общение участников — в клубе.

Решайтесь решать!

Павел Браславский

.
КиМ написало
14 марта 2011 года, 18:00
userpic
Семинар "The Optimum Clustering Framework: Implementing the Cluster Hypothesis", Norbert Fuhr

Сегодня мы открываем регистрацию на следующий семинар в рамках цикла «Информационный поиск и анализ данных»
 
30 марта 2011 года в московском офисе Яндекса выступит Norbert Fuhr из Technical University of Darmstadt.
 
Тема доклада: "The Optimum Clustering Framework: Implementing the Cluster Hypothesis". 
 
О докладе
In this talk, we present a theoretic foundation for optimum document clustering. Key idea is to base cluster analysis and evaluation on a set of queries, by defining documents as being similar if they are relevant to the same queries. Three components are essential within our optimum clustering framework, OCF: (1) a set of queries, (2) a probabilistic retrieval method, and (3) a document similarity metric.
After introducing an appropriate validity measure, we define optimum clustering with respect to the estimates of the relevance probability for the query-document pairs under consideration. Moreover, we show that well-known clustering methods are implicitly based on the three components, but that they use heuristic design decisions for some of them. We argue that with our framework, more targeted research for developing better document clustering methods becomes possible. Experimental results demonstrate the potential of our considerations.
 
О докладчике
Norbert Fuhr studied technical computer science and received a PhD (Dr.-Ing.) from the Technical University of Darmstadt, Germany in 1986. He became associate professor at the University of Dortmund in 1991. Since 2002, he is full professor at the University of Duisburg-Essen, Germany. His current research interests are information retrieval models, user interfaces for information systems, and their evaluation.

Задать вопросы докладчику и обсудить заявленную тему вы можете здесь. Трансляцию семинара можно будет посмотреть тут. Докладчик будет читать на английском языке.

Регистрация
Начало мероприятия в 18:30, регистрация будет проходить с 18.00 (лучше подойти к этому времени, чтобы успеть к началу лекции).

.
КиМ написало
11 марта 2011 года, 19:23
userpic
Материалы с семинара "Constructional syntactic analysis for information access tasks", Юсси Карлгрен

16 февраля состоялся семинар Юсси Карлгрена на тему "Constructional syntactic analysis for information access tasks". Он остался очень доволен аудиторией и теми вопросами, которые были заданы после лекции.

В свою очередь мы благодарим всех, кто присутствовал на семинаре и задавал интересные вопросы.

Ниже выложены материалы: видео и презентация.



 
А еще у нас есть для вас новость: теперь вы можете скачать видеоархив и смотреть лекцию со своего смартфона.
.

 

Что получается:    изменить 
Подписаться на комментарии к записи

Получать уведомления о всех ответах в этом обсуждении.

 
Отписаться от комментарев к записи

Получать уведомления только о тех ответах в этом обсуждении, которые адресованы лично вам.

 
К сожалению, комментарий не удалось отправить. Попробуйте ещё раз.я в курсе