Поиск по сайту


Мероприятия в ЮЗГУ

Киберчемпионат «Высший пилотаж 2.0»

Фото и видео - репортажи с Всероссийского командного киберчемпионата «Высший пилотаж 2.0», прошедшего в ЮЗГУ 12 и 13 мая 2012 года.


Фото ЮЗГУ

Видео ЮЗГУ

«Мисс и мини-мисс ЮЗГУ»

Фото и видео - репортажи с финала традиционного конкурса «Мисс и мини-мисс ЮЗГУ», прошедшего 18 апреля 2012 года.

Фото ЮЗГУ

Видео ЮЗГУ

"Две звезды"

Фото и видео - репортажи с финала традиционного конкурса дуэтов "Две звезды", прошедшего 5 марта 2012 года.

Фото ЮЗГУ

Видео ЮЗГУ



«Архив мероприятий»


Авторизация
Логин:
Пароль:
Забыли свой пароль?

Ресурсы интернета

Матрикснет – новое качество поиска Яндекса

 

Официальная версия этого алгоритма выложена тут

 

Качество поиска

 

Основная задача поисковой системы – дать ответ на вопрос пользователя. Когда пользователь задает запрос, поисковая система не обращается к каждому сайту в интернете, а ищет по базе известных ей страниц – поисковому индексу. Там она находит все страницы со словами из запроса. Ссылки на эти страницы пользователь и видит на страницах результатов поиска.

 

Вот так работает поиск:

 

 

Сейчас вообще уже сложно придумать такой запрос, по которому находится меньше десятка страниц. А по многим запросам результатов поиска - миллионы. И со временем их становится все больше – интернет очень быстро растет. Поэтому поисковой системе уже недостаточно просто показать все страницы со словами из запроса – чтобы найти подходящий ответ, человеку придется листать десятки страниц с результатами поиска. Поисковая система должна расположить найденные страницы в нужном порядке – так, чтобы сверху оказались наиболее подходящие пользователю (наиболее релевантные).

 

Когда пользователь смотрит на найденные результаты, у него возникает ощущение – ему нашли и показали примерно то, что он хотел, или примерно не то. Это ощущение и описывает качество поиска с точки зрения пользователя – то есть насколько полезны оказались найденные результаты. У разных людей – разные ощущения, и их не всегда можно сформулировать четко. Для улучшения качества поиска нужно измерять и учитывать все эти ощущения в совокупности.

 

Упорядочивание результатов поиска в соответствии с запросом пользователя называется ранжированием. Именно ранжирование определяет качество поиска – то есть качество ответа на вопрос, заданный в поисковой строке.

 

Машинное обучение

 

Невозможно написать для поисковой системы программу, в которой предусмотрен каждый запрос, и для каждого запроса известен лучший ответ. Запросов к Яндексу очень много – более 100 миллионов каждый день, и примерно половина из них – неповторяющиеся. Поэтому поисковая система должна уметь принимать решения самостоятельно. Для этого ей нужно уметь обучаться.

 

Задача научить машину обучаться существует не только в поисковых технологиях. Без машинного обучения невозможно, например, распознавать рукописный текст или речь. Термин «машинное обучение» появился еще в 50-х годах. Этот термин обозначает попытку научить компьютер решать задачи, которые легко даются человеку, но формализовать путь их решения сложно. В результате машинного обучения компьютер может демонстрировать поведение, которое в него не было явно заложено.

 

Поисковая система должна научиться строить правило, которое определяет для каждого запроса, какая страница является хорошим ответом на него, а какая – нет. Для этого поисковая машина анализирует свойства веб-страниц и поисковых запросов. У всех страниц есть какие-то признаки. Некоторые из них – статические – связаны с самой страницей, например, количество ссылок на эту страницу в интернете. Некоторые признаки – динамические - связаны одновременно с запросом и страницей – например, присутствие в тексте страницы слов запроса, их количество и расположение. У поискового запроса тоже есть свойства, например, геозависимость - это означает, что для хорошего ответа на этот запрос нужно учитывать регион, из которого он был задан. Свойства запроса и страницы, которые важны для ранжирования и которые можно измерить числами, называются факторами ранжирования. Для точного поиска важно учитывать очень много разных факторов.

 

Разные типы факторов ранжирования:

 

 

Кроме факторов ранжирования поисковой системе необходимы образцы – запросы и страницы, которые люди считают подходящими ответами на эти запросы. Оценкой того, насколько та или иная страница подходит для ответа на тот или иной запрос, занимаются специалисты – асессоры. Они берут поисковые запросы и документы, которые поиск находит по этим запросам, и оценивают, насколько хорошо найденный документ отвечает на заданный запрос. Из запросов и хороших ответов составляется обучающая выборка. Она должна содержать самые разные запросы, причем в тех же пропорциях, в которых их задают пользователи. На обучающей выборке поисковая система устанавливает зависимость между страницами, которые асессоры посчитали релевантными запросам, и свойствами этих страниц. После этого она может подобрать оптимальную формулу ранжирования – которая показывает релевантные запросу сайты среди первых результатов поиска.

 

На примере это выглядит так. Допустим, мы хотим научить машину выбирать самые вкусные яблоки. Асессоры в этом случае получают ящик яблок, пробуют их все и раскладывают на две кучи, вкусные - в одну, невкусные – в другую. Из разных яблок составляется обучающая выборка. Машина пробовать яблоки не может, но она может проанализировать их свойства. Например – какого они размера, какого цвета, сколько сахара содержат, твердые или мягкие, с листиком или без. На обучающей выборке машина учится выбирать самые вкусные яблоки – с оптимальным сочетанием размера, цвета, кислоты и твердости. При этом могут возникать какие-то ошибки. Например, поскольку машина ничего не знает про червяков, среди выбранных яблок могут оказаться червивые. Чтобы ошибок было меньше, нужно учитывать больше признаков яблок.

 

Матрикснет

 

Машинное обучение применяется в поисковых технологиях с начала 2000-х годов. Разные поисковые системы используют разные модели. Одна из проблем, которые возникают при машинном обучении – переобучение. Переобучившаяся машина похожа на студента, который перезанимался – например, прочитал очень много книжек перед экзаменом по психологии. Он мало общается с живыми людьми и пытается объяснить простые поступки слишком сложными моделями поведения. И из-за этого поведение друзей для него всегда неожиданно.

 

Как это выглядит: когда компьютер оперирует большим количеством факторов (в нашем случае это - признаки страниц и запросов), а размер обучающей выборки (оценок асессоров) не очень велик, компьютер начинает искать и находить несуществующие закономерности. Например, среди всех оцененных страниц могут оказаться две с какой-то сложной комбинацией факторов, например, с размером 2 кб, фоном фиолетового цвета и текстом, который начинается на букву «я». И обе эти страницы окажутся релевантными запросу [яблоко]. Компьютер начнет считать эту случайную комбинацию факторов важным признаком релевантности запросу [яблоко]. При этом все важные документы про яблоки, которые такой комбинацией факторов не обладают, покажутся ему менее релевантными.

 

В 2009 году Яндекс внедрил новый метод машинного обучения – Матрикснет. Важная особенность этого метода – в том, что он устойчив к переобучению. Это позволяет учитывать очень много факторов ранжирования – и при этом не увеличивать количество оценок асессоров и не опасаться, что машина найдет несуществующие закономерности.

 

С помощью Матрикснета можно построить очень длинную и сложную формулу ранжирования, которая учитывает множество различных факторов и их комбинаций. Другие методы машинного обучения позволяют либо строить более простые формулы с меньшим количеством факторов, либо нуждаются в большей обучающей выборке. Матрикснет строит формулу с десятками тысяч коэффициентов. Это позволяет сделать существенно более точный поиск.

 

Еще одна важная особенность Матрикснета – в том, что формулу ранжирования можно настраивать отдельно для достаточно узких классов запросов. Например, улучшить качество поиска только по запросам про музыку. При этом ранжирование по остальным классам запросов не ухудшится. Для примера можно представить себе формулу ранжирования в виде сложного механизма с большим количеством ручек. На механизмах, построенных по другим технологиям, каждая ручка влияет на все запросы. Матрикснет дает возможность настроить каждую ручку отдельно для своего класса запросов.

 

Изменение одного параметра в разных формулах ранжирования:

 

 

Кроме того, Матрикснет автоматически выбирает разную чувствительность для разных диапазонов значений факторов ранжирования. Это в чем-то похоже на работу на аэродроме – когда среди постоянного шума взлетающих самолетов нужно слышать и голоса людей. Если заткнуть уши, то самолеты будут слышны, а голоса - нет. Сотрудники аэропорта работают в специальных наушниках, слабо чувствительных к громкому шуму – так можно услышать и самолеты, и голоса людей.

 

Ранжирование

 

Поскольку поисковая система работает с очень большими объемами информации, по каждому запросу ей нужно проверить признаки миллионов страниц, определить их релевантность и соответственно упорядочить. Так, чтобы сверху оказались более подходящие страницы. Чтобы проверить свойства всех страниц по очереди, нужно либо очень много серверов, которые могут быстро обработать информацию обо всех страницах, либо очень много времени – а поиск должен работать быстро, иначе пользователи не дождутся результатов. Матрикснет позволяет проверить очень много факторов за короткое время и без существенного увеличения вычислительных мощностей.

 

Поиск ведется одновременно на тысячах серверов. Каждый сервер ищет по своей части индекса и формирует список самых лучших результатов. В него гарантированно попадают все самые релевантные запросу страницы.

 

Дальше из этих списков составляется один общий, и страницы, попавшие туда, упорядочиваются по формуле ранжирования – той самой длинной и сложной формуле, построенной с помощью Матрикснета, с учетом всех факторов и их комбинаций. Таким образом, наверху поисковой выдачи оказываются все самые релевантные сайты – и пользователь почти мгновенно получает ответ на свой вопрос.

 

Примерно так устроено ранжирование:

 




Загрузка плеера
Приёмная комиссия ЮЗГУ

Загрузка плеера
Видео на YouTube.com.

Загрузка плеера

Университет в фотографиях

  • Информационные ресурсы
  • Объявления
  • Наши партнёры
  • Бланки, заявки
  • Полезные web-сайты
  • Статистика посещений
  • Заголовки новостей

Вниманию всех желающих!

В феврале-марте текущего года совместно с Pearson Test of English на базе регионального Центра тестирования в ЮЗГУ будет проходить I региональный конкурс среди учащихся средних общеобразовательных школ и студентов высших учебных заведений "Enjoy conversation with Pearson Test"!
Целью конкурса является определение уровня владения английским языком учащихся согласно Общеевропейской системе оценки знаний иностранных языков, а также повышение мотивации учащихся к изучению английского языка.

Центр профессиональной подготовки водителей

Центр профессиональной подготовки водителей Юго-Западного государственного университета осуществляет набор на курсы по программе профессиональной подготовки водителей автомобилей категории «В».
Обращаться по адресу: г. Курск, ул. 50 лет Октября, д.94, каб. 111, телефон: 50-48-04

Подробнее...

2 ноября 2011 г. в 15 часов

Приглашаем преподавателей, магистров, аспирантов и докторантов на открытую лекцию и «круглый стол» д.ф.н., ведущего научного сотрудника Института философии РАН
(г. Москва)
Вячеслава Ивановича МОИСЕЕВА
на тему: «Трансдисциплинарные
образы научного знания: феномен транснауки
»

II-ю МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ

23-24 ноября 2011 г. «Юго-Западный государственный университет» (ЮЗГУ) и Курская торгово-промышленная палата проводят II-ю МЕЖДУНАРОДНУЮ КОНФЕРЕНЦИЮ В ОБЛАСТИ ТОВАРОВЕДЕНИЯ И ЭКСПЕРТИЗЫ ТОВАРОВ «ПРОБЛЕМЫ ИДЕНТИФИКАЦИИ, КАЧЕСТВА И КОНКУРЕНТОСПОСОБНОСТИ ПОТРЕБИТЕЛЬСКИХ ТОВАРОВ»

Подробнее...


Юго-Западный государственный университет

Международный сертификат Pearson

SUCCESS IS NEVER AN ACCIDENT!
Центр тестирования Юго-Западного государственного университета (далее ЦТ ЮЗГУ) предоставляет уникальную возможность получить международный сертификат PEARSON! мы являемся первым и единственным в Курской области сертифицированным центром тестирования PEARSON!

Подробнее...


Заявка на ремонт Интернета Заявка на ремонт и обслуживание локальной вычислительной сети ЮЗГУ, организация нового подключения к сети Интернет, устранения неисправности доступа к сети Интернет.


Заявка на ремонт компьютеров Заявка на
ремонт и обслуживание оргтехники подразделения ЮЗГУ:
ремонт и обслуживание ПЭВМ,
ремонт и обслуживание монитора,
диагностика ПЭВМ,
установка программного обеспечения на ПЭВМ

(В службу ТО ЭВМ ЦНИТ Управления информатизации)



Заказ печатей/штампов ЮЗГУ
Учет и хранение подлинников разрешительных документов ЮЗГУ (лицензии, свидетельства, разрешения, сертификаты и т.д.) 
Бланк письма ЮЗГУ
Бланк приказа ЮЗГУ
Бланк распоряжения ЮЗГУ
Письмо (расположение реквизитов адресата на конверте)


Бланки ЮЗГУ
Индивидуальный план работы преподавателя на 20**-20** учебный год, Индивидуальный учебный график.
Титульные листы
Курсовая работа (проект), Выпускная квалификационная работа бакалавра, Дипломная работа (проект), Магистерская диссертация.
Бланки заданий на ...
Курсовую работу (проект), Выпускную квалификационную работу бакалавра, Дипломную работу (проект).
Отзыв, Рецензия.

Высшая аттестационная комиссия Министерства образования и науки Российской Федерации

KURSK.SU - один из первых доменов в городе Курске

KURSK.RU - географический домен города Курска (собственность ЮЗГУ)

ФПОКО - Федерация профсоюзных организаций Курской области

Смотрим хорошие сайты

А знаете ли вы что...
Слово «инженер» впервые фиксируется в 1170 году, когда английский город Дарем нанял себе в качестве архитектора некоего Ricardus ingeniator, то есть "Ричарда выдумывателя".

Местонахождение посетителей
Статистика по странам
C 21 янв 2012 по 19 фев 2012

Russian Federation (RU) 29,469
Ukraine (UA) 726
United States (US) 431
Kazakstan (KZ) 350
Belarus (BY) 273
Netherlands (NL) 197
Moldova, Republic of (MD) 69
Germany (DE) 53
France (FR) 50
Belgium (BE) 45
Uzbekistan (UZ) 34
Kyrgyzstan (KG) 32
Azerbaijan (AZ) 30
Ecuador (EC) 28
Malaysia (MY) 26
Taiwan (TW) 25
Bulgaria (BG) 23
Latvia (LV) 22
United Kingdom (GB) 21
Israel (IL) 20
Ghana (GH) 19
Poland (PL) 16
Armenia (AM) 15
Europe (EU) 15
Myanmar (MM) 15
Pakistan (PK) 13
Finland (FI) 13
Nigeria (NG) 13
Jordan (JO) 10



Яндекс.Метрика

18 Мая 2012  День открытых дверей в ЮЗГУ - 27 мая 2012 года
18 Мая 2012  Мир студента, или ЮЗГУ – второй дом.
16 Мая 2012  Визит делегации ЮЗГУ в СумГУ
15 Мая 2012  Центральная Юго-Западная лига КВН
12 Мая 2012  Чемпионат по компьютерному спорту Counter Strike 1.6
11 Мая 2012  Хотим продолжить обучение!
10 Мая 2012  Тепловские высоты – вахта памяти в эфире
7 Мая 2012  Пресс-конференция по «Skype»
27 Апреля 2012  Влияние исторических процессов на развитие российской науки
25 Апреля 2012  IV Международная научно-методическая конференция
14 Апреля 2012  Региональная конференция-презентация Всероссийского молодежного проекта GEROY 21 в ЮЗГУ
23 Марта 2012  Межвузовская олимпиада в ЮЗГУ
23 Марта 2012  Партнерство: Взаимопонимание с США.
20 Марта 2012  Наш студент – лучший тяжелоатлет мира!
13 Марта 2012  Как ЦТРС зиму провожал
11 Марта 2012  Студенты ЮЗГУ приняли участие в выставке
7 Марта 2012  Фестиваль Юго-Западной лиги КВН
5 Марта 2012  Студентка ЮЗГУ стала победительницей в номинации "Краса Курского края"
5 Марта 2012  Международная образовательная выставка в Мадриде.
1 Марта 2012  Вокальный проект «Две звезды» - 2012
29 Февраля 2012  Конкурс Минобрнауки России среди молодых учёных
25 Февраля 2012  «Политех» – сильный соперник
22 Февраля 2012   Юго-Западная лига КВН начинает сезон 2012 года.
21 Февраля 2012  Проводы зимы
20 Февраля 2012  А вам - слабо? Конкурс дуэтов «Две звезды».
20 Февраля 2012  90 лет со дня рождения Е.В. Ковалёнка
17 Февраля 2012  По итогам Всероссийского конкурса "Инженер года"
16 Февраля 2012  19 февраля - День открытых дверей университета (День абитуриента)
14 Февраля 2012  Отслужи весной!
10 Февраля 2012  Новое направление подготовки "История"
10 Февраля 2012  Доступ к электронным базам зарубежных издательств.
10 Февраля 2012  Поздравляем победителя конкурса
10 Февраля 2012  С будущими строителями - за чашкой чая
10 Февраля 2012  Университетская библиотека онлайн
23 Января 2012  КОНКУРСЫ ДЛЯ МОЛОДЫХ УЧЕНЫХ И СТУДЕНТОВ
16 Января 2012  Юные вундеркинды сделали шаг в физику
21 Декабря 2011  «Expopriority - 2011»
21 Декабря 2011  Юрист - слуга правосудия
15 Декабря 2011  20-летие образования юридического факультета
15 Декабря 2011  На лекции соучредителя «Apple» Стива Возняка
15 Декабря 2011  Внимание: разыскиваются сильные парни!
15 Декабря 2011  Было сложно "журить"...
13 Декабря 2011  Ученые обсудили инновационный потенциал общества
9 Декабря 2011  Приглашаем на Региональный семинар-тренинг
9 Декабря 2011  Форум ректоров ведущих российских и итальянских вузов
8 Декабря 2011  ЮЗГУ приглашает на Международную научно-практическую конференцию
6 Декабря 2011  «Мир один на всех»
29 Ноября 2011  Осенний марафон
29 Ноября 2011  Семинар в Казахстане
27 Ноября 2011  В ЮЗГУ состоялся День открытых дверей

Администратор сайта
Администратор сайта
Графики сайта

Hits
9852208
22789

Hosts
872026
1073

Visitors
637959
1354
5

 

Обо всех неисправностях сайта
просьба сообщать на
E-mail: webkstu@gmail.com

Rambler's Top100

<img id="bxid_309836" src="/bitrix/images/fileman/htmledit2/php.gif" border="0"/> <img id="bxid_495170" src="/bitrix/images/fileman/htmledit2/php.gif" border="0"/> <img id="bxid_73277" src="/bitrix/images/fileman/htmledit2/php.gif" border="0"/> <img id="bxid_1826" src="/bitrix/images/fileman/htmledit2/php.gif" border="0"/> Матрикснет – новое качество поиска Яндекса