Close

Яндекс что это такое и как работает – Яндекс — Википедия

Содержание

Яндекс — Википедия

«Я́ндекс» — российская[1][2][3]транснациональная компания, зарегистрированная в Нидерландах и владеющая одноимённой системой поиска в Сети, интернет-порталами и службами в нескольких странах. Наиболее заметное положение занимает на рынках России, Турции, Белоруссии и Казахстана[4].

Поисковая система «Яндекс» является четвёртой среди поисковых систем мира по количеству обрабатываемых поисковых запросов[5] (свыше 6,3 млрд в месяц на начало 2014 года)[6]. По состоянию на сентябрь 2018 года, согласно рейтингу Alexa.com, сайт yandex.ru по популярности занимает 21-е место в мире и 1-е — в России[7][8].

Поисковая система Yandex.ru была официально анонсирована 23 сентября 1997 года и первое время развивалась в рамках компании CompTek International. Как отдельная компания «Яндекс» образовалась в 2000 году. В мае 2011 года Яндекс провёл первичное размещение акций, заработав на этом больше, чем какая-либо из Интернет-компаний со времён IPO-поисковика Google в 2004 году[9][10].

Приоритетное направление компании — разработка поискового механизма, но за годы работы «Яндекс» стал мультипорталом. В 2016 году «Яндекс» предоставлял более 50 служб

[11].

Головной компанией холдинга является зарегистрированное в Нидерландах в 2004 году акционерное общество Yandex N.V.[4][12][13], акции которого обращаются в основном на NASDAQ[4][13][14][15] с более 50 % free float на 2014 год.

В России представлена дочерней компанией ООО «Яндекс», главный офис которой находится в Москве на улице Льва Толстого, дом 16[13][16].

Компания имеет офисы в Санкт-Петербурге[17], Екатеринбурге[18], Новосибирске[19], Нижнем Новгороде[20], Симферополе[21], Казани[22][23], Ростове-на-Дону[24][25], Минске[26][27], Алма-Ате[28], Стамбуле

[29][30], Берлине[31], Люцерне[32], Амстердаме[33] и Шанхае[34][35].

В 1989 году предприниматель и программист Аркадий Волож основал фирму CompTek, продававшую персональные компьютеры и занимавшуюся автоматизацией рабочих мест[36]. Также Волож интересовался алгоритмами обработки данных, и его заинтересовала возможность написания приложения, которое могло бы осуществлять поиск информации в больших объёмах текста, учитывая морфологию языка. Совместно со специалистом по компьютерной лингвистике Аркадием Борковским он основал в 1989 году компанию «Аркадия». После 1990 года сотрудники «Аркадии» написали информационно-поисковые системы «Международная классификация изобретений» и «Классификатор товаров и услуг», которые оказались востребованными в различных НИИ и патентных организациях.

Сотрудники Яндекса в первые годы существования компании

В 1993 году «Аркадию» присоединили к CompTek, в которую ранее пришёл школьный друг Воложа программист Илья Сегалович. В том же году была создана программа для поиска на жёстком диске компьютера. Программу назвали «Yandex», которое придумали Илья Сегалович, директор «Яндекса» по технологиям, и генеральный директор компании — Аркадий Волож. Сегалович выписывал разные производные от слов, описывающих суть технологии. В результате появился вариант «yandex» — Yet ANother inDEXer («ещё один индексатор»)[37].

Сотрудничая с Институтом проблем передачи информации, CompTek создала словарь с поиском, который учитывал морфологию русского языка[38][39]. В 1994 году был создан «Библейский компьютерный справочник»[40].

В 1995 году было принято решение об использовании поискового приложения для сети Интернет. Сначала оно работало с ограниченным числом ресурсов, а позже со всем русскоязычным сегментом Интернета

[39].

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года[41] на выставке Softool. «Яндекс» не был первой поисковой машиной в России: в 1996 году появился «Рамблер», а ещё раньше, в декабре 1995-го, — Altavista, причём последняя имела самый производительный на тот момент сервер и отличалась самой высокой скоростью работы среди конкурентов, обрабатывая миллионы запросов в день. Через два месяца после yandex.ru анонсировали поисковую систему «Апорт» (хотя впервые её продемонстрировали ещё в феврале 1996 года).

К середине 1999 года «Яндекс» был в семёрке популярнейших сайтов рунета; выручка «Яндекса» как отдела CompTek’а в этом году составила 72 тыс. долларов[36].

В апреле 2000 года фонд ru-Net Holdings приобрёл 35,72 % акций «Яндекса» за 5,28 млн долларов. В число акционеров вошли также менеджеры и ведущие разработчики поисковой системы. Генеральным директором стал Аркадий Волож. Компания «Яндекс» вышла из состава CompTek и стала независимой. Материнский холдинг располагался на Кипре, в России же зарегистрирована дочерняя компания в форме общества с ограниченной ответственностью

[13].

В этом же году «Яндекс» первым из российских интернет-бизнесов запустил рекламную кампанию на телевидении, слоган которой, «Найдётся всё!» — стал крылатым выражением[42] и навсегда закрепился на логотипе компании.

В 2001 году объявлен запуск новой версии поисковой машины: улучшился поиск ссылок, стала производиться морфологическая коррекция запроса, введён «взвешенный индекс цитирования» и повысилась точность и скорость поиска[43]. В этом же году «Яндекс» обогнал «Рамблер» и с тех пор держит первое место в российском сегменте Интернета

[44].

В том же 2001 году появляется система контекстной рекламы «Яндекс.Директ». Система быстро стала основным источником прибыли в компании: в 2002 году «Яндекс» выходит на самоокупаемость, а в 2003 году выплачивает акционерам дивиденды, общая сумма которых составила 100 тысяч долларов.

В 2005 году бизнес компании впервые выходит за пределы России — открывается представительство на Украине. Одновременно с открытием филиала в Одессе появляется портал www.yandex.ua. Впоследствии, в 2006 году в Санкт-Петербурге и в 2007 году в Екатеринбурге и Киеве появились офисы разработки[45][46][47], а в 2009 году в Екатеринбурге и в 2010 году в Новосибирске — офисы продаж[48][49]. Кроме того, в 2008 году в Калифорнии была зарегистрирована дочерняя компания «Яндекса» — Yandex Laboratories (Yandex Labs)[50][51]

. В 2008 году была запущена казахстанская версия портала «Яндекса», а в 2010 году — белорусская[52][53]. В том же году компания открыла офис в Казани; главная страница портала, некоторые службы и поиск стали доступны как на русском, так и на татарском языке[54]. Таким образом, возможности поиска в процессе работы с региональными ресурсами постепенно расширились.

В 2007 году происходит реструктуризация Яндекса, и материнской компанией становится нидерландская Yandex N.V.[13]

В том же году состоялось первое крупное поглощение — «Яндексом» была куплена социальная сеть профессионалов «Мой Круг» примерно за 1,5 млн долларов[55]. Крупное приобретение имело целью сделать более социальными прочие службы «Яндекса»; сразу после покупки сайт был перенесён на собственные дата-центры компании[55].

В 2010 году «Яндекс» открыл www.yandex.com — сайт для поиска по зарубежному сегменту Интернета, который также стал тестовой площадкой для обкатки новых дизайнерских и инженерных решений

[56]. Одновременно на обычной версии сайта появилась кнопка «в мировом интернете», возникающая над результатами поиска в случае иноязычного запроса[56]. Индексировать и добавлять в поисковую выдачу сайты на других языках «Яндекс» начал ещё в 2008 году[56]. Обслуживание англоязычного поиска было возложено на калифорнийское отделение Yandex Labs.

24 мая 2011 года состоялся выход «Яндекса» на биржу NASDAQ. В ходе первичного размещения акций «Яндекс» привлёк 1,3 млрд долларов (второй результат за всю историю наблюдений, после Google с его 1,67 млрд долларов). В целом компания была оценена в 8 млрд долларов, что в 500 раз превысило её первоначальную стоимость в 2000 году. Размещение акций планировалось ещё в 2008 году, но было отложено из-за всемирного кризиса. Десятки сотрудников компании стали миллионерами. 3 июня 2014 года акции компании прошли листинг и на Московской бирже

[57].

20 сентября 2011 года «Яндекс» открывает портал в Турции[58]. Поисковая система локализована для турецкоязычного пользователя, учитывает морфологию, понимает синонимы и исправляет опечатки[58]. Полностью локализованы службы Почта, Новости, Перевод, Карты (в том числе Пробки и Панорамы) и другие, есть и уникальные службы. Это первый опыт «Яндекса» в не говорящей на русском стране; для завоевания нового рынка была открыта штаб-квартира с 50 сотрудниками[58].

В 2012 году выходит Яндекс.Браузер. Вскоре программа получает турецкую и украинскую локализации. С версии 1.1 начинается его рекламная кампания на ТВ.

В мае 2012 года в Государственной Думе Российской Федерации появился законопроект, в котором «Яндекс» и «ВКонтакте» признаются стратегическими предприятиями как общенациональные трансляторы информации

[59]. Ещё в 2009 году Президент России Дмитрий Медведев инициировал покупку «Сбербанком» «золотой акции» «Яндекса» с целью избежать попадания предприятия общегосударственной важности в руки иностранцев[60].

В 2012 году офис Yandex Labs в США прекратил своё существование[61].

В том же 2012 году «Яндекс» обогнал «Первый канал» по численности ежедневной аудитории, что сделало российский интернет-гигант лидером отечественного медиарынка[59]. В 2013 году Яндекс подтвердил этот статус, обогнав «Первый канал» по выручке[62].

В феврале 2013 года «Яндекс» оказался впереди «Майкрософта» по числу поисковых запросов, заняв таким образом четвёртое место в рейтинге мировых поисковых систем (после Google, Baidu и Yahoo!). Рост произошёл за счёт российского рынка. В целом «Яндекс» является самым быстрорастущим поисковиком из первой десятки

[63].

В июле 2013 года глава «Яндекса» Аркадий Волож объявил о планах своей компании выйти за пределы Интернета и открытии в будущем служб в других отраслях[64].

В 2013 году в Москве прошли съёмки художественного фильма «Стартап», который рассказывает о том, как создавался «Яндекс». Режиссёром фильма выступил Роман Каримов, а прототипами главных героев послужили Аркадий Волож и Илья Сегалович[65]. В фильме название «Яндекс» не упоминается, а заменено на «Холмс». В 2014 году вышла книга «Яндекс.Книга» за авторством Дмитрия Соколова-Митрича, в которой рассказывается о создании «Яндекса» и развитии компании. Автор много общался с сотрудниками Яндекса для уточнения фактов.

1 сентября 2014 года Аркадий Волож ушёл с поста генерального директора российского сегмента «Яндекса», новым генеральным директором с 1 сентября стал Александр Шульгин. При этом А. Волож остался на посту генерального директора всей компании

[66].

14 августа 2015 года «Яндекс» стал титульным спонсором футбольного клуба «Фенербахче» в чемпионате Турции-2015/16[67], за счёт чего увеличил долю поиска «Яндекса» в Турции с 5 % в июле до 7 % в сентябре 2015 года[68].

В ноябре 2015 года Яндекс разработал собственную технологию прогноза погоды — Метеум. Она позволяет строить прогноз погоды с точностью до дома, благодаря объединению классических моделей метеопрогнозирования и технологий машинного обучения[69]. В том же году появился сервис «Яндекс для медиа», который автоматически составляет новости на основе данных сервисов Яндекса[70].

Летом 2016 года в Яндекс.Браузере появляется персональная лента рекомендаций Яндекс.Дзен. Лента рекомендаций формируется с помощью алгоритмов искусственного интеллекта и рекомендательной технологии Яндекса — Диско

[71][72].

В том же, 2016 году, была открыта просветительская программа «Издательство Яндекса», созданная для развития и поддержки образовательных интернет-проектов в области истории, литературы, языкознания, искусства и философии. Первой инициативой, получившей поддержку издательства, стал проект Михаила Зыгаря «1917. Свободная история»[73][74].

В апреле 2017 года ФАС вынесла решение в пользу Яндекса в споре с компанией Google, который продолжался с 2015 года. Компания обращалась в ФАС с жалобой на то, что Google вынуждает производителей мобильных устройств под управлением Android отказываться от предустановки конкурирующих приложений, в том числе продуктов Яндекса[75][76].

15 мая 2017 года вследствие применения персональных и экономических санкций в отношении физических и юридических лиц, связанных с ситуацией на Украине, был заблокирован доступ к сервисам Яндекс для украинских пользователей. СНБО заявил, что Россия может использовать сервисы Яндекса для планирования наступательных действий на территории Украины. Все счета компании были заблокированы. 29 мая 2017 года Служба безопасности Украины (СБУ) провела обыски в украинских офисах Яндекса в Киеве и Одессе. По информации местного ресурса, обыск проводился на основании статьи «Государственная измена»[77]. В мае 2017 года Яндекс объявил о решении закрыть свои офисы на территории Украины[78][79][80][81][82].

В июле 2017 года Яндекс и Uber подписали соглашение об объединении бизнеса по онлайн-заказу такси в России, Азербайджане, Армении, Белоруссии, Грузии и Казахстане[83][84].

В 2017 году Яндекс совместно с Банком России реализовал проект по маркированию в поисковой выдаче системы Яндекс сайтов микрофинансовых организаций и сайтов субъектов страхового дела, сведения о которых содержатся в соответствующих государственных реестрах[85][86][87].

10 октября 2017 года Яндекс представил своего голосового ассистента «Алиса»[88].

29 мая 2018 года на конференции Yet another Conference компания анонсировала выпуск своего пер

ru.wikipedia.org

Компания Яндекс — Технологии — Что такое Яндекс.Браузер

Браузер — это окно в интернет. Многие держат его открытым целыми днями: мимо него бежит лента новостей, в нём мы наблюдаем за жизнью наших друзей, к нему обращаемся, когда хотим что-то найти. Но интернет не всегда выглядел так, как мы привыкли. Вернее, долгое время он вообще никак не выглядел.

В браузере мы видим не интернет, а Всемирную паутину, или веб. Сам интернет — это инфраструктура, комплекс сетей, в которые объединены компьютеры по всему миру. А веб — способ наглядно представить хранящуюся на них информацию в виде связанных между собой страниц. На этих страницах могут быть текст, картинки, видеоролики, разнообразные кнопки, ссылки и многое другое. Чтобы все эти элементы работали и отображались корректно, страницу нужно открыть в специальной программе. Эта программа и есть браузер.

Немного истории

Прообраз современного веба и, соответственно, первый браузер появились в 1991 году в ЦЕРН — европейской организации по ядерным исследованиям. Один из её сотрудников, Тим Бернерс-Ли, придумал провязать научные документы гиперссылками и решить таким образом проблему поиска информации в огромном архиве института. Первый браузер назывался WorldWideWeb и выглядел примерно вот так.
Браузер WorldWideWeb в 1993 году. Источник — страница Тима Бернерса-Ли на w3.orgТам же, в ЦЕРН, появилась и первая веб-камера. Учёные, у которых была одна кофе-машина на несколько этажей, поставили рядом с ней камеру, которая несколько раз в минуту отправляла фотографии на их компьютеры — всё для того, чтобы можно было, не отрываясь от работы, узнать, есть ли в машине кофе.

В начале 90-х появились не только веб и первые браузеры — тогда же начинали работать первые коммерческие интернет-провайдеры. До этого интернет финансировался правительством и доступ в него был только в больших университетских центрах и военных организациях. Теперь же в сеть мог выйти любой человек с домашнего компьютера.

Интернет стал публичным, а с появлением веба и сравнительно простых в освоении браузеров вроде Mosaic и Netscape Navigator — ещё и наглядным. Из инструмента научного сообщества он постепенно стал превращаться в средство массовой коммуникации, а затем, с ростом аудитории, и в глобальную торгово-развлекательную площадку.


Последняя версия браузера Mosaic, выпущена в 1997 году. Источник — Википедия.

Сегодня сотни миллионов людей ежедневно ищут в сети информацию и новости, слушают музыку и смотрят фильмы, играют, общаются, покупают. Чтобы всё это стало возможным, браузерам пришлось многому научиться. Простейший пример — отображение нескольких страниц в одном окне. Вкладки стали появляться в популярных браузерах только в первой половине 2000-х — теперь же навигацию в сети без них трудно представить.

Из чего сделан Яндекс.Браузер

Первая версия Яндекс.Браузера была выпущена в 2012 году. Создавая его, мы использовали уже существующие наработки. Например, «движок» для нашего браузера мы выбрали такой же, как у Safari и Google Chrome — называется он WebKit. Чтобы объяснить, почему мы выбрали именно его, надо хотя бы в двух словах рассказать, что вообще делает движок.

Если коротко, то он собирает сайты по инструкции — примерно так же, как мы собираем мебель, которая приехала из магазина в нескольких коробках. Страницы сайтов становятся такими, какими мы привыкли их видеть, только на экране компьютера. Пока вы не смотрите на них через браузер, они существуют в виде документов со ссылками на «детали» (например, картинки, которые используются для фона и кнопок) и кодом, который определяет, как их надо соединить. Примерно так в разобранном виде выглядит страница yandex.ru.


Это только маленькая часть кода страницы yandex.ru — целиком он длиннее, чем вся эта статья.

У каждого движка есть свои особенности — именно поэтому один и тот же сайт может немного по-разному выглядеть в разных браузерах. Если создатель сайта не учитывает эти особенности, то какой-нибудь браузер может неправильно понять его инструкции и собрать что-то некрасивое или вообще неработающее. Мы не стали придумывать собственный «движок», чтобы разработчикам сайтов не приходилось адаптировать свои сайты ещё и под него. Вместо этого был выбран популярный WebKit, на который уже ориентируются большинство веб-разработчиков.

У WebKit есть несколько реализаций — наш браузер работает на той, что развивается в проекте Chromium. Им занимаются сразу несколько крупных компаний — причём ко всеобщей выгоде. Если одна компания придумывает какое-то техническое улучшение, от этого выигрывают все (если интересно, почитайте, например, о том, как разработчики Яндекс.Браузера помогли значительно ускорить все программы на основе Chromium). Кроме того, это позволяет совместно продвигать современные веб-стандарты, то есть делать интернет удобнее и безопаснее.

Что делает Яндекс.Браузер особенным

Самый очевидный ответ — это дизайн. С самого начала мы старались сделать так, чтобы интерфейс не был громоздким. Наш идеал браузера — это не просто окно, а «панорамное окно» в интернет: во весь экран и с минимум деталей. Какое-то время мы вообще пробовали сделать прозрачный браузер — этот проект назывался Кусто. Тестирование показало, что далеко не все пользователи готовы к таким переменам, зато некоторые нововведения, вроде анимированных фонов и умной поисковой строки, многим пришлись по душе. В той версии Яндекс.Браузера, над которой мы работаем сейчас, лучшие идеи, опробованные в Кусто, сочетаются с классическими интерфейсными решениями. Теперь наш браузер выглядит вот так.
Это Яндекс.Браузер для Windows. Версии для Mac OS и Linux пока выглядят иначе.

Дизайн — это не только внешний вид, но и практичность. В Яндекс.Браузере есть много незаметных на первый взгляд решений, которые делают его удобным. Например, чтобы увидеть Табло со ссылками на часто посещаемые сайты, необязательно открывать новую вкладку, достаточно нажать на адресную строку. Благодаря этому путь до нужной страницы сокращается на один шаг.

Той же цели — сэкономить время и клики — служит Умная строка нашего браузера. Используя данные Яндекса о популярных поисковых запросах, она может подсказать адрес нужного сайта, даже если вы на нём никогда не были, и предложить перейти на vk.com человеку, который забыл переключить раскладку и успел напечатать «млюс». На некоторые простые вопросы — вроде [курс доллара], [погода в самаре] или [формула объема шара] — Умная строка может ответить самостоятельно, так что пользователю даже не придётся переходить на новую страницу, чтобы получить информацию. Другой пример продуманного дизайна тоже связан с адресной строкой. В мобильной версии Яндекс.Браузера она расположена внизу экрана, а не наверху, как у большинства браузеров, — просто потому что так до неё удобнее дотянуться большим пальцем. Экраны смарфтонов становятся всё больше, а наши пальцы пока не удлиняются, вот и приходится с этим считаться.Ещё одна особенность нашего браузера состоит в том, что он сам ищет для вас интересную информацию. Открыв новую вкладку, вы увидите внизу блок, озаглавленный «Дзен: ваши персональные рекомендации». В нём собираются статьи и видео на темы, которыми вы обычно интересуетесь. Уникальность Дзена в том, что за составление ленты публикаций отвечает машинный интеллект: он собирает их не из тематических RSS-подборок, а со всего интернета — с помощью поисковых технологий Яндекса. Если Дзен заметит, что у вас появились новые интересы, он начнёт учитывать их при составлении ленты.Чтобы пользоваться браузером было комфортно, он должен быть не только красивым и удобным, но и ещё и быстрым и безопасным. За последнее в Яндекс.Браузере отвечает Протект — комплекс технологий, которые берегут пароли, блокируют мошеннические сайты, позволяют без приключений подключаться к публичным сетям Wi-Fi и оплачивать услуги в интернете. Со скоростью помогает режим Турбо. Он автоматически включается при медленном соединении и ускоряет загрузку страниц. Это происходит за счёт уменьшения объёма данных: «тяжёлое» содержимое страницы — обычно это видео и картинки — сжимается на серверах Яндекса и только после этого передаётся пользователю. В результате экономится не только время, но и трафик.Если вам интересно следить за тем, как развивается Яндекс.Браузер, вы можете установить его
бета-версию и участвовать в тестировании новых возможностей Браузера.

yandex.ru

Компания Яндекс — Принципы — Принципы ранжирования поиска Яндекса

Интернет состоит из миллионов сайтов и содержит экзабайты информации. Чтобы люди могли узнать о существовании этой информации и воспользоваться ей, существуют поисковые системы. Они реализуют право человека на доступ к информации — любой информации, которая нужна в данный момент. Поисковая система — это техническое средство, с помощью которого пользователь интернета может найти данные, уже размещенные в сети.

Пользователи ищут в интернете самые разные вещи — от научных работ до эротического контента. Мы считаем, что поисковая система в каждом случае должна показывать подходящие страницы — от статей по определенной теме до сайтов для взрослых. При этом она просто находит ту информацию, которая уже есть в интернете и открыта для всех.

Яндекс не является цензором и не отвечает за содержание других сайтов, которые попадают в поисковый индекс. Об этом было написано в одном из первых документов компании «Лицензия на использование поисковой системы Яндекса», созданном еще в 1997 году, в момент старта www.yandex.ru: «Яндекс индексирует сайты, созданные независимыми людьми и организациями. Мы не отвечаем за качество и содержание страниц, которые вы можете найти при помощи нашей поисковой машины. Нам тоже многое не нравится, однако Яндекс — зеркало Рунета, а не цензор».Информация, которая удаляется из интернета, удаляется и из поискового индекса. Поисковые роботы регулярно обходят уже проиндексированные сайты. Когда они обнаруживают, что какая-то страница больше не существует или закрыта для индексирования, она удаляется и из поиска. Для ускорения этого процесса можно воспользоваться формой «Удалить URL».

В ответ на запрос, который пользователь ввел в поисковой строке, поисковая система показывает ссылки на известные ей страницы, в тексте которых (а также в метатегах или в ссылках на эти сайты) содержатся слова из запроса. В большинстве случаев таких страниц очень много — настолько, что пользователь не сможет просмотреть их все. Поэтому важно не просто найти их, но и упорядочить таким образом, чтобы сверху оказались те, которые лучше всего подходят для ответа на заданный запрос — то есть, наиболее релевантные запросу. Релевантность — это наилучшее соответствие интересам пользователей, ищущих информацию. Релевантность найденных страниц заданному запросу Яндекс определяет полностью автоматически — с помощью сложных формул, учитывающих тысячи свойств запроса и документа. Процесс упорядочивания найденных результатов по их релевантности называется ранжированием. Именно от ранжирования зависит качество поиска — то, насколько поисковая система умеет показать пользователю нужный и ожидаемый результат. Формулы ранжирования строятся также автоматически — с помощью машинного обучения — и постоянно совершенствуются.

Качество поиска — это самый важный аспект для любой поисковой системы. Если она будет плохо искать, люди просто перестанут ей пользоваться.

Поэтому мы не продаем места в результатах поиска.

Поэтому на результаты поиска никак не влияют политические, религиозные и любые другие взгляды сотрудников компании.

Пользователи просматривают страницу результатов поиска сверху вниз. Поэтому Яндекс показывает сверху, среди первых результатов, те документы, которые содержат наиболее подходящие пользователю ответы — то есть наиболее релевантные заданному запросу. Из всех возможных релевантных документов Яндекс всегда старается выбрать наилучший вариант.

С этим принципом связано несколько правил, которые Яндекс применяет к некоторым типам сайтов. Все эти правила работают полностью автоматически, их выполняют алгоритмы, а не люди.

1. Существуют страницы, которые явно ухудшают качество поиска. Они специально созданы с целью обмануть поисковую систему. Для этого, например, на странице размещают невидимый или бессмысленный текст. Или создают дорвеи — промежуточные страницы, которые перенаправляют посетителей на сторонние сайты. Некоторые сайты умеют замещать страницу, с которой перешел пользователь, на какую-нибудь другую. То есть когда пользователь переходит на такой сайт по ссылке из результатов поиска, а потом хочет снова вернуться к ним и посмотреть другие результаты, он видит какой-то другой ресурс.

Такие ресурсы не представляют интереса для пользователей и вводят их в заблуждение — и, соответственно, ухудшают качество поиска. Яндекс автоматически исключает их из поиска или понижает в ранжировании.

2. Бывает, что в том или ином документе есть полезная информация, но воспринимать ее сложно. Например, есть сайты, которые содержат popunder-баннеры (они перемещаются по экрану вслед за прокруткой страницы и закрывают ее содержание, а при попытке закрытия такого баннера открывается новое окно) и clickunder-рекламу (она неожиданно для пользователя открывает рекламную страницу при любом клике по сайту, в том числе — по ссылкам). С нашей точки зрения, оба этих вида рекламы мешают навигации по сайту и нормальному восприятию информации. Поэтому сайты с такой рекламой располагаются в поисковой выдаче ниже, чем сайты, на которых пользователь может найти ответ на свой вопрос без лишних проблем.

3. По запросам, которые не подразумевают явно потребность в эротическом контенте, Яндекс ранжирует сайты для взрослых ниже или вообще не показывает их в результатах поиска. Дело в том, что ресурсы с эротическим контентом часто используют достаточно агрессивные методы продвижения — в частности, они могут появляться в результатах поиска по самым разнообразным запросам. С точки зрения пользователя, который не искал эротики и порнографии, «взрослые» результаты поиска нерелевантны, и, к тому же, могут шокировать. Более подробно об этом принципе можно почитать здесь.

4. Яндекс проверяет индексируемые веб-страницы на наличие вирусов. Если обнаружилось, что сайт заражен, в результатах поиска рядом с ним появляется предупреждающая пометка. При этом зараженные сайты не исключаются из поиска и не понижаются в результатах поиска — может быть, на таком ресурсе находится нужный пользователю ответ, и он все равно захочет туда перейти. Однако Яндекс считает важным предупредить его о возможном риске.

Основная метрика качества поиска Яндекса — это то, насколько пользователю пригодились найденные результаты. Иногда по запросам пользователей невозможно определить, какой ответ ему подойдет. Например, человек, задавший запрос [пушкин], возможно, ищет информацию о поэте, а возможно — о городе. Точно так же человек, который набрал запрос [iphone 4], может быть, хочет почитать отзывы и ищет форумы, а может быть, хочет купить и ищет магазины. Среди первых результатов поиска должны найтись ответы для всех случаев. Поэтому Яндекс старается сделать страницу результатов поиска разнообразной. Поиск Яндекса умеет определять многозначные запросы и показывает разнообразные ответы. Для этого используется технология «Спектр».

yandex.ru

Яндекс (поисковая система) — Википедия

Эта статья — о поисковой системе. Об одноимённой компании см. Яндекс.

«Я̀ндекс» — поисковый движок, принадлежащий российской корпорации «Яндекс», основной продукт компании.

Доля «Яндекс.Поиска» составляет 50,9 % на рынке Рунета (октябрь 2018 года)[2] и 7 % на рынке Турции (по данным на октябрь 2015 года)[3].

Основная информация[править | править код]

Поисковая машина состоит из трёх основных компонентов[4]:

  • Агент — это поисковый робот. Он обходит сеть, скачивает и анализирует документы. В случае обнаружения новой ссылки при анализе сайта она попадает в список веб-адресов робота. Поисковые роботы бывают следующих типов: пауки (англ. Spider) — загружают сайты подобно браузерам пользователя; «путешествующие» пауки (англ. Crawler) — обнаруживают новые, ещё неизвестные ссылки на основе анализа уже известных документов; индексаторы — занимаются анализом обнаруженных веб-страниц и добавляют данные в индекс. Множество выкачанных документов разбивается на непересекающиеся части и очищаются от разметки.
  • Индекс — база данных, собранная роботами-индексаторами поисковых машин. По индексу и осуществляется поиск документов.
  • Поисковый механизм.

Поисковый запрос от пользователя после анализа загруженности поисковой системы отправляется на наименее загруженный сервер[5][6]. Для обеспечения такой возможности серверы «Яндекса» объединены в кластеры и даже кластеры кластеров. Затем пользовательский запрос обрабатывается программой под названием «Метапоиск». Метапоиск осуществляет анализ запроса в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также программа определяет, относится ли запрос к категории наиболее популярных или недавно заданных. Выдача на такие запросы некоторое время хранится в памяти (кэше) метапоиска, и в случае совпадения показываются заранее сохранённые результаты[6]. Если запрос является редким и совпадений в кэше не найдено, система перенаправляет его на программу «Базового поиска». Тот анализирует индекс системы, также разбитый по разным дублирующимся серверам (это ускоряет процедуру). Затем полученная информация снова попадает на метапоиск, данные ранжируются и показываются пользователю в готовом виде[5].

Индексирование[править | править код]

В целом «Яндекс» индексирует следующие типы файлов[7]: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.

Поисковая система способна также индексировать текст внутри объектов Shockwave Flash (если текст не помещен на само изображение), если эти элементы передаются отдельной страницей, имеющей MIME-тип application/x-shockwave-flash, и файлы с расширением .swf[8].

В «Яндексе» работают 2 сканирующих робота — «основной» и «быстрый». Первый отвечает за интернет в целом, второй индексирует сайты с часто меняющейся и обновляемой информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Orange», разработанную совместно калифорнийским и московским подразделениями «Яндекса»[8].

В логах сервера роботы «Яндекса» представляются следующим образом[8][9]:

  • Mozilla/5.0 (compatible; YandexBot/3.0) — основной индексирующий робот.
  • Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector) — робот, определяющий зеркала сайтов. Если найдутся несколько сайтов с одинаковым содержимым, в результатах поиска будет показан только один.
  • Mozilla/5.0 (compatible; YandexImages/3.0) — индексатор «Яндекс. Картинок».
  • Mozilla/5.0 (compatible; YandexVideo/3.0) — индексатор «Яндекс. Видео».
  • Mozilla/5.0 (compatible; YandexMedia/3.0) — робот, индексирующий мультимедийные данные.
  • Mozilla/5.0 (compatible; YandexBlogs/0.99; robot) — робот поиска по блогам, индексирующий комментарии постов.
  • Mozilla/5.0 (compatible; YandexAddurl/2.0) — робот, обращающийся к странице при добавлении её через форму «Добавить URL».
  • Mozilla/5.0 (compatible; YandexFavicons/1.0) — робот, индексирующий иконки сайтов (favicons).
  • Mozilla/5.0 (compatible; YandexDirect/3.0) — робот, индексирующий страницы сайтов, участвующих в «Рекламной сети „Яндекса“» (РСЯ).
  • Mozilla/5.0 (compatible; YandexDirect/2.0; Dyatel) — «простукивалка»[прояснить] «Яндекс. Директа».
  • Mozilla/5.0 (compatible; YandexMetrika/2.0) — робот «Яндекс. Метрики».
  • Mozilla/5.0 (compatible; YandexCatalog/3.0; Dyatel) — «простукивалка» «Яндекс. Каталога».
  • Mozilla/5.0 (compatible; YandexNews/3.0) — индексатор «Яндекс. Новостей».
  • Mozilla/5.0 (compatible; YandexAntivirus/2.0) — антивирусный робот «Яндекса».

С 2009 года «Яндекс» поддерживает технологию Sitemaps[8].

Поисковые запросы[править | править код]

Интерфейс «Яндекса» располагает довольно сложным языком запросов, позволяющим ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Для настройки используются следующие символы-джокеры[10]:

  • "" — точная цитата
  • | — ставится между словами, если нужно найти одно из них
  • * — ставится между словами, если между ними пропущено какое-то слово
  • site: — поиск на определённом сайте
  • date: — поиск документов по дате, например, date:2007
  • + — ставится перед словом, которое обязательно должно присутствовать в документе
  • & — ставится между словами, которые должны встречаться в пределах одного предложения
  • и др.

«Яндекс» автоматически, наряду с оригинальной «точной формой» запроса, ищет его различные вариации и формулировки[11].

Поиск «Яндекса» учитывает морфологию русского языка, поэтому вне зависимости от формы слова в поисковом запросе выдача будет производиться по всем словоформам. Если морфологический анализ нежелателен, можно перед словом поставить восклицательный знак (!) — поиск в этом случае покажет только конкретную форму слова. Кроме того, при поисковом запросе практически не учитываются так называемые стоп-слова, то есть предлоги, знаки препинания, местоимения и т. д., ввиду их большого распространения[4].

Как правило, автоматически раскрываются аббревиатуры, действует транслитерация (например, «Рено — Renault»), исправляется орфография. Также производится поиск по синонимам (мобильный — сотовый) и различным словоформам (Воронеж — воронежский). Расширение или нет исходного пользовательского запроса зависит от контекста. Расширение не происходит при наборе узкоспециальных терминов (к запросу «монтёрская кошка» не будет добавлено слово «кошачий»), имён собственных, названий компаний (к примеру, ОАО «Бегемот» — ОАО «Гиппопотам»), при добавлении слова «цена», в точных цитатах (это запросы, выделяемые машинописными кавычками)[11].

Защита от спама и вирусов[править | править код]

По состоянию на 2013 год «Яндекс» является самой безопасной поисковой машиной на планете и третьим по степени защищённости среди всех веб-ресурсов[12].

Проверка веб-страниц и предупреждение пользователей появились на «Яндексе» в 2009 году: с тех пор на странице результатов поиска рядом с опасным сайтом появляется пометка «Этот сайт может угрожать безопасности вашего компьютера»[13]. Для обнаружения угроз используются сразу две технологии. Первая куплена у американского антивируса «Sophos» и основана на сигнатурном подходе: то есть при обращении к веб-странице антивирусная система обращается к базе данных уже известных вирусов и вредоносных программ. Такой подход отличается высокой скоростью, но практически бессилен перед новыми вирусами, ещё не попавшими в базы данных. Поэтому «Яндекс» использует наряду с сигнатурным ещё и свой собственный антивирусный комплекс, основанный на анализе поведенческого фактора. Программа «Яндекса» при обращении к сайту проверяет, запрашивал ли последний у браузера дополнительные файлы, перенаправлял ли на посторонний ресурс и т. д. Таким образом, если получены данные, что сайт начинает выполнение неких действий (запускаются каскадные таблицы стилей, модули Java Script и полноценные программы) без ведома пользователя, он помещается в «чёрный список» и базу вирусных сигнатур[14]. Информация о заражении сайта появляется в результатах поиска, и через сервис «Яндекс.Вебмастер» соответствующее уведомление получает владелец сайта. После первой проверки «Яндекс» делает вторую, и если информация о заражении во второй раз подтвердится, проверки будут проходить чаще, пока угроза не будет устранена. Общее число заражённых сайтов в базе «Яндекса» не превышает 1 %[13].

Ежедневно в 2013 году «Яндекс» проверяет 23 млн веб-страниц (обнаруживая при этом 4300 опасных сайтов) и показывает пользователям 8 млн предупреждений[14]. Ежемесячно проверяется примерно миллиард сайтов[13].

Поисковая выдача и ранжирование[править | править код]

Поисковая выдача для каждого пользователя формируется индивидуально на основе его местоположения, языковых запросов, интересов и предпочтений по результатам предыдущих и текущей поисковой сессии[15]. Тем не менее, ключевым фактором при ранжировании поисковых результатов является их релевантность, соответствие поисковому запросу. Релевантность определяется на основе формулы ранжирования, которая постоянно обновляется на основе алгоритмов машинного обучения.

Долгое время ключевым фактором ранжирования у «Яндекса» было количество сторонних ссылок на конкретный сайт. Каждой странице в Интернете присваивался своеобразный индекс цитирования, аналогичный индексу для авторов научных статей: чем больше ссылок, тем лучше. Подобный механизм работал как в тИЦ «Яндекса», так и в PageRank поисковой системы Google. Тем не менее, в настоящий момент в целях предотвращения «накрутки» «Яндекс» применяет многофакторный анализ, из восьмисот факторов ранжирования которого на ссылочные приходится лишь 70. Сегодня гораздо бо́льшую роль играет содержание сайта и наличие-отсутствие там ключевых слов, удобство чтения текста, название домена и его история, наличие мультимедийного контента. 5 декабря 2013 года «Яндекс» объявил о полном отказе от учёта ссылочного фактора в будущем[16].

Поиск производится на русском, английском, французском, немецком, украинском, белорусском, татарском, казахском языках.

Поисковая выдача по слову «Наполеон».

Результаты поиска можно отсортировать по релевантности и по дате (кнопки снизу поисковой выдачи).

Страница с результатами поиска состоит из 10 ссылок с короткими аннотациями — «сниппетами». Последний включают в себя текстовый комментарий, ссылку, адрес, популярные разделы сайта, страницы в соцсетях и пр.[17] В качестве альтернативы сниппетам «Яндекс» ввёл в 2014 году новый интерфейс под названием «Острова»[18].

В «Яндексе» реализован механизм «параллельных поисков», когда вместе поиском по вебу производится поиск по сервисам «Яндекса», таким, как Каталог, Новости, Маркет, Энциклопедии, Картинки и др. В результате в ответ на запрос пользователя система выдаёт не только текстовую информацию, но и ссылки на видеофайлы, картинки, словарные статьи и пр.[19].

Отличительной особенностью поисковика являются также технологии «интентного поиска» (от англ. intent — намерение, желание), то есть поиска, нацеленного на решение задачи[20]. Среди элементов такого поиска — наличие диалоговых подсказок при неоднозначном запросе, автоматический перевод текста, показ информации о характеристиках автомобиля и т. д. Для примера, при запросе «Борис Гребенщиков — Город золотой» система покажет форму для онлайн-прослушивания музыки из сервиса «Яндекс.Музыка», при запросе «ул. Королёва,12» будет показан фрагмент карты с отмеченным на ней объектом.

Информационные блоки между строкой запроса и результатами называются «колдунщиками». Полный их список:

Поисковые подсказки[править | править код]

По мере набора пользователем запроса в строке поиска поисковая машина предлагает подсказки в виде ниспадающего списка. Подсказки появляются ещё до перехода на страницу результатов поиска и позволяют уточнить запрос, исправить раскладку или опечатку или перейти сразу на искомый сайт. Для каждого пользователя подсказки формируются в том числе на истории его поисковых запросов (сервис «Мои находки»). В 2012 году появились так называемые «Умные поисковые подсказки», которые моментально выдают информацию об основных константах (длина экватора, скорость света и так далее), пробках на дорогах, и имеют встроенный калькулятор. Кроме того, в «подсказки» встроен переводчик (запрос «любовь по-французски» моментально выдаёт amour, affection), расписание и результаты футбольных матчей, курсы валют, прогноз погоды и другое. Можно узнать точное время запросом «который час». В 2011 году подсказки в поиске «Яндекса» стали полностью локальными для 83 регионов России.

Помимо собственно поиска, подсказки встроены в собственные поисковики «Яндекс. Словарей», «Яндекс. Маркета», «Яндекс. Карт» и других сервисов «Яндекса».

Функция является развитием технологии интентного поиска и впервые появился на «Яндекс.Баре» в августе 2007 года, а в октябре 2008 был внедрён на главной странице поисковика[21]. Доступен как в настольной, так и в мобильной версии сайта. «Яндекс» показывает своим пользователям более миллиарда поисковых подсказок в день[22].

Другое[править | править код]

Первоначальный логотип поисковика.

«Яндекс» предлагает ещё несколько видов поиска:

Летом 2017 года в рамках совместного проекта Банка России и компании Яндекс в поисковой выдаче системы Яндекс появился специальный «маркер» (зеленый кружок с галочкой и надписью «Реестр ЦБ РФ»), информирующий потребителя о том, что на промаркированном сайте предлагаются финансовые услуги компании, которая имеет статус микрофинансовой организации.[23][24][25]

Логотип «Яндекса»[править | править код]

Логотип «Яндекса» может менять свой дизайн в честь некоторых памятных дат, к примеру, 75-летию Владимира Высоцкого был посвящён музыкальный логотип[26].

Информация в этой статье или некоторых её разделах устарела.

Вы можете помочь проекту, обновив её и убрав после этого данный шаблон.

Историю поиска «Яндекса» можно условно разделить на три этапа. До 2005 года поисковые технологии «Яндекса» были эффективными, но достаточно простыми: можно было создать сайт, состоящий из сотен страниц, на которых нет ничего, кроме ключевых слов, и «Яндекс» такой сайт нормально ранжировал. Начиная примерно с 2005 года в Рунете активизировался поисковый спам, и вскоре стало очевидно, что он является реальной угрозой бизнесу компании, могущей за короткий срок свести популярность поискового сервиса на нет. Это привело к тому, что в «Яндексе» всерьёз задумались об улучшении технологий поиска, вложили в это направление много ресурсов. Наконец, с осени 2007 года «Яндекс» уделяет много внимания качеству поиска и проводит научные разработки в области поисковых технологий.[источник не указан 1996 дней]

Изменения в поисковой машине долгое время широко не афишировались и оставались безымянными. И лишь с начала 2008 года, когда было объявлено о запуске алгоритма 8 SP1, «Яндекс» заявил о том, что впредь новые алгоритмы ранжирования будут носить названия городов[27].

1990-е[править | править код]

Дизайн «Яндекса» в декабре 1998 года.

Поисковая система yandex.ru была анонсирована компанией CompTek 23 сентября 1997 года[28] на выставке Softool, хотя отдельные разработки в области поиска (индексация Библии, поиск документов на CD-ROM, поиск по сайту) проводились компанией ещё раньше.

Название системы — «Яндекс», «Яndex», — придумали вместе Аркадий Волож и Илья Сегалович[29].

Слово расшифровывалось как yet another indexer («ещё один индексатор; очередной индексатор») или как «Языковой Индекс». По трактовке Артемия Лебедева, название поисковика созвучно «Яньдекс», где ян — мужское начало[30]. Согласно ещё одной версии, название «Яndex» произошло от слова «Index» путём замены первой буквы[29].

Первый индекс содержал информацию по 5 тыс. серверов и занимал 4,5 ГБ[31].

В том же 1997 году поиск «Яндекса» стал использоваться в русскоязычной версии Internet Explorer 4.0[32]. Стало возможным задавать запрос на естественном языке[33].

В 1998 году появилась функция «найти похожие документы» для каждого результата поиска[34].

«Яндекс. Поиск» по состоянию на 1998 год работал на трёх машинах, работавших на FreeBSD под Apache: одна машина обходила Интернет и индексировала документы, одна машина поисковая и одна машина дублировала поисковую машину[35].

В 1999 году появился поиск в категориях — поиск, сочетание поисковой системы и каталога[36]. Обновлена версия поисковой машины[37].

2000[править | править код]

6 июня 2000 года была представлена вторая версия поисковика[38].

Был внедрён механизм параллельного поиска, когда наряду с выдачей из веба предлагается информация из крупных источников. Пользователи получили возможность ограничить поисковую выдачу выбранной темой. Появилась рубрика «Популярные находки» — слова, уточняющие поиск[39].

К декабрю 2000 года объём проиндексированной информации достиг 355,22 Гб[40].

2001[править | править код

ru.wikipedia.org

Как работает поисковик Яндекс — схемы и описания алгоритмов работы

Мы увеличиваем посещаемость и позиции в выдаче. Вы получаете продажи и платите только за реальный результат, только за целевые переходы из поисковых систем

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подпишись на рассылку и получи книгу в подарок!

Интернет — просто охренеть какая огромная штука. И в нем есть все. Общение с друзьями? Вот, пожалуйста — Facebook. Фотоальбом — в Instagram. Купить дачу? У меня уже есть «Веселый фермер». А энциклопедией давно пользовались? Зачем, ведь есть поисковики, которые знают все. И сегодня мне бы хотелось отдать должное этим чудо-сервисам. А точнее рассказать вам о том, как работает Яндекс поиск.

Помните Гермиону из саги о Гарри Поттере? Как вы думаете: почему она была такой сверхэрудированной всезнайкой? Правильно, потому что постоянно ходила где-то читала про всякие зелья, изучала разные заклинания, допытывалась до учителей по всем непонятным моментам. В общем, делала все, чтобы расширить свою базу знаний. Точно так же работает Яндекс поисковик. Еще до того, как вы задали ему вопрос, он уже кое-что узнал про вашу тему и сохранил себе в копилочку.

 

Как формируется поисковая база Яндекса

Пауки всемирной паутины

Поисковик Яндекс знает несколько триллионов урлов. И каждый день он изучает по паре миллиардов из них. Делают это специальные роботы-пауки, краулеры. Они заходят на страницу, анализируют содержимое, делают копию и отправляют на сервер. А затем уходят по ссылкам на другие страницы. Так происходит знакомство поисковика с сайтом. Далее следует этап индексикации.

Если произвести нехитрые математические расчеты, то можно выявить, что пауки Яндекса обойдут все известные страницы приблизительно за 2 года. Но это будет неверно, так как количество урлов постоянно увеличивается
=> работа по созданию поисковой базы бесконечна.

 

Индексикация

Определение индекса сайта — это процесс добавления всей важной информации о странице в базу поисковика. То есть определяется язык, формируются данные об отдельных словах и вытаскиваются все ссылки исходящие на другие страницы. Кроме того у Yandex есть специальный инструмент, который называется логи Яндекса. Он изучает, как пользователь ведет себя в выдаче: на что кликает, а на что не кликает. Опираясь на все полученные параметры и задается поисковый индекс сайта.

Логи Яндекса широко применяются не только при индексикации, но и при ранжировании.

 

Составление поисковой базы

Поисковые индексы, полученные в ходе предыдущего этапа, отправляются в поисковую базу. У Яндекс поиска она функционирует на программной платформе мапредьюс YT. Здесь данные превращаются файлы и «остаются жить».

Суммарный объем данных YT приблизительно 50 петабайт = 51 200ТБ.

У поисковой базы данных есть еженедельное обновление — апдейт. Это тот момент, когда поисковый робот Яндекса, накачав определенное количество файлов и рассчитав для них все необходимые характеристики, принимает решение, что можно добавить эту информацию в поиск.

Согласно статистическим данным Игоря Ашманова — специалиста по поисковым системам в интернете, полнота поисковой базы у Яндекса (красные на графике) в несколько раз выше, чем у их ближайшего конкурента Google (черные).

Пока индекс — времязатратный и протекает комплексно сразу для большого количества данных. Поэтому у Яндекса есть специальный быстрый контур, который может добавлять и доносить до пользователя отдельные, срочные файлы. Ну, например, новости в реальном времени.

 

Как работает сам Яндекс поиск

Любой запрос в поисковой системе Яндекс проходит по следующей схеме.


 

Балансеры — это машины, которые агрегируют выдачу.
Построение выдачи формируется из результатов трех средних метапоисков. Поясню, что это значит. В выдаче вы видите результаты запроса по страницам, картинкам и видео. Происходит это потому, что ваш запрос проходит по трем разным индексам. И по ним он спускается в самую-самую глубь поисковой базы, разделенную на несколько тысяч кусков. Этот процесс обозначается, как поисковая кластеризация.

Работа поискового кластера состоит из функционирования более миллиона экземпляров различных программ. Они выполняют всяческого рода задачи, у них разные системные требования и всем им нужно где-то «жить». Поэтому поисковая кластеризация занимает еще и огроменное количество компьютерного железного хостинга.

Для хранения и передачи всех программ и данных к ним Яндекс использует внутренний торрент-трекер. Число раздач на нем больше, чем на крупнейшем в мире пиратском трекере The Pirate Bay.

 

Вернемся к результатам выдачи.
В поисковую выдачу попадают наиболее релевантные, соответствующие поисковому запросу документы. Дальше происходит ранжирование — упорядочивание результатов поиска. Проходит оно с помощью специальной формулы. Чтобы порядок результатов каждый раз был качественным, актуальным и максимально релевантным разработчики Яндекса придумали одну очень крутую штуку.

Матрикснет — метод машинного обучения, с помощью которого строится формула ранжирования Яндекс. Он постоянно модернизирует эту схему: выстраивает комбинации, добавляет и убирает факторы, выставляет коэффициенты. Другая важная характеристика этого метода — возможность индивидуальной настройки формулы ранжирования для узкопрофильных категорий запросов. То есть для отдельных запросов, например, про кино или компьютерные игры, можно улучшить качество поиска. При этом ранжирование по остальным классам запросов не ухудшится.

Первая формула ранжирования Яндекса составляла примерно 10 байт. На сегодняшний момент — около 100 мегабайт.

 

Задача поисковика не просто находить иголки в сеновалах, но и определять самые острые из них. И самое удивительное то, как работает Яндекс поиск. Результат выдается за доли секунд. Десять первых наиболее релевантных запросов — как правило, это все, что нужно пользователю. Если в этих запросах мы не находим то, что искали, то мы пробуем или другой запрос, или меняем поисковик. Но рано или поздно: «Найдется все!»

Скриншоты взяты из лекции Петра Попова.

icon by Arthur Shlain

semantica.in

что это такое, как и когда появился

Яндекс.Директ, Яндекс Маркет, Google Adwords, Google Merchant, Ремаркетинг

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подпишись на рассылку и получи книгу в подарок!

Яндекс — это российский инструмент для поиска информации в Интернете, дополненный различными полезными сервисами.

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Например, человек приходит в библиотеку и говорит: хочу прочитать “Мертвые души”. Дайте мне всю информацию. Сначала библиотекарь дает ему все книги Н.В.Гоголя “Мертвые души” в разных редакциях. Если читателю этого недостаточно, то он просматривает публикации, где находит выдержки из “Мертвых душ” или краткое содержание. Если читатель хочет идти дальше — то он может изучить, как Гоголь писал свое произведение, а в конечном итоге в своих поисках может “забрести” настолько далеко, что будет читать о колдунах и воскрешении мертвых. Кроме того, вам предложат прослушать аудио-книги, песни, а также посмотреть фильмы по теме.

Также и пользователь задает поисковику вопрос, к примеру, “новости Воронежа”, и поисковик дает ему поисковую выдачу.

На первой ее странице содержатся самые релевантные веб-документы (наиболее полно отвечающие на запрос). Чем дальше пользователь уходит вглубь страниц, тем более “размытый” ответ он получает.

Яндекс — когда появился и с чего все начиналось

Уже более 20 лет Яндекс является первым конкурентом американского Google в российском сегменте Интернета. Главный офис компании размещается в Москве. Математики А. Волож и И. Сегалович представили миру новый поисковик осенью 1997 года. Ходит легенда о том, что российский поисковик был разработан как копия Google, но на самом деле yandex был запущен в тестирование за год до появления американского конкурента. Параллельное развитие двух ведущих поисковых систем (ПС) — обычное совпадение.

Откуда произошло название

В момент становления системы (1996 год) перед разработчиками стояла задача — придумать броское запоминающееся название, доступное на латинице и на кириллице одновременно. Слово Index (пер. индексация) послужило основой для названия поисковика, которое затем преобразовывалось несколько раз.

  • YANDEX — на латинице «Yet Another iNDEXer», первое название.
  • ЯNDEX — совокупность двух первых букв была заменена на русскую “Я”.
  • Яндекс — в 2008 году латинские буквы были полностью заменены на кириллицу.

В настоящее время Google занимает сегмент объемом около 92% от всех мировых поисковых запросов. В России же несомненным лидером является yandex. ru, которому отдает предпочтение основная часть русскоязычных пользователей Интернета.

Преимущества Яндекс

Это продвинутый поисковик, алгоритмы которого постоянно модифицируются и совершенствуются. Их особенность заключается в качественном методе оценки релевантности запросов конкретной странице.

В настоящее время осуществляется поиск на 5 языках республик бывшего СССР: для России, Белоруссии, Украины, Казахстана, Татарстана. Развивается английский, французский и немецкий сегменты поиска. Результаты выдаются с учетом морфологии и синонимизации слов в предложениях и фразах. Так как алгоритмы постоянно меняются, то специалистам по продвижению сайтов довольно тяжело придерживаться разработанного заранее плана, который модифицируется постоянно вслед за системой.

К примеру, ранее ПС учитывала значительное влияние внешних ссылок при выдаче, а потом заявила об отмене данного алгоритма. Или вес имели длинные тексты, насыщенные ключевыми словами, а в настоящее время за такие тексты можно получить штрафные санкции.

Как работает поисковый алгоритм

Выдача формируется по сложному алгоритму. Нет точных данных, как он в точности работает. Известны лишь некоторые факторы, которые влияют на выдачу. Созданием алгоритма занимается Матрикснет — самообучаемая программа, работу которой все же контролируют люди — асессоры.

Ежеминутно пользователи что-то спрашивают у ПС. Для одного ответа система должна проанализировать миллионы страниц и выдать их по релевантности запросу. Яндексом применяется индекс — база, в которой “лежат” сведения о страницах, найденных поисковым роботом в Сети. База размещается на серверах, объединенных в кластеры.

После получения фразы от пользователя ПС включает «Метапоиск» и анализирует регион, вид запроса, проверяет кэш на наличие ответа. Для популярных запросов кэш предыдущего поиска хранится какое-то время в памяти ПС.

Если ПС не находит ответ, то включается «Базовый поиск», который обращается к индексу. Найденные результаты передаются обратно в «Метапоиск», который их ранжирует по алгоритму «Матрикснета». Результат показывается в выдаче.

Алгоритм ранжирования (соответствия страницы запросу) постоянно обновляется.

Экспертами служат асессоры, которые в соответствии с определенными критериями могут оценивать качество поисковой выдачи. Как правило, асессоры работают с самыми конкурентными поисковыми запросами, анализируя первые 3 страницы выдачи.

Популярные сервисы Яндекс

И здесь ПС в Рунете опережает своего американского конкурента. Помимо качественного поиска система поддерживает ряд интересных и полезных сервисов.

  • Почта — создание и поддержка бесплатных почтовых ящиков.
  • Вебмастер — незаменимый сервис для владельцев сайтов, которые уделяют внимание своему ресурсу. Облегчает работу по поддержке и продвижению веб-проекта.
  • Деньги — система электронной оплаты услуг и товаров, есть связь с банком, оплата по счетам, на карты, ЖКХ, налогов и т.д.
  • Директ — система контекстной рекламы — продажа первых мест в выдаче и на сайтах из рекламной сети по определенным запросам. Отличный инструмент для быстрой раскрутки бизнеса, позволяющий также зарабатывать на своих сайтах.
  • Карты — отображение интерактивных карт на сайтах, проложение маршрутов, установка точек, поиск объектов и многое другое.
  • Метрика — многофункциональный ресурс по сбору статистики сайтов.
  • Диск — облачный сервис, позволяющий хранить данные и отдавать их другим пользователям Яндекс.
  • Такси — вызов такси с ПК, мобильного устройства или телефона.
  • Браузер — своя программа для просмотра веб-страниц.
  • Маркет — портал интернет-магазинов, проверенных ПС, с удобным поиском и сортировкой.
  • Работа — сбор вакансий со всех популярных сервисов по поиску работы.
  • Переводчик — мгновенный переводчик текстов на разные языки.

Мы перечислили далеко не все сервисы российской ПС. Еще есть Погода, Новости, Недвижимость, афиша, Билеты и многое другое.

Слабые стороны — поиск на мобильных устройствах

По статистике, в качестве поисковой системы Google применяется примерно в 71% всех устройств, а Яндекс на 29%, так как американцы используют “серые” методы своего продвижения. К примеру, в Google Android доступ к приложениям российского поисковика затруднен, а Google устанавливается по умолчанию. Поэтому, в связи с жалобой в антимонопольный комитет, в 2016 году на Google был наложен штраф в 6 млн евро, и в ближайшем будущем российские пользователи Android будут выбирать поисковую систему самостоятельно.

Как доказывает yandex.ru ежеминутно — мы не особо то и уникальны. Миллионы людей засыпают поисковик одними и теми же вопросами. Но зато люди непредсказуемы: на то, как запрос формулируется, влияет множество факторов. Поэтому работа ПС сводится к двум задачам: понять, что хочет посетитель, и найти для него необходимую информацию. И российский поисковик справляется с поставленными задачами довольно неплохо.

semantica.in

что это такое и как работает

Каждый из нас знает про такую поисковую систему как Яндекс. Это российская поисковая система, которая зарегистрирована в Нидерландах, имеющая огромное количество сервисов, не только для поиска необходимой информации, но и в качестве различных аналитиков в бизнесе, а так же оказаний услуг.

Что такое сайт Яндекс

Итак, мы уже разобрались, что Яндекс – это всемирноизвестная поисковая система, разработанная российскими специалистами, и входит в одну из крупнейших в мире поисковых систем по масштабной обработке поисковых запросов. Так же, на базе Яндекс есть не только поисковая система, но и сервисы с услугами, такие как Яндекс Такси, Яндекс Еда, Яндекс Транспорт, Переводчик, Работа и многие другие.

Если говорить о Яндексе, как о сервисе-анализаторе для бизнеса – здесь система постоянно совершенствует и обновляется в лице Яндекс Метрики, где внутренние ссылки сайта, которым уделено отдельное внимание сервиса, показываются в одном из разделов в виде окна «внутренние переходы».

Яндекс: история создания компании

История создания компании Яндекс довольна интересная и в отличие от услуги SEO-продвижения, берёт начало с конца прошлого века, когда началась активная разработка поисковой машины.

Вообще, название «Яндекс» пришло далеко не сразу, так как у команды, которая уже к тому времени сформировалась, возникали постоянные разногласия на эту тему. Основными претендентами на место названия корпорации были «Yet Another iNDEXer» или «YANDEX». Думаю, не нужно объяснять, кто оказался фаворитом в данном выборе.

Правда, изначально Яндекс, писался как «ЯNDEX», но в последующем, а именно в 2008 году уже полностью перешёл на кириллицу, и сохраняются по сей день. Конечно, по сравнению с современным дизайном, страничка первоначального варианта браузера кажется несуразной и устаревшей.

По сей день Яндекс постоянно внедряет какие-то то новые дополнения, различные функции, взять хотя бы отчёты по контенту в Яндекс Метрике в которых отображается статистика блога на сайте (если таковой присутствует).

Что такое Яндекс Поиск

Говорить о том, что такое Яндекс Поиск, уже, думаю, нет смысла, потому что эта тема понятна даже для чайников, ведь мы её разобрали. Хочется только отметить, что Яндекс сегодня набирает стремительные обороты, разрабатывая всё новые и новые приложения и сервисы для пользователей, тем самым обретает господство среди своих аналогов.

В спектр функций современной поисковой системы Яндекс входит:

  • Показ курса валют с обновлением на каждый день;
  • Актуальные новости из различных каналов, в том числе Яндекс Дзен;
  • Глубокий аудит своего бизнеса через сервис Яндекс Метрика.

Так же, с помощью приложений Яндекса можно:

  • Ориентироваться в местности с помощью Яндекс Карт;
  • Знать расписание транспорта или заказать такси, используя Яндекс Такси;
  • Заниматься переводом денег и другими различными финансовыми операциями через Яндекс Деньги;

Но сказать, что Яндексом пользуются практически все жители нашей необъятной – ничего не сказать. Как бы не жаловались и пренебрежительно не относились некоторые пользователи к этой поисковой системе – Яндекс во многом пользовался преимуществом перед другими своими конкурентами, включая даже Google. Поэтому услуга раскрутка сайта в Яндексе становится всё более популярной.

pro-promotion.ru

Отправить ответ

avatar
  Подписаться  
Уведомление о