тематический указатель:
поисковые
поисковые системы
оптимизация
продвижение
продвижение сайта
контекстная реклама
индексация
поисковики
результат поиска
Назад (Изменения в архитектуре поисковой машины Рамблер) Вперёд (Поисковая система «Апорт»: сегодня и завтра)

Поисковая система «Апорт»: сегодня и завтра

Поисковая система «Апорт»: сегодня и завтра

Михаил Костин, РОЛ, руководитель проекта «Апорт» Особенности индексирования сайтов в Апорте, механизм квотирования. Отношение Апорта к оптимизации и спаму. Аудитория

Апорта. Планы развития

Введение

Для профессионалов в области продвижения сайтов в Интернете поисковые системы представляют интерес с различных точек зрения. Для успешного позиционирования сайта в конкретной поисковой системе необходимо знание некоторых ее технических особенностей, а также понимание того, где эта система проводит грань между оптимизацией и спамом. В то же время, при использовании этой же поисковой системы в качестве площадки для контекстной рекламы важно иметь представление об особенностях ее аудитории.

В данном докладе будут рассмотрены некоторые вопросы, представлющие интерес при использовании для продвижения сайтов поисковой системы Апорт (http://www.aport.ru), а также рассказано о планах ее развития в ближайшем будущем.

Особенности индексации сайтов в Апорте.

Квотирование

Одной из наиболее существенных особенностей Апорта является то, что мы не ставим своей целью соревноваться с другими поисковиками в количестве проиндексированных документов.

Значительная часть страниц в Интернете не представляет никакого интереса для пользователей вообще, или может представлять интерес только в очень редких специфических случаях. Заброшенные сайты, информация на которых безнадежно устарела, наспех сделанные личные страницы, архивы чатов и досок объявлений и т.д., — включение подобных ресурсов в базу данных поисковика приводит лишь к снижению качества поиска. Поэтому представляется целесообразным ограничение индексации по некоторым критериям, учитывающим качество индексируемой информации. Конечно, не существует метода, позволяющего точно определить полезность отдельного взятого документа для пользователей, однако существуют механизмы, позволяющие повысить среднее качество информации в поисковой базе.

Наш принципиальный подход состоит в поиске оптимального компромисса между количеством (от которого зависит полнота результатов поиска) и качеством (влияющим на точность результатов поиска) индексируемой информации. Для реализации этого подхода в Апорте применяется механизм квотирования. Максимальное количество индексируемых страниц с одного сайта определяется квотами, зависящими от индекса цитирования данного сайта. Используются две квоты: на сайт в целом и, отдельно, на динамические страницы (динамическими Апорт считает страницы, содержащие символ «?» в URL). Квота на динамические страницы используется только в случае, когда первая квота (на сайт в целом) не выбрана статическими страницами.

В этом году мы значительно увеличили значения квот для всех категорий сайтов, а также значительно уменьшили разницу в квотах для статических и динамических страниц. От отдельного квотирования динамических страниц мы планируем отказаться вообще, то есть Апорт в скором времени будет индексировать динамические и статические страницы одинаково.

Приведем некоторые примеры размеров квот (отмечу, что эти данные носят ознакомительный характер и их можно использовать только в качестве приблизительного ориентира, настройки квотирования могут быть нами в любой момент изменены). 017.1.gif

Как можно заметить из таблицы, квотирование служит в основном для ограничения индексации сайтов с низким и очень низким индексом цитирования.

Назад (Изменения в архитектуре поисковой машины Рамблер) Вперёд (Поисковая система «Апорт»: сегодня и завтра)
Связаться с нами: info@internet-marketing-theory.ru