Ниша дмитрия крюкова дмитрий крюков биография :: Большая библиотека биографий

Ниша дмитрия крюкова дмитрий крюков биография


Узнай как бросить сейчас! ПОКА НЕ ПОЗДНО..
Читать далее >>


Чтобы похудеть на 9 кг за 7 дней, нужно раз в день...
Читать далее >>


Уже через 3 дня вкус алкоголя станет отвратительным!
Читать далее >>


Ниша Дмитрия Крюкова,

Что делать программисту в России? Уехать за кордон, уйти в бизнес… А можно хорошо подумать, забить нишу в Интернете – и стать №1. Дмитрий Крюков подумал…прошел год – и его Twin Peaks гордо возвышается над остальной российской Сетью… Именно 8 октября, в день первой годовщины «Рэмблера» (http://www. rambler. ru) – и свой день рождения его создатель покинул логово в дальнем Подмосковье, чтобы добраться до офиса «Планеты».

«В прошлом году, когда мы собрались на мой юбилей, решили, что это будет и день рождения «Рэмблера», потому что я запустил его за два дня до этого.»

-Ваша роль в этом деле?

««Рэмблер» – проект компании «Стек», коей я являюсь совладельцем. Мы занимаемся сервис-провайдерством на юге московской области. Серпухов, Подольск. Моя основная работа в компании – я системный администратор, руководитель всех сетевых служб. У нас достаточно большая уже сеть, покрывает несколько районов.…

«Ситуация была следующей. Бизнес, конечно, идет, но не теми шагами, которые мы хотели. Мы участвуем во многих грантовых проектов – и по одному из грантов летом прошлого года приезжали американские специалисты и проанализировали нашу работу и выдали целый талмуд рекомендаций, какой мы дложны видеть нашу компанию к 2001 году. Мне, в частности, говорилось, что мы должны сделать больший крен в сторону информационных услуг, в отличие от технических, которые преобладали на 98%. Стали чесать репу. Смысл был следующий: проблемы русификации существуют. Пока эти огромные монстры отсканируют наше пространство, пройдут годы, десятки лет. Я до сих пор нахожу ссылки на свой старый сайт, который давно уже не существует. Если ты заранее ограничиваешь территориально себя, ты имеешь большую мобильность, хотя, как показывает опыт, с бурным ростом Интернета у нас эта мобильность теряется. У меня сейчас цикл обхода сайтов составляет два месяца, три месяца. А как будет на следующем проходе – вообще сказать не могу…

«В подчинении у меня был всего один человек. Когда народу много, силы распыляются, и качество страдает. Решил: ничего не остается, как самому. И вот, к осени разразился первым пробным вариантом – он дорабатывается до сих пор.»

-Тяжело ли написать поисковую систему?

«Вопрос, конечно интересный. Прежде, чем начинать чего-то писать, нужно проанализировать, что есть. Оказывается, из свободно доступного, нет ничего, за исключением Harvest. Достаточно неплохая поделка для студентов, но сделана с расчетом, что у тебя миллионы ресурсов, что в наших условиях неприемлемо. Поэтому пришлось отказаться. Я поизучал способы, как они строят эти системы. Была альтернатива: либо это система управления базами данных (СУБД), либо – специализированная система. Оценив быстроту работы различных вещей, я решил, что это все-таки должна быть специализированная система. У нее есть все атрибуты СУБД, за исключением того, что она не может быть универсальной, она может быть применима только к Паутине, к HTML и к текстовым неструктурированным документам.

«Ох, я никому не пожелаю, если кто-нибудь захочет создать нечто подобное, я скажу: трижды-четырежды задумайтесь, прежде чем делать. Во-первых, дело действительно очень трудоемкое. Я работаю с 10 утра и до двух-трех. Сейчас уже легче, но нужно отдавать себе отчет, что написанием дело не кончается– почему я говорю, что нужно 10 раз подумать, делать это или нет. Технические аспекты реализации в России очень будут сильно влиять. Мы до сих пор приучены на писюках работать и не знаем, что такое достаточно серьезные машины.

-А насколько серьезные машины в вашем распоряжении?

«Средней серьезности. Учитывая, что мы не являемся богатой компанией, я строил распределенную систему – не из одной машины, их там пять у меня. Каждая несет свои функции. Среди них две «Альфы» 260 МГц. Одну нам подарил консорциум, в рамках которого мы выполняли одну из работ, одну мы пробрели сами… Она пришла нам из Америки с Windows NT, в наших условиях мне пришлось загрузить на нее юниксоподобную систему, но не родной диджиталовский, потому что за него надо платить достаточно дорого, а Linux.

«А дальше – разработка этой прикладной системы – она пишется стандартными средствами на языке Си. Для того, чтобы система была работоспособной, требуется, чтобы отдельно работала поисковая часть, а накопительная – отдельно – на одной машине, иначе ни одна машина не справится с двумя такими задачами. Они соединены по сети, взаимодействуют друг с другом. Третья выполняет роль WWW-выдачи имиджей, а четвертая – она уже собственно к поисковой системе не имеет отношения, это счетчики.»

-«Рэмблер» состоит из поисковой системы и Top 100…

Это вещи достаточно независимые, хотя в ближайшем будущем – у меня сейчас один программист работает над созданием классификатора, но мы не хотим делать как все, тем более сущестуют такие гранды, как Yahoo, – а хотим увязать, чтобы он был грамотно иерархически построен, но в то же время был бы увязан с Top 100.»

-От подобия AltaVista вы эволюционируете в сторону Yahoo?

«Ну да. Хотя в результате это будет некий конгломерат того и другого.»

-Кто это финансировал?

«Целиком финансировала все наша компания. Более того, она продолжает этим заниматься. Сейчас наступил момент, когда мы из того, что получаем, можем выплатить зарплату, и чуть-чуть остается на амортизацию железок. Н

О о прибыли вообще пока речи не идет.»

-А популярность бешеная…

«Это верно. Но рекламодатель пока активно не идет. Ну что такое 2000 баксов в месяц?»

Но, тем не менее, вы заняли очень хорошую нишу, которая заработает, если люди станут вкладывать деньги.

«Совершенно верно. Наша компания идет на расходы, подразумевая, что если такое время придет, – еще год назад мы об этом говорили с моим компаньоном, исполнительным директором Сергеем Лысаковым, – я ему сказал: «Это должно сюда прийти, поэтому давай спокойно пойдем на эти траты. На худой конец, у нас останется вариант^ кому-нибудь спокойно ее продать. Этот вариант все время существует – и нам предлагают. Цена, правда, не такая, как мы хотели, тем более мы и не собираемся продавать. Поэтому мы смотрим в будущее с достаточным оптимизмом.»

-Теперь вопрос сугубо личный и практический: прав ли я в выборе поисковых систем? Практически все – через AltaVista, для некоторых вещей – Yahoo… При том, что Top 100 я пользуюсь очень активно. В чем я проигрываю, когда не ищу Рэмблером?

«По любому поисковому слову я скажу, в чем вы проигрываете, а в чем выигрываете. Если вы ставите себе задачу сделать достаточно изощренный запрос – с языком, которым обладает AltaVista, это, безусловно, вне конкуренции. Здесь мы никак не можем с ними конкурировать. Если вас интересует запрос попроще, но по сочетанию многих русских слов, то здесь, вообще говоря, мы выигрываем, потому что имеем больше русских документов. На сегодняшний день – 1.6 млн. русских документов. Насколько я знаю, у AltaVista – 30 миллионов по всему миру. Нельзя сказать, что Россия является тридцатой частью всего Интернета. Дай бог, чтобы она сотой являлась. Это показатель, что количество документов у меня должно быть больше. Здесь вы проиграете.»

Результаты теста по самой заезженной в русской Сети группе: на запрос «Аквариум & Гребенщиков»: AltaVista выдала 69 ссылок в Windows-1251 плюс 35 в КОИ, «Рэмблер» – 404 во всех кодировках…

-Вы хотите сказать, что русские ресурсы индексируются у вас больше, чем у AltaVista?

«Безусловно.»

-А какие еще тонкости с русским?

«Ну мы-то русские люди. Мы хорошо знаем беспорядок, который хранится вокруг кодировок. Существует два сайта, один – только Windows, другой – только КОИ. Как же с них собирает AltaVista? Когда вы вводите запрос, вы должны написать сначала в кодировке Windows – найдете документы с одного сайта. Потом – еще раз написать в КОИ-8 – найдете документы с другого сайта. У нас же – одним запросом вы получаете весь список, но с указанием: этот документ – в КОИ-8, этот – в Windows.»

-А падежные флексии?

«Тут существуют разные подходы. Некоторые российские поисковые системы – «Апорт», «Яndex»– они упорно эту технологию двигают. Возможно, мы тоже сделаем такую штуку – но, могу пояснить свое отношение. Человеку неинтересно, если он извлечет 80000 ссылок – он все равно по ним не пройдет. А такая вещь объективно тому способствует. У них получится 80000 ссылок там, где у меня получится 5000 – но люди довольны и моими 5000 ссылок, потому что они отражают то, что они хотели. Тем не менее, сделав маленький реверанс в их сторону, мы воплотили у себя использование метасимволов: Если вы в конце слова поставили звездочку – значит, произвольное продолжение. Это отчасти компенсирует их «шел-ходил» и. т.д. Пока в этом направлении я двигаться не очень хочу, и так документов слишком много появляется. Моя главная задача, чтобы он как можно точнее находил. Не как можно больше, а как можно точнее.»

-Перейдем к Top100… Какой был бы рейтинг поисковой системы Рэмблер, если бы она участвовала в Rambler Top100?

«Я даже не стал ставить себе скрытый счетчик. Я все равно могу это оценить по логам… Первый, разумеется! На машине, на которой крутятся счетчики, в день происходит 500000 хитов. Из них счетных – 300000, 200000 – заходы, ну и картинки. Где-то в районе 100000 реальных посетителей. Если самые ведущие, «Анекдоты» Димы Вернера получают 12000-15000, то можно себе представить. Почти что порядок разницы. Ну это естественно: все же приходят смотреть.

« Поисковая система была сделана, но известности у нее пока нет. Внимание надо привлечь. А внимание надо привлечь прежде всего к имени. Остальное приходит само, если все сделано правильно и хорошо. Когда становится известно имя Rambler, люди начинают интересоваться, а что он еще может. «А вот, он может искать.» – «А давай посмотрим, чего он ищет.» – «Да ничего, достаточно неплохо ищет». И сделали себе закладочку. И где-то в начале весны, когда технические аспекты поисковой системы были решены, а запал остался, поизучав опыт зарубежных коллег, я обнаружил WebsideStory: http://www. websidestory. com. – и подумал: «Вообще говоря, вещь неплохая. Это прототип».

«Мы заведомо сказали: ограничиваемся Россией, странами Содружества и зарубежными сайтами, которые имеют отношение к России.