Техническая библиотека CITForum.ru CITKIT.ru - все об Open Source Форумы Курилка
Все новости / Все статьи Деловая газета - шквал(!) IT-новостей :: CITCITY.RU
Первая полоса ИТ-Инфраструктура Телекоммуникации Безопасность BI Интеграционные платформы КИС IT-бизнес Ширпотреб Точка зрения

13.12.2017

Новости:


Все новости

Точка зрения

Сураджит Чаудхари высказывается
о том, как интеллектуальный анализ данных привел его к самонастраиваемым базам данных, как он передает технологии, о своей жизни руководителя исследовательских работ, о фрагментации исследований в области баз данных и о многом другом

Добро пожаловать в этот выпуск серии интервью ACM SIGMOD Record с выдающими членами сообщества баз данных. Меня зовут Мэрианн Винслетт, и мы находимся в Стамбуле, месте проведения конференции ICDE в 2007 г. Со мною рядом Сураджит Чаудхари, руководитель исследовательских работ в Microsoft Research. Текущими научными интересами Сураджита являются самонастраивающиеся базы данных, очистка данных и обработка текстовых данных. Сураджит является ACM Fellow, а в 2004 г. получил награду SIGMOD Contributions Award. Степень PhD он получил в Стэнфорде. Добро пожаловать, Сураджит!

Сураджит, Ваша диссертация на соискание степени PhD посвящалась теории баз данных, потом вы переключились на оптимизацию запросов, а впоследствии – на самонастраивающиеся системы баз данных. Почему Вы переключились с теории на практику?

Когда я начал заниматься теорией баз данных в Стэнфорде, мне очень нравилось все, чему я учился как студент сначала Гио Вайдерхолда (Gio Wiederhold), а затем Джеффа Ульмана (Jeff Ullman). Это было очень познавательно, но я понимал, что не смогу стать таким сильным теоретиком в области баз данных, как Джефф Ульман или Мойше Варди (Moshe Vardi). Поэтому я начал приглядываться к более практическим проблемам, и когда я поступил на работу в HP, это требовалось и по роду моей деятельности. Я думаю, что это правильно, поскольку не считаю себя таким умным, как теоретики баз данных.

Это очень лестно для теоретиков баз данных. На самом деле, я не думаю, что в последнее десятилетие в области систем баз данных существовала какая-либо тема, более важная, чем самоуправляемые системы. Что Вы думаете по этому поводу?

Интересно, как я начал заниматься этой темой. В то время на конференциях SIGMOD и VLDB популярной темой был интеллектуальный анализ данных (data mining). Один из вопросов, который возник в ходе моих размышлений на эту тему, состоял в том, каким образом можно оценить решение, основанное на data mining, как показать, что оно действительно хорошее, что оно позволяет «раскопать» высококачественную информацию, которую можно действительно использовать? Мне казалось, что для получения возможности оценки качества подхода к интеллектуальному анализу данных необходимо знание соответствующей предметной области. Единственной предметной областью, которую я знал, была область систем баз данных. Поэтому мне было интересно, как можно применить data mining в контексте систем баз данных. В частности, одно из наших проектных решений состояло в использовании информации о рабочей нагрузке для определения правильной физической схемы базы данных.

Минуточку, это совсем не то, что я ожидала от Вас услышать. Я думала, что Вы скажете, что, поскольку Вы работали в Microsoft, Вы знали, что для сохранения работоспособности системы наибольшая часть общей стоимости владения тратится на администраторов баз данных. Но Ваша мотивация была совсем не такой.

На самом деле, к работе в этой области меня подвигло несколько факторов, и, конечно, в их число входила стоимость администрирования баз данных. Но мне была интересна и техническая работа, выполнявшаяся в области data mining, что, несомненно, побуждало меня к исследованиям в этом направлении. В начале работы я получил громадную пользу от обсуждения возможности автоматического определения физической схемы базы данных с продуктовыми группами, в особенности, с группой SQL Server. Выбор направления физического проектирования баз данных для приложения наших идей, относящихся к data mining, безусловно, стимулировался давлением со стороны группы SQL Server, которой хотелось сделать свои системы самоуправляемыми. Но важную роль сыграла и моя любознательность, поскольку мне очень хотелось увидеть, каким образом технология интеллектуального анализа данных может помочь системам баз данных. Я думаю, что эта область все еще остается не полностью проработанной. Хотя я начинал работу с позиций data mining, наш подход к построению инструмента поддержки физического проектирования баз данных оказался существенно отличным от того, что можно найти в литературе по интеллектуальному анализу данных. Мы уделили основное внимание тому, как наилучшим образом решить проблему физического проектирования баз данных. Разработанные решение и архитектура ничем не похожи на традиционный data mining, хотя мы использовали разные идеи из этой области, такие как идея частых предметных наборов (frequent itemset).

И именно продуктовая группа навела Вас на проблему автоматизации выбора набора полезных индексов?

Все мы знаем, что эффективность выполнения запросов зависит не только от оптимизатора запросов, но и от того, насколько хорошо физически спроектирована база данных. Очень умные люди в сообществе баз данных работают над оптимизацией запросов в течение многих лет. Но физическое проектирование баз данных в значительной степени игнорировалось, несмотря на потенциально огромное влияние физической схемы на эффективность выполнения запросов и операций обновления базы данных. Физическое проектирование баз данных уже являлось хорошо известной проблемой, но исследователи на ней не концентрировались. Мне хотелось попробовать решить эту проблему, хотя она была не новой и в некотором роде не модной.

В течение многих лет Вы являетесь менеджером в Microsoft. Казалось бы, чем выше ты поднимаешься в административной иерархии, тем меньше остается времени на техническую работу. Что бы Вы сказали по этому поводу?

Административная иерархия в Microsoft является на удивление горизонтальной. Это значит, что я не обязан, например, слишком пристально следить за бюджетом. Правда, мне приходится получать санкцию от начальства, чтобы принять на работу нового сотрудника и т.п., но это относительно простой процесс. «Налоги для менеджеров» относительно невелики. Своей горизонтальной организацией и в высшей степени академической атмосферой Microsoft Research в основном обязан Рику Рэшиду (Rick Rashid). Кроме того, я напрямую работаю с исследователями в своей группе. Подразумевается мое техническое участие в исследовательской работе, хотя, конечно, я должен до некоторой степени контролировать как менеджер работу двух групп, за которые я отвечаю. У меня неплохо получается работать с исследователями, наставлять их, помогать им вникать в суть проблем, но, конечно, это сокращает мое собственное время для исследований.

Я считаю опасным слишком сильно отрываться от технической работы, поскольку в исследовательской области для таких менеджеров имеется не так уж много рабочих мест. Так что техническое участие в исследованиях полезно хотя бы из соображений выживания. Если вы действительно желаете заниматься менеджментом, нужно перемещаться в продуктовый мир. Если же вам хочется остаться в мире исследований, то лучше всего иметь в составе своей работы значительный технический компонент. Я стараюсь придерживаться этого подхода.

Вы не указали ни одного плюса работы исследовательского менеджера. Есть ли в ней какие-нибудь плюсы? Вы сказали только то, что минусы этой работы не настолько велики, как можно было бы подумать.

Плюсы состоят в том, что позиция исследовательского менеджера обеспечивает некоторую возможность формировать программу исследований. Во многом подобно профессорам университета, вы должны устанавливать некоторые направления исследований, и, конечно, этот процесс не является строго нисходящим. Часто исследователи приходят к вам с совершенно замечательными идеями, и вы получаете возможность прислушаться к этим идеям и поддержать их. А иногда и у вас может возникнуть идея, и исследовательская группа может ее продумать. Так что у вас имеется возможность продвинуть свою идею несколько дальше, чем если бы у вас не было доступа к некоторым ресурсам. Опыт исследовательского менеджмента может также пригодиться на других возможных путях карьерного роста за пределами исследовательской области.

Вы получили SIGMOD Contributions Award за свою работу над CMT, средством управления заявками докладов на конференциях. Что привело Вас к созданию CMT, и нужна ли эта система сегодня?

Для конференции SIGMOD’1999 я готовил статью про самонастаиваемые гистограммы вместе с Ашрафом Абулнагой (Ashraf Aboulnaga). Моя жена ждала меня на улице в машине, и я сказал ей, что нам нужно отослать статью. Она ждала, пока я напечатаю статью, спущусь на улицу и вскочу в машину, чтобы прорулить в течение 40 минут до офиса FedEx в аэропорту Сиэтла, единственного в округе, работавшего в субботу. И я подумал, насколько это глупо – делать что-то на компьютере, а потом ехать куда-то полчаса, чтобы еще куда-то это отправить! Нам нужно было как-то это исправить!

Такая возможность представилась в том же 1999-м г., когда я был сопредседателем программного комитета конференции ACM KDD. Я воспользовался этой возможностью и запросил разработчиков у своего исполнительного директора по исследованиям Дэна Линга (Dan Ling), чтобы мы смогли создать онлайновое средство управления заявками на конференциях, которое было бы полезно и для Microsoft Research в целом. И по мере продвижения процесса обработки заявок на конференции KDD мы построили базу исходных текстов CMT, которая служила нам в течение многих лет. Впоследствии, когда я был председателем программного комитета на конференции SIGMOD 2006, мы разработали полностью новую базу кода, которая заменила старую версию.

Может ли кто-нибудь с хорошими навыками SQL-программирования и Web-разработки сегодня создать что-либо подобное CMT? Безусловно. Разработка CMT была для меня благоприятной возможностью сделать что-нибудь хорошее для исследовательского сообщества, и, в то же время, понять, во что обходится написание приложения Web-службы, решение эксплуатационных проблем и работа с центром данных в небольшом масштабе. Конечно, создание CMT не являлось исследованием в традиционном смысле, но эта работа позволила мне познакомиться с другими интересными вещами, и я получил от нее удовольствие. Но я не утверждаю, что создал при этом программное обеспечение, которое не мог бы разработать кто-либо другой.

Вы руководите людьми, занимающимися как исследованиями, так и передачей технологий. Как это происходит?

Когда я перешел на работу в Microsoft Research, я сказал Рику Рэшиду, что работал в области систем, и что иногда для разработки системы требуется более одного человека. Он сказал, что если я докажу ему, что некоторая идея является интересной, я смогу нанять одного дополнительного специалиста. Если работа вдвоем окажется более эффективной, и я обнаружу, что нуждаюсь в большем числе людей, и смогу продемонстрировать широту своей идеи, то мы сможем снова поговорить о дополнительных ресурсах.

Я верю в этот подход. Мне нравится модель, в которой мы начинаем с малого, а потом смотрим, добиваемся ли мы успеха. Когда в моей группе появляется какая-то хорошая идея, мы работаем над ней, пока она заслуживает доверия, – не только в исследовательском смысле, но также чтобы убедиться в том, что в ней присутствует определенное здравомыслие, которое делает ее потенциально интересной для продуктовой группы. Затем мы тщательно контактируем с продуктовой группой. Если все складывается удачно, разрабатываем вместе с ними план, и наши исследователи и разработчики работают вместе с ними над созданием продукта (или какого-либо элемента продукта). Например, в случае самоуправляемых систем (продукт AutoAdmin) мы работали напрямую с продуктовой группой над тем, чтобы внедрить результаты наших исследований в области настройки индексов и разработку Database Tuning Advisor в код SQL Server. Эта работа принесла нам истинное удовольствие.

Передача технологии – это хитрое дело, поскольку она влияет на то, что мы говорим исследователям и как мы оцениваем их работу. Я не хочу ставить ее во главу угла и говорить членам своей группы, что я полностью недоволен их работой, если им в чем-то не удалась передача технологии. Иначе они могли бы понять, что даже если они руководствовались не очень хорошей идеей, если их проект свелся к некоторой чистой разработке, то все в порядке, поскольку они все равно получили массу похвал и поощрений за передачу технологии. Другой крайностью было бы стимулировать их увеличивать число публикаций. В этом случае они могли бы довольствоваться работой над небольшими пошаговыми совершенствованиями своих идей, а это вряд ли способствовало бы развитию бизнеса Microsoft. Поэтому я стараюсь балансировать между этими крайностями. Это нелегко; не знаю, есть ли для этого какой-либо готовый рецепт. Я стараюсь следить за здравостью каждой идеи: не является ли какая-то идея слишком уязвимой, обладающей слишком большим числом брешей? Я стараюсь не поддерживать такого рода работы.

Почему этот подход к передаче технологии не является широко распространенным?

Передача технологии не всегда происходит легко, поскольку приходится немного рисковать. Во время аттестации сотрудников я задаю членам своей группы стандартный вопрос: «Если бы по той или иной причине вы не смогли бы работать в Microsoft, то что бы вы делали? Предпочли бы вы заняться преподаванием, или же работали бы в продуктовой группе?» Я очень хочу, чтобы они оставались в моей группе, но этот вопрос с двумя возможными ответами помогает им поразмышлять над тем, что они делают. Некоторым из них хочется убедиться в своей возможности стать преподавателями, и для их очень важно следить за публикациями. С другой стороны, тем, кто предпочел бы пойти в продуктовую группу, стоит получить опыт обеспечения качества кода. Так что имеется сложное соотношение между желаниями отдельного человека и тем, что может дать ему организация. Я не могу ничего сказать относительно того, как обстоят дела в других успешных производственных исследовательских лабораториях, например, в IBM, но я думаю, что здесь требуется сложный баланс, и нужно усердие и терпение, чтобы его достичь. Я прилагаю к этому все усилия.

Делается ли то же самое в других группах Microsoft?

Да, в Microsoft Research при оценке вклада сотрудников учитываются и исследовательские публикации, и передача технологии. Когда мы производим что-нибудь, что можно было бы довести до уровня продукта, я хочу, чтобы об этом можно было написать и статью для какой-либо первоклассной конференции, типа SIGMOD, VLDB и ICDE. Для меня это очень важно.

Я слышала, что 80% Ваших исследователей стажировались в Microsoft перед тем как были приняты на работу. Почему?

Программа стажировки студентов и аспирантов важна не только для нашей группы, но и для всего Microsoft Research, а на самом деле, и для всей Microsoft. Программа стажировки считается настолько важной, что до своей отставки Билл Гейтс обычно летом приглашал стажеров к себе домой. Стажировка позволяет нам привлекать студентов и работать с ними, она дает нам возможность узнать людей, которые в будущем могут стать кандидатами на должности в режиме полной занятости. И стажеры получают возможность узнать, что такое Microsoft Research. Программа стажировки дает нам возможность как оценки студентов, так и привлечения их к работе. А они получают возможность оценить нас и Microsoft в целом как свою возможную долговременную рабочую среду. Так получилось, что, кроме, быть может, одного человека, все исследователи, которых я нанимал на работу, стажировались у нас, по крайней мере, в течение одного лета, а некоторые из них проходили стажировку несколько раз. И я очень этому рад; это придает значительную уверенность при приеме на работу. В дополнение к рекомендательным письмам и спискам публикаций стажировка позволяет понять, как люди будут работать с нами. Конечно, мы стараемся не упускать талантливых ребят, даже если они у нас не стажировались.

Как соотносится число стажеров и новых штатных рабочих мест?

В моей исследовательской группе мы стараемся брать каждый год от 6 до 8 стажеров. Всех их на штатные должности мы принять не можем.

Индия добилась больших успехов в области информационной технологии. Если бы сегодня Вы получили степень бакалавра Computer Science в Индии, что бы Вы сделали дальше? Все равно бы отправились в Стэнфорд?

Я получил громадное удовольствие от времени, проведенного в Стэнфорде, я многое узнал там об исследовательской работе и о жизни. Так что, если бы мне пришлось снова выбирать жизненный путь, вероятно, я бы отправился-таки в Стэнфорд. Но действительно, человеку, заканчивающему сегодня индийское высшее учебное заведение, например, Индийский институт технологии (Indian Institute of Technology, IIT), совсем не обязательно сразу поступать в аспирантуру, поскольку имеется много других альтернатив. Дэвид Девитт (DeWitt) и Джефф Нотон (Jeff Naughton) говорили мне, что Висконсинский университет получает от студентов гораздо меньше заявок, чем обычно. И это потому, что у студентов имеется возможность работать на Google, Microsoft, Yahoo!, IBM, известных в мире системных интеграторов и на другие международные компании в Индии. Кроме того, имеется много местных предприятий, в которых они могут работать. Так что у индийских студентов теперь имеется гораздо больше возможностей, чем раньше. Я думаю, что к нам по-прежнему будут приезжать в аспирантуру очень хорошие студенты из Индии, но в меньшем количестве, чем раньше.

Что Вы думаете о состоянии дел в области оптимизации запросов?

Это одна из моих любимых тем. Время от времени у меня возникает стремление начать новый проект по переделке компонента оптимизации запросов реляционных систем баз данных. Я думаю, что сегодняшняя коммерческая оптимизация запросов невероятно усложнена. Оптимизаторы делают большое дело, обрабатывая запросы, представленные на таком сложном языке, как SQL. Они поразительно хорошо оптимизируют крупные классы запросов и на самом деле полагаются только на декларативную спецификацию запросов. Но мне кажется, что оптимизатор запросов стал уязвимым компонентом СУБД. Часто оптимизаторы работают просто замечательно, но иногда они не могут совладать даже с относительно простыми запросами. Я думаю, что основной проблемой является устойчивость оптимизаторов запросов, и универсальность языка SQL здесь не помогает.

Изменяется и соотношение между временем выполнения и временем оптимизации. Оно не такое, как десять лет назад. Меняется аппаратура. Процессорная мощность становится дешевле. Я думаю, что у нас имеется возможность переосмыслить оптимизацию запросов и изменить соотношение между оптимизацией и выполнением запросов. Достаточно ли я самоуверен, чтобы начать проект в этой области? Подсознательно я всегда об этом думаю. Но в этой области, прежде чем начать какой-то проект, требуется получить озарение. В области оптимизации запросов имеется много очень интересных исследовательских результатов. Например, в некоторых работах предлагаются механизмы динамической обработки запросов, такие как eddy*. Этот подход наводит на многие мысли. Я всегда ищу озарение, которое обеспечит устойчивость оптимизаторов запросов и позволит справиться с их традиционной сложностью. Это чаша Грааля в области оптимизации запросов.

Чем Вы занимались в аспирантуре Стэнфорда?

Сначала я был студентом Гио Вайдерхолда, а потом перешел в Джеффу Ульману, который был научным руководителем моей диссертационной работы. Так что они оба на меня воздействовали, и оба они были хорошими наставниками. Гио научил меня отслеживать широкие проблемы, обладающие большой важностью. Но когда вы сталкиваетесь с трудной исследовательской областью, не всегда очевидно, в чем состоит абстрактная формулировка проблемы. Как аспирант, я испытывал трудности в тех проблемных областях, на которые указывал Гио. Как показывает история, некоторые из них являлись исключительно важными. Например, Гио говорил о посредниках (медиаторах) и об интеграции информации задолго до того, как этой проблемой занялось исследовательское сообщество. Но мне было трудно понять, что должно стать темой моей диссертации, и что конкретно я должен сделать. Это меня пугало. Теперь, когда я стал гораздо старше, я понимаю, что с этой неопределенностью всегда приходится бороться и начинающим, и зрелым исследователям.

С другой стороны, у Джеффа и Мойше я научился тому, что при решении проблемы нужно предельно ясно представлять свою цель. Они научили меня быть очень точным, отделять проблемы от того, что проблемами не является. Не нужно решать проблему в ее наиболее сложной постановке, следует определить, что за проблема решается, а за какую проблему мы не беремся, для какой части проблемы у нас имеется только частичное решение, или оно отсутствует вовсе. Так что я многое приобрел от общения и с Гио, и с Джеффом.

Мне кажется, что имеется утечка мозгов из академии в промышленные исследовательские лаборатории, в которые людей заманивают морковкой в виде возможности доступа к огромным объемам реальных данных.

Я не знаю, имеет ли место огромная утечка мозгов, Вам лучше знать. Я думаю, что это очень интересный вопрос: как можно совместно с академическим миром использовать данные, получаемые индустрией при использовании продуктов и услуг (как в Windows Live, Google или Yahoo!). Я думаю, что если бы мы нашли какой-либо способ такого использования данных, это было бы хорошо для всех, потому что, когда над некоторой темой работает много групп, исследования продвигаются гораздо быстрее. Прямо сейчас у меня нет решений всех проблем, связанных с совместным использованием производственных данных, таких как поддержка конфиденциальности и предотвращение непредусмотренного использования, но мне бы хотелось, чтобы этим кто-нибудь занялся. Мне самому неприятна эта проблема совместного использования данных, хотя и под другим углом. Самоуправляемые базы данных – это очень интересная область, и для университетских исследователей было бы очень полезно получить доступ к реальным рабочим нагрузкам и реальным базам данных, чтобы иметь возможность выполнять исследования. Пока мы не можем сделать это, но я думаю, что в этой области академии и индустрии следует работать вместе.

Когда Вы говорите, что этого сделать нельзя, Вы имеете в виду невозможность доступа к реальным данным внутри Microsoft или вне ее?

Многие люди просят нас предоставить им реальные рабочие нагрузки, дать им реальные базы данных, чтобы они могли, например, разобраться с тем, как можно оценить физические схемы баз данных. Важно иметь возможность оценивать физические схемы не только на искусственных данных, но и на реальных рабочих нагрузках.

И Вы можете получить доступ ко всему этому внутри Microsoft?

Да.

В некоторых компаниях это невозможно даже во внутренних исследовательских подразделениях.

Мы можем использовать наборы данных, к которым явным образом получаем доступ. Не то чтобы мы можем просто зайти в продуктовую группу, попросить у них разрешения поговорить с пользователями и потребовать доступа к их базам данных. Это недопустимо даже для нас. Но даже если мы получаем что-то из этой информации (может быть, ограничиваясь ее частью), у нас нет какого-либо способа совместно ее использовать с кем-то вовне Microsoft. Я думаю, что на пути совместного использования данных с академическими исследователями имеются проблемы, но нужно постараться их решить, поскольку отсутствие этой возможности замедляет исследования и будет еще более замедлять в будущем мире сервисов.

Можете ли Вы что-нибудь посоветовать начинающим исследователям и практикам баз данных или тем из них, кто находится в середине своей карьеры?

Сообщество баз данных сильно изменилось с тех пор, когда я был аспирантом. Мы очень сильно ориентировались на системы. В последнее десятилетие в нашу область влились люди с хорошим знанием алгоритмов и более широким кругом интересов, и они выступают на конференциях SIGMOD и VLDB. Если вы взгляните на последние сборники трудов конференций по базам данных, то увидите изменения характеристик проблем, над которыми мы работаем.

Я думаю, что сейчас стоит обратиться к проблемам, связанным с Web; имеются усугубляющиеся проблемы хранения данных и проблемы обработки запросов, с которыми придется столкнуться при разработке будущих приложений над Web-данными. Web-данные – это совсем не традиционная SQL-ориентированная база данных. Да, я думаю, что при работе с Web-данными пригодится множество идей, накопленных при создании систем баз данных. Поэтому я слежу за этой областью и стараюсь понять, что мы можем сделать.

В более общем смысле, очевидно, что нам нужно идти в ногу со временем и отслеживать новые проблемы. Но меня тревожит то, что в нашем сообществе имеется слишком много разных постановок проблем и слишком мало объединяющих тем. Поэтому у нас отсутствует хорошая оценка прогресса в выполняемых исследованиях. Например, если взглянуть на статьи в областях очистки и анализа данных, то легко видеть, что исследователи (включая меня самого) часто предлагают некоторую новую проблему и приводят ее решение. Это приводит к наличию массы независимых проблем, решаемых в течение года и получающих немного улучшенные решения в следующем году. Мне бы хотелось, чтобы сообщество выделило несколько важных проблем, для решения которых потребовалось бы 5-10 лет работы нескольких исследовательских групп. Так было с оптимизацией запросов и, конечно, с OLTP, но теперь у нас нет такого единства. И у нас не может быть такого единства все время.

Но разве эти пятилетние отчеты не направлены именно на выделение сплачивающих тем?

[Например, см.

Я думаю, что они действительно обеспечивают сплачивающие темы. Например, имеется много проектов на тему интеграции информации, которая в этих отчетах определялась как ключевая область исследований. Хотя я думаю, что и в области интеграции информации имеется слишком много постановок проблем. Вы можете сказать, что такова природа этой проблемы; может быть, это и так, но от этого не легче. Через пять лет мы можем оглянуться и посмотреть, что за сложные проблемы мы решали, и я смогу поднять руку и сказать, что добился некоторого прогресса в такой-то и такой-то конкретной области. И группа из IBM, и группа из Вашего университета сможет сказать что-то похожее. Хотя с точки зрения сообщества будет ощущаться некоторая неудовлетворенность. Но это моя личная точка зрения.

И как это исправить?

Это трудно. У меня нет решения. Мне бы хотелось, чтобы мы работали над этим немного более настойчиво. Возможно, лучше всего было бы, если бы собрались представители нескольких групп и попробовали бы определить объединяющие темы более конкретно. В Лоуеллском и Асиломарском отчетах это делается на очень высоком уровне, и я думаю, что нам следует вернуться к некоторым из широких исследовательских областей, выделенных в этих отчетах, и снизить уровень постановки проблем. Важны и другие аспекты, такие как совместно используемый набор эталонных тестовых наборов.

Так что, например, нам требуется «совещание по интеграции информации», на котором мы могли бы выделить набор важных проблем для исследователей в области интеграции информации.

Какая из Ваших прежних исследовательских работ Вам более всего дорога?

Мне очень нравилась оптимизация запросов, и мне нравится текущая работа по очистке и анализу данных и текста. Но если бы потребовалось выделить что-то одно, то это были бы самоуправляемые системы баз данных. Я был безмерно увлечен этой темой. Как я говорил, я начал совсем с другого – с физического проектирования баз данных, но самоуправляемые системы баз данных, вероятно, остаются моим основным увлечением.

Если бы волшебным образом у Вас образовалось время для дополнительной работы, чем бы Вы занялись?

Вероятно, я немного больше самообразовался бы в области Web-технологии, пописал Web-приложения и постарался бы более внимательно разобраться с системными проблемами. Я и так собираюсь этим заняться, но хотел бы, чтобы на это было больше времени.

Если бы Вы могли изменить что-то одно в себе как исследователе в области computer science, что бы это было?

Когда я был в Стэнфорде, я посещал продвинутые курсы по операционным системам, и многое о них узнал. Работая вместе с Джеффом, я многое понял в области методов, основанных на логике (по крайней мере, на вводном уровне). Но с алгоритмами, в частности, с рандомизирующими алгоритмами я знаком исключительно поверхностно. Мне бы хотелось знать их гораздо глубже. И, как я уже сказал, мне хотелось бы иметь больше времени для создания систем.

Большое Вам спасибо за сегодняшний разговор.

Мне было очень приятно. Спасибо за возможность высказаться.

* Eddy (вихрь, водоворот) – это механизм обработки запросов, непрерывно переупорядочивающий операции в плане запроса по мере его выполнения. Впервые описан в статье Рона Авнура (Ron Avnur) и Джозефа Хеллерстейна (Joseph M. Hellerstein) «Eddies: Continuously Adaptive Query Processing», ACM SIGMOD Record, Volume 29 , Issue 2 (June 2000).



Комментарии

ddragon, Tue Oct 6 15:00:11 2009:
>>Я что-то не понимаю, зачем с такой помпезностью поместили статью с фото этого работника майкрософт?
Не понимаешь ты дивного слова "политкорректность"!
А мне при виде этого улыбающегося азиата - как он с себя умного строит - ржать хочется.
аноним, Tue May 26 07:54:47 2009:
Ну конечно, компьютер изобрел Билл Гейтс, а самый первый язык программирования это Бейсик. А вот Шурика в Майкрософт не возьмут, там Равшан и Джамшут уже все вакансии заняли :)
аноним, Mon May 25 10:13:55 2009:
Шурик, а ты в Микрософт работать иди. Тогда, даже если ты наисследуешь, что Земля круглая, о тебе обязательно напишут, как о первооткрывателе.
Шурик, Sun May 24 18:00:42 2009:
Я что-то не понимаю, зачем с такой помпезностью поместили статью с фото этого работника майкрософт?
Что он конкретно наисследовал в БД? Что они должны быть самонастраиваемые? Офигеть! А я вот понял что программы должны быть самопрогрпммируемые! Давайте пишите обо мне статью с фото!
аноним, Thu May 21 10:50:59 2009:
мда, все коментаторы похоже мега-эксперты в области БД
аноним, Wed May 20 20:41:05 2009:
Похоже, единственным маркетинговым преимуществом концепции Микрософт теперь выбрана цена администрирования. Все ресурсы медиамаркетингового истрибительного аппарата этой гнусной тоталитарной секты теперь будет направлен на продвижение идеи о зажравшихся администраторах БД, которые отбирают последний кусок у бедных торгашей и спекулянтов.
аноним, Wed May 20 16:58:01 2009:
Бред, какие исследования, реляционные базы данных и SQL запросы устрали в своей изначальной концепции, что тут можно копать и называть это иследованиями? Да, можно кое что автоматизировать и включить опции самонастройки и что? Да, оптимизирует работу некого Майкрософт продукта, но особому прогрессу в научном смысле всеравно не приведет.
аноним, Wed May 20 14:03:31 2009:
Ничего умного не узрел. И интервьюируемый и интервьюер ональные рабы Индустрии продажи так называемых ИТ. Т.е., всё их мозговая деятельность направлена на то, чтоб создать и впарить продукт, который был бы потреблён массовым потребителем. Тем более, если речь идёт о Микрософт.
Я_Лично, Wed May 20 13:18:15 2009:
Очепятка в названии статьи - не хватает одного пробела.

А мужик умный. Уважаю.

Комментарии заморожены.

Последние комментарии:

Самое интересное:


© 2004–2009 Проект CITCITY.ru