Слайд 1Упорядочивание и поиск (в Интернете) информации
Слайд 2Задание на коллоквиум 11 декабря. Составление аналитической подборки
Цели: 1) отработать навыки по поиску информации в Интернете; продемонстрировать умение систематически ее обработать и представить. 2) составить представление о сюжетах, занимающих (российское?) научное сообщество в области, наиболее близкой кругу собственных исследовательских интересов диссертанта и предполагаемой теме (соотнести собственные планы по исследованию темы с ракурсами и форматами, утвердившимися в реальной академической жизни).
Слайд 3Требования к аналитической подборке
1. Она должна включать не меньше 15 и не больше 50 позиций. Позицией (единицей списка) считается мероприятие, на которое физически пришли и с которого ушли люди; при этом следует различать между, допустим, многодневным конгрессом, летней школой и заседанием научного семинара. Все эти мероприятия должны были проходить во временном промежутке не меньше трех месяцев и не больше трех (последних) лет. Если у Вас получается меньше 15 позиций, расширяйте тему или временной промежуток; если больше 50 – пожалуйста, сужайте тему и, соответственно, свой список. Здесь и дальше: «тема»– тема не диссертации, а той включающей в себя диссертационный сюжет конкретной области знания, в рамках которой Вы мониторите научные события.
Слайд 42. Главное требование к подборке: соответствие темы и охвата. В подборке не должно быть мероприятий, которые отстоят от указанной темы очень далеко; с другой стороны, в подборку должны попасть все (по крайней мере, те, которые находятся относительно просто) состоявшиеся в заявленном Вами регионе в обозначенный Вами срок научные мероприятия, имеющие отношение к этой теме.
Слайд 53. Подборка должна быть составлена по материалам как минимум пяти независимых друг от друга ресурсов. Учитывая учебный характер задания, обязательной перепроверки приводимых Вами позиций не требуется (хотя по «гамбургскому счету» это бы совсем не помешало: далеко не всякий заявленный и проанонсированный где-либо семинар осуществляется в действительности; довольно часто одно и то же мероприятие может фигурировать под разными названиями и т.д.). Естественно, имеется в виду не подтверждение каждого мероприятия пятью независимыми друг от друга новостными лентами, но использование для комплектования подборки нескольких ресурсов, не черпающих информацию друг от друга.
Слайд 64. Пожалуйста, параллельно составлению аналитической подборки, ведите протокол того, как Вы это делаете. Какими были алгоритмы поиска, какими ключевыми словами Вы пользовались, как трансформировался Ваш первоначальный список, прибегали ли Вы к каким-то нетривиальным приемам, столкнулись ли с какими-то специфическими трудностями и т.д.? Подтвердили ли результаты исследования Ваши ожидания и предчувствия или, наоборот, полностью опровергли? В протоколе достаточно отмечать самое важное, вам нужно будет успеть охарактеризовать свой подход к выполнению поиска за 2-3 минуты.
Слайд 75. В особенности важно, в какой формат Вы решите упаковывать добываемую информацию (допустим, про себя я знаю, что что бы то ни было я записываю в форме таблицы: в данном случае строчками этой таблицы являлись бы отдельные позиции / мероприятия, а столбцами – их характеристики, получаемые из их описания в Интернете и способные помочь мне, например, придумать в этом ландшафте новый исследовательский семинар, в идеале – одновременно полезный для моего проекта и при этом способный заинтересовать реально существующее сообщество). На итоговом коллоквиуме нужно будет представить, в частности, ту форму, по которой Вы записывали данные о каждом попадающем в Вашу подборку мероприятии.
Слайд 8Примечания:
1) Информация о публикациях в выбранной Вами области, разумеется, может использоваться для анализа, но позицией аналитической подборки является именно физически состоявшееся мероприятие, а не сборник, статья или онлайн-конференция. Можно использовать и аналитические материалы, уже подготовленные кем-либо на близкие темы (допустим, чем живет педагогика высшей школы в Москве). Однако: 1) Вы не обязаны искать и привлекать материалы такого рода; 2) если Вы ими воспользовались, это обязательно должно быть указано. 2) Просьба. Если нетрудно, мониторьте, пожалуйста, время чистой работы над проектом («сидел. Думал о том, что надо поработать – 30 минут. Работал – 20 минут» ). 3) «Стартовый» список, кто какую область гуманитарного знания выбирает для поисков, давайте согласуем уже сейчас, чтобы по возможности избежать дубляжей; дальше эти области, разумеется, будут уточняться.
Слайд 9Предуведомления (к лекции про Интернет-поиск)
Критерий качества тех алгоритмов поиска, которыми Вы пользуетесь – результат и оценка Ваших (исследовательских) проектов. Если Вы и окружающие этими проектами довольны, - значит, можно работать без дополнительных ухищрений, как привыкли. Пока не изменился уровень амбиций и Интернет. Даже успешный поиск достигается разной ценой. Хорошая формулировка запроса – меньше времени на ручной отбор результатов. Я тоже пользуюсь 10 % того, что собираюсь упомянуть. Но знание об этих 90 % - явно полезно. Я буду признателен за любые дополнения этого списка другими полезными ресурсами, ссылками, советами (и презентациями?).
Слайд 10План
Знать, что хочешь найти Какие слова вбивать Куда вбивать ключевые слова Если поиск не удался Содержательная экспертиза результатов поиска То, что находится параллельно поиску. Типы дополнительных ресурсов, обнаруживающиеся через Интернет Вместо резюме: поиск и серфинг
Слайд 111. Знать, что хочешь найти. Специфика Интернета
Информации очень много и она предоставляется (поисковыми машинами и т.п.) очень быстро и очень удобным образом. (основное различие с оффлайн-миром) Информация – какая угодно. Непроверенная, ангажированная, случайная, черновая. Способная ввести в заблуждение относительно квалификации или (отсутствия) интересов автора или ресурса. Редко указываются предшествующие источники информации. Пока Интернет опережает социальный контроль. Следовательно, экспертизу приходится осуществлять пользователю. Информация не обязательно упорядочена и описана в соответствии с логикой и потребностями Вашего исследовательского проекта. Различие логик ранжирования разных поисковых машин, да и составления каталогов. Многоэтажность» обычного поиска "Найти санаторий на Финском заливе, принимающий семьи с детьми двух лет, с хорошими отзывами, низкими ценами и свободными за месяц местами на первую декаду июля 2007 года"
Слайд 12Рекомендация: уже при придумывании поиска четко представлять себе характер разыскиваемого контента:
Общий обзор проблемы Полемика разных точек зрения Детальные экскурсы в проблему, способные предоставить аргументированное обобщение данных для Вашего исследования. Различать поиск «для идей» и поиск «для доводов» Рыскаете ли Вы в поисках новых идей и постановок вопросов, или в поисках данных, которые подтвердили или опровергли бы концепцию? Допустим, для выполнения задания по «интеллектуальному ландшафту» надо ясно понимать, что в первую очередь надо найти новостные ресурсы, извещающие о ближайших и состоявшихся научных мероприятиях
Слайд 13Знать, что хочешь найти. «Модель знаний»
Если представить себе, что Вы мониторите научную активность для того, допустим, чтобы предложить в какой-то области новый научный семинар, вероятно, центральной категорией последующего анализа разумно сделать уже не «новости» и не «мероприятия», а «центры»: какие люди, в каких институциях и благодаря какой мотивации занимаются Возрождением или историей радио. От этого уже будут зависеть столбцы Вашей «таблицы»: по каким параметрам описывается мероприятие («место, время», «организаторы», «следы деятельности в Интернете», «с какими дисциплинами пересекается», «финансирование») и т.п. На первичный поиск (новостных лент о семинарах), строго говоря, не влияет ни то, ни другое. Но на просмотр результатов – уже да, и лучше осознавать, по ячейкам какого шкафа Вы собираетесь раскладывать полученную информацию.
Слайд 14Набор ключевых слов («лучевая схема» abstract’а) нуждается в переводе
Некомпетентность (во всем) библиографов и рубрикаторов каталогов в Интернете. Устаревание исследований и авторов (то, что в 1980-х-2000-х называется “gender”, раньше описывалось как “sexual”). Советы: удобны персоналии и термины. Существительные в именительном падеже. Иностранные языки. Ключевые слова из поля источника и поля методологии. Обязательность слов, которых нет в источнике – опознание своей научной традиции.
«Радиусы» ключевых слов
«работа с литературой» - 10
«научное сообщество», «коммуникация», «научные революции» - 40
Содержание поискового запроса. «Концентрический» принцип
2. Какие слова вбивать
Слайд 15Допустим, ищете текст статьи «О задаче историка» Гумбольдта Что вобьете в поисковую строку? «Скачать» «О задаче историка» «Во всем происходящем действует не воспринимаемая непосредственно идея и что познана эта идея может быть только в пределах самих событий » Хотите узнать, как делается сыр (Яндекс) (история, технология, изготовление) /+1 (сыра, творога) Хотите продать “deformed bars” (Гугл) В поле «с точной фразой» = “deformed bars”, «с любыми словами» = “buy CNF CFR C&F purchase”, «без слов» = “sale”, «время» = «в течение последних трех месяцев». Можно пытаться ограничивать регион, язык, формат.
Слайд 16Синтаксис поискового запроса
Расширенный поиск (цель – сузить зону поиска: точнее указать время появления и редакции документа, язык, доменную область (или даже сайт), формат (например, если ищете xls или ppt). Место на странице (в заголовке или в теле текста), расстояние между поисковыми словами. Булев поиск (логические отношения между поисковыми словами). Сейчас уже чаще не надо писать операторы (“and”, “or”, “not”), а заполняются поля («без слов»). Хотя при помощи операторов Вы можете соорудить сложный запрос, с несколькими уровнями скобок. Поиск «в найденном». У поисковых машин разные синтаксисы. Смотрите на страницы расширенного поиска и на хелпы: http://www.yandex.ru/advanced.html, http://www.yandex.ru/info/compare.html (сравнение поисковых машин), http://www.yandex.ru/info/syntax.html, http://www.google.com/intl/ru/help/features.html, http://www.google.ru/intl/ru/help/interpret.html (экспертиза страницы)
Слайд 17Для примера: советы по поиску в Яндексе - http://www.yandex.ru/ya_detail.html
Проверяйте орфографию Используйте синонимы Ищите больше, чем по одному слову Не пишите большими буквами Найти похожие документы Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку "найти похожие документы". Ссылка расположена под краткими описаниями найденных документов. Яndex проанализирует страницу и найдет документы, похожие на тот, что вы указали. Используйте знаки "+" и "-" "путеводитель по парижу -агентство -тур". Попробуйте использовать язык запросов Искать без морфологии Поиск картинок и фотографий Была еще полезная вещь – трункация: подстановка вместо неизвестных или любых символов искомого слова (допустим, окончаний) специальных символов (чаще всего – «?» = «один любой символ» и «*» = «любое количество символов»). Но с реализацией русской морфологии – исчезла?
Слайд 183. Куда вбивать ключевые слова
Выделяются три типа ресурсов для поиска в Интернет: поисковая машина, каталог, метапоисковая машина (работающая с поисками других машин). ПМ различаются полнотой проиндексированного Веба и принципами индексации, но главное – алгоритмами ранжирования результатов! Поэтому результаты могут быть очень разными. «Полнота» (min. релевантных документов не попало в результаты поиска) и «точность» (min. нерелевантных попало). Вес, который присваивается заголовкам, ключевым словам, htm-тексту, не-htm-тексту. Полнота индексируемых материалов (заголовки, стартовые страницы и уровни вложенности). Списки «тяжелых», «средних» и «легких» слов и разные тактики отношения к ним при запросе (допустим, Вы ищете о переводах на европейские языки E. Schwarz или «Война и мир»). Выбор разных соотношений между релевантностью страницы и ее популярностью (которая тоже может считаться по-разному). Разная рубрикация (см. ниже, «каталоги») Еще важнейший критерий выбора ПМ: комфортность ее использования и наличие подходящих для Вас фишек. Но все равно в важном для Вас исследовании лучше пользоваться хотя бы двумя ПМ.
Слайд 19Примеры фишек Google:
Неспециализированные для ученых: подсказки правописания, калькулятор, поиск карт, картинок, товаров, определений, синонимов и т.п. Ansvers – платные вопросы Специализированные для ученых: http://books.google.com/ и http://print.google.com/ - поиск и покупка книг, бумажных и электронных, с возможностью частичного предварительного ознакомления. http://scholar.google.com/ - поиск только внутри «официального» научного Интернета (журналы и библиотеки с репутацией, кто кого цитирует). Groups - группы новостей (сетевые конференции, конференции, телеконференции). Т.е. тематические обсуждения в Интернете (форумы). News – новости (события), о которых (в т.ч. и давно) писали разные авторы и ресурсы. Высокая степень персонализации: Google desktop (ну очень медленно индексирует!), история поисков, настройка панели виджетов, можно пытаться агрегировать новостные ленты (http://www.google.com/reader/) и т.п. www.google.com/alerts - можно заказать (ежедневные) оповещения электронной почтой: например, с новостями на определенную тему или, допустим, заставить Гугл регулярно проводить интересующий Вас сложный поиск. Учитывать ли (как и при рассылках) рекламу, замусоривание ящика… Ситуация на рынке поисковых машин все время меняется!
Слайд 204. Если поиск не принес результата
Если хорошие результаты есть, но их недостаточно: Можно поискать кнопки «Еще с сайта», «Показать похожие», «Similar» и т.п. Обязательно стоит посмотреть «карту сайта», который Вам понравился. Контент может оказаться полезным даже при несовпадении ключевых слов. Некоторые из кнопок выше высвечиваются, только если поставить соответствующие настройки поиска. ПМ могут соответствовать определенные каталоги (http://list.mail.ru/index.html, http://yaca.yandex.ru/yca/cat, http://www.dmoz.org/). ПМ могут показывать рубрику каталога
Если результаты вообще не годятся Прежде чем начинать поиск с новыми словами, есть смысл проанализировать результаты экспертизы (http://www.google.ru/intl/ru/help/interpret.html, http://help.yandex.ru/search/?id=481937). Иногда анализ статистики слов позволяет понять, как можно переформулировать запрос.
Не надейтесь на интеллект поисковых машин! Если, например, поиск принес Вам запись нужного типа, но только одну, вбейте именно ее в поисковую строку – найдите сайты, которые ее упоминают. Думайте!
Слайд 21Содержательная экспертиза результатов поиска
Опубликованному в Интернете опасно доверять: Ошибочные, базирующиеся на недостаточной, недостоверной или непроверенной информации, устарелые, не учитывающие возможных возражений, с отсутствующей аргументацией, идеологически и коммерчески ангажированные… Вопросы, которые надо поставить сомнительному ресурсу: Какова цель ведения ресурса, кто отвечает (по содержанию) за ведение сайта (как туда попадает информация), как происходит обновление и правка, подтверждается ли информация независимыми (т.е. не копирующими информацию друг у друга) ресурсами? Составить впечатление о ресурсе: Тон и стилистика, манера обобщений, возможность коммерческой или политической выгоды, манера обращений с позициями оппонентов, наличие и характер цитирования (в т.ч. и онлайн), отношение к копирайту… Разумеется, надежнее Интернет-представительства оффлайн-ресурсов. Хотя…
Слайд 225. Что еще можно найти / искать в Интернет?
То, что есть в офф-лайне. Полнотекстовые ресурсы Электронные библиотеки Каталоги офф-лайн библиотек (www.sigla.ru) В т.ч.: http://liber.rsuh.ru/section.html?id=681 (в т.ч. EBSCO, JSTOR и т.д.) http://www.ub.ruhr-uni-bochum.de/ То, что есть только / по преимуществу в офф-лайне Ресурсы, связанные с людьми и их деятельностью (применительно к гуманитарным исследованиям – часто бывает очень полезно искать программы курсов, а потом списываться с их участниками). Фонды, гранты, конкурсы и т.п. То, что есть только в онлайне Ресурсы самого Интернет – больше 80 % информации. Рейтинги, ссылки, гостевые, переписка, блоги, чаты, поисковые запросы. Рассылки. Критерий (ощущения) принадлежности к научному сообществу - http://www.h-net.org/lists/ (поиск: http://www.h-net.org/logsearch/). Кэш-копии (сохранившиеся в поисковых системах копии уже снятых страниц) Хороший сайт: http://sites.google.com/site/khitrov/Home
Слайд 23«Видимый» и «невидимый» (неиндексированный) Интернет
Кузнецов С. Как вести бизнес-разведку в «невидимом» интернете - http://www.rususa.com/news/news.asp-nid-21056-catid-2 базы данных (в т.ч. библиографические записи) и прочие неформаты страницы глубокой вложенности ответы на динамическую информацию (т.е. все, где пользователь что-то должен ввести, простыми поисковиками не индексируется) с момента прошедшего индексирования (как правило, несколько месяцев) соотношения между сайтами и т.д. Если чего-то нет в Интернете, это не означает, что этого не было
Слайд 24Выбирать – ОРАС (Katalogrecherche ohne Anmeldung)
Слайд 25Ресурс, которым я пользовался при подготовке презентации:
Презентация «Conducting Online Research» - http://owl.english.purdue.edu/owl/resource/558/1. Сайт в целом: http://owl.english.purdue.edu/sitemap/ - много по academic writing, очень полезно также для изучения «функционального английского». Порядка 750 хендаутов и презентаций The Writing Process Professional, Technical, and Job Search Writing General Academic Writing Research and Citation Grammar and Mechanics English as a Second Language (ESL) Internet Literacy Writing in the Social Sciences Writing in Engineering Literary Analysis and Criticism Creative Writing Teaching Writing Tutoring Writing About the OWL at Purdue
Слайд 26Вместо резюме: поиск и серфинг
Взаимодополняющие логики нахождения ресурсов: поиск (Вы предписываете машине, что она должна показать) и серфинг (Вы идете по ссылкам, которые предлагает машина). При серфинге – не забывать о поиске! (да и наоборот) Параллельно поиску (и серфингу) – продолжайте пополнять «Избранное» (на десктопе, в системе закладок, на бумаге). Аннотируйте, обязательно давайте названия. Так же, как ведение библиографических записей параллельно чтению. Как и практически во всех аспектах осуществления (научного) проекта: сосуществование «линейной» и «циклической» временных разверток. «Выбираю тему - знакомлюсь с литературой - распиливаю источник - составляю план - пишу – редактирую» vs. «перечитываю свой текст - доподчитываю литературу - переопределяю тему» и т.д. Эта двухфазность должна не повергать в шок, а быть предметом контроля. Иными словами: план непременно нарушится, но это нарушение нужно запланировать. Серфинг обязательно отвлечет Вас, но от этого отвлечения нужно будет вернуться.