- Кластерный анализ и информационный поиск

Презентация "Кластерный анализ и информационный поиск" (9 класс) по информатике – проект, доклад

Слайд 1
Слайд 2
Слайд 3
Слайд 4
Слайд 5
Слайд 6
Слайд 7
Слайд 8
Слайд 9
Слайд 10

Презентацию на тему "Кластерный анализ и информационный поиск" (9 класс) можно скачать абсолютно бесплатно на нашем сайте. Предмет проекта: Информатика. Красочные слайды и иллюстрации помогут вам заинтересовать своих одноклассников или аудиторию. Для просмотра содержимого воспользуйтесь плеером, или если вы хотите скачать доклад - нажмите на соответствующий текст под плеером. Презентация содержит 10 слайд(ов).

Слайды презентации

© ElVisti. Лекция 7 “Кластерный анализ и информационный поиск”. Дмитрий Владимирович ЛАНДЭ. МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ
Слайд 1

© ElVisti

Лекция 7 “Кластерный анализ и информационный поиск”

Дмитрий Владимирович ЛАНДЭ

МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ

Понятие «кластерного анализа». Пример кластеров сайтов - «групп подобия по контенту» (www touchgraph.com). Кластерный анализ - метод группировки экспериментальных данных в классы. Наблюдения, попавшие в один класс, в некотором смысле ближе друг к другу, чем к наблюдениям из других классов. (Глоссари
Слайд 2

Понятие «кластерного анализа»

Пример кластеров сайтов - «групп подобия по контенту» (www touchgraph.com)

Кластерный анализ - метод группировки экспериментальных данных в классы. Наблюдения, попавшие в один класс, в некотором смысле ближе друг к другу, чем к наблюдениям из других классов. (Глоссарий.ru)

Понятие информационного портрета. Портрет - модель реального объекта, выраженную его наиболее узнаваемыми чертами. Информационный портрет документа - статистически значимая совокупность информационных характеристик. В качестве информационного портрета темы можно рассматривать множество ключевых слов
Слайд 3

Понятие информационного портрета

Портрет - модель реального объекта, выраженную его наиболее узнаваемыми чертами. Информационный портрет документа - статистически значимая совокупность информационных характеристик. В качестве информационного портрета темы можно рассматривать множество ключевых слов, наиболее точно (по статистическим и смысловым алгоритмам) отражающее информацию, соответствующую данной теме. Тематической рубрике соответствует ее информационный портрет: Pi = { vij}, (j=1,..,K), где vij –весовой коэффициент, соответствующий j-му терм, K - количество термов в словаре системы.

Взвешивание потока документов в пространстве информационного портрета. М = {mij} (i = 1,..,N; j = 1,..,K) - матрица соответствия потока документов D информационному портрету l. D={di} {i=1,K}. di – определяется как TF*IDF. Близость D и Pi – sim(D, Pi) – скалярное произведение K-мерных векторов. Алго
Слайд 4

Взвешивание потока документов в пространстве информационного портрета

М = {mij} (i = 1,..,N; j = 1,..,K) - матрица соответствия потока документов D информационному портрету l. D={di} {i=1,K}. di – определяется как TF*IDF. Близость D и Pi – sim(D, Pi) – скалярное произведение K-мерных векторов. Алгоритм взвешивания:

Латентное семантическое индексирование. Метод кластерного анализа LSI (латентного семантического индексирования), базируется на сингулярном разложении матриц (SVD). Сингулярным разложением матрицы A называется ее разложение вида A=USVT, где U и V – ортогональные матрицы, а S – диагональная матрица,
Слайд 5

Латентное семантическое индексирование

Метод кластерного анализа LSI (латентного семантического индексирования), базируется на сингулярном разложении матриц (SVD). Сингулярным разложением матрицы A называется ее разложение вида A=USVT, где U и V – ортогональные матрицы, а S – диагональная матрица, элементы которой sij = 0, если i не равно j, а siі >= 0. В рассматриваемом примере (таблиц взаимосвязей) матрица А = МT М – квадратная, однако метод LSI применяется и к прямоугольным матрицам, но в этих случаях размерность матрицы S соответствует рангу матрицы А. В соответствии с методом LSI в рассмотрение берутся k наибольших сингулярных значений, а каждому такому сингулярному значению матрицы А соответствует кластер взаимосвязанных документов. А аппроксимируется матрицей Ak = Σ ui sii viT. Метод LSI применим и к ранжированию выдачи информационно-поисковых систем, основанному на цитировании. Это алгоритм HITS (Hyperlink Induced Topic Search) – один из двух самых популярных на сегодня в области информационного поиска. Ввиду своей вычислительной трудоемкости (равной O(N2), N – размерность А), этот метод LSI применяется только для относительно небольших матриц.

Взаимосвязь тем и метод k-means. Суть алгоритма k-means: случайным образом выбирается k векторов-строк, которые определяются как центроиды кластеров. Затем k кластеров наполняются – для каждого из оставшихся векторов-строк определяется близость к центроиду соответствующего кластера. После этого вект
Слайд 6

Взаимосвязь тем и метод k-means

Суть алгоритма k-means: случайным образом выбирается k векторов-строк, которые определяются как центроиды кластеров. Затем k кластеров наполняются – для каждого из оставшихся векторов-строк определяется близость к центроиду соответствующего кластера. После этого вектор-строка приписывается к тому кластеру, к которому он наиболее близок. После этого строки-векторы перегруппируются. Затем для каждого из новых кластеров заново определяется центроид. После этого заново выполняется процесс наполнения кластеров и т. д., пока процесс не стабилизируется или не зациклится.

Группировка тем метод k-means. В отличие от метода LSI, k-means идеально подходит для кластеризации динамических информационных потоков. Укрупнение рубрик – актуальная задача кластерного анализа и она может быть решена путем их группировки по признакам подобия. Выделение групп взаимосвязанных рубрик
Слайд 7

Группировка тем метод k-means

В отличие от метода LSI, k-means идеально подходит для кластеризации динамических информационных потоков. Укрупнение рубрик – актуальная задача кластерного анализа и она может быть решена путем их группировки по признакам подобия. Выделение групп взаимосвязанных рубрик методом кластерного анализа k-means:

Метод, основанный на применении сетевого подхода - выявление сюжетов
Слайд 8

Метод, основанный на применении сетевого подхода - выявление сюжетов

Построение адаптивных интерфейсов уточнения запросов
Слайд 9

Построение адаптивных интерфейсов уточнения запросов

Спасибо за внимание! Ландэ Д.В dwl@visti.net http://poiskbook.kiev.ua. МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Киев, Украина
Слайд 10

Спасибо за внимание!

Ландэ Д.В dwl@visti.net http://poiskbook.kiev.ua

МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Киев, Украина

Список похожих презентаций

Системный анализ ГИС

Системный анализ ГИС

Многие разработчики автоматизированных систем не совсем уверенно могут дать ответ на вопрос, относятся ли системы к классу ГИС или нет. Это обусловлено ...
Многомерный анализ данных на основе Oracle Essbase

Многомерный анализ данных на основе Oracle Essbase

Oracle OLAP Oracle Data Mining Oracle Partitioning Oracle Warehouse Builder. ХРАНИЛИЩА И ВИТРИНЫ ДАННЫХ. ИНСТРУМЕНТЫ БИЗНЕС-АНАЛИЗА и ОТЧЁТНОСТИ. ...
Первичный анализ и обработка данных

Первичный анализ и обработка данных

1. Распределения, их виды и характеристики 2. Оценка сильно отклоняющихся значений 3. Основные параметры совокупности – средняя, арифметическая, ошибка ...
Компьютеры и здоровье: анализ совместимости

Компьютеры и здоровье: анализ совместимости

Мама, а что это за заросший дядя с красными глазками? - А, так это наш папа, дочка, к интернету подключился... (Из рекламы ISP). По сей день идут ...
Документ как информационный объект

Документ как информационный объект

Документ как информационный объект. Документ – это деловая бумага, подтверждающая какой-либо факт или право на что-то. документ. В виде «твёрдой копии». ...
Дискретный анализ

Дискретный анализ

Перестановки. Пусть задано множество из n элементов. Упорядочение этих элементов называется перестановкой. Иногда добавляют «из n элементов». Обычно ...
Упорядочивание и поиск (в Интернете) информации

Упорядочивание и поиск (в Интернете) информации

Задание на коллоквиум 11 декабря. Составление аналитической подборки. Цели: 1) отработать навыки по поиску информации в Интернете; продемонстрировать ...
Динамический анализ в MSC

Динамический анализ в MSC

Corporate MSC.Software Corporation 815 Colorado Boulevard Los Angeles, CA 90041-1777 Telephone: (323) 258-9111 or (800) 336-4858 FAX: (323) 259-3638 ...
Microsoft Access. Сортировка и поиск записей в БД

Microsoft Access. Сортировка и поиск записей в БД

При открытии таблицы, программа Access выводит записи в последовательности, определенной значениями первичного ключа этой таблицы (одно или несколько ...
Фрагментированное программирование

Фрагментированное программирование

Цель работы. Распараллеливание исполнительной системы (ИС) фрагментированного программирования и её оптимизация. Постановка задачи. Разработка многопоточной ...
Тест Алгоритмизация и программирование

Тест Алгоритмизация и программирование

В этой презентации приводятся тренировочные задания из нескольких источников: открытого сегмента федерального банка тестовых заданий, демонстрационных ...
Физика + информатика

Физика + информатика

? Цель работы на уроке: исследовать объект окружающей среды средствами информатики и физики. «Человек без всякого воображения может собирать факты, ...
Социальная информатика

Социальная информатика

Социальная информатика - это наука, изучающая комплекс проблем, связанных с прохождением информационных процессов в социуме. Один из основоположников ...
Социальная информатика

Социальная информатика

Социальная информатика - это про что? Обратимся к предметной области Информатикa. Социальная информатика. Информационные ресурсы как фактор социально-экономического ...
Алгоритмизация и программирование в Pascal

Алгоритмизация и программирование в Pascal

Вводная часть. Процесс решения задачи на ПК – это совместная деятельность человека и машины. Его условно можно разделить на несколько этапов. Человеку ...
Прикладная информатика

Прикладная информатика

Профессиональный стандарт. Исследователь в сфере ИТ - Computer and Information Scientist, Research Программист - Computer Programmer Системный архитектор ...
Объектно-ориентированное программирование

Объектно-ориентированное программирование

основано на принципах логического вывода из базы знаний – фактов и правил. Логическое программирование. основано на принципе последовательной детализации ...
Объекты и их свойства информатика

Объекты и их свойства информатика

Объект - ЯБЛОКО красное круглое вкусное висит съедается продается зеленое кислое. о нем рассказывают. Объект - КНИГА листать читать. закрывать закладывать. ...
Нелинейное программирование

Нелинейное программирование

Отличия от ЗЛП: 1. ОДЗ не обязательно выпуклая. 2. Экстремум не обязан находится на границе ОДЗ. - задача классической оптимизации. Пример:. . Метод ...
Объектно-ориентированное программирование

Объектно-ориентированное программирование

Содержание:. Графы: определения и примеры Ориентированные графы Путь в орграфе Матрица смежности Иерархический список Алгоритм Дейкстры Программа ...

Конспекты

Эффективный поиск в Интернет

Эффективный поиск в Интернет

Муниципальное общеобразовательное учреждение. «Средняя общеобразовательная школа №4 г.Ртищево Саратовской области». Конспект ...
Хранение, поиск и сортировка информации

Хранение, поиск и сортировка информации

Конспект урока по теме «Хранение, поиск и сортировка информации». Практическая работа №15 Создание и редактирование базы данных «Записная книжка». ...
Сбор и анализ статистических данных

Сбор и анализ статистических данных

Урок для 8 класса по теме. . «Сбор и анализ статистических данных». Бурякова Вера Николаевна, учитель математики ГБОУ ООШ с. Малое Ибряйкино ...
Сортировка и поиск данных в электронных таблицах

Сортировка и поиск данных в электронных таблицах

МОУ «Бендерская средняя общеобразовательная школа №13». Открытый урок. . по информатике и ИКТ. . в 9 Б классе. . по теме:. ...
Динамические (электронные) таблицы как информационный объект

Динамические (электронные) таблицы как информационный объект

Предмет: Информатика и ИКТ. Тема программы. : Динамические (электронные) таблицы как информационный объект . . Курс II. . . Профессия “Повар, ...

Советы как сделать хороший доклад презентации или проекта

  1. Постарайтесь вовлечь аудиторию в рассказ, настройте взаимодействие с аудиторией с помощью наводящих вопросов, игровой части, не бойтесь пошутить и искренне улыбнуться (где это уместно).
  2. Старайтесь объяснять слайд своими словами, добавлять дополнительные интересные факты, не нужно просто читать информацию со слайдов, ее аудитория может прочитать и сама.
  3. Не нужно перегружать слайды Вашего проекта текстовыми блоками, больше иллюстраций и минимум текста позволят лучше донести информацию и привлечь внимание. На слайде должна быть только ключевая информация, остальное лучше рассказать слушателям устно.
  4. Текст должен быть хорошо читаемым, иначе аудитория не сможет увидеть подаваемую информацию, будет сильно отвлекаться от рассказа, пытаясь хоть что-то разобрать, или вовсе утратит весь интерес. Для этого нужно правильно подобрать шрифт, учитывая, где и как будет происходить трансляция презентации, а также правильно подобрать сочетание фона и текста.
  5. Важно провести репетицию Вашего доклада, продумать, как Вы поздороваетесь с аудиторией, что скажете первым, как закончите презентацию. Все приходит с опытом.
  6. Правильно подберите наряд, т.к. одежда докладчика также играет большую роль в восприятии его выступления.
  7. Старайтесь говорить уверенно, плавно и связно.
  8. Старайтесь получить удовольствие от выступления, тогда Вы сможете быть более непринужденным и будете меньше волноваться.

Информация о презентации

Ваша оценка: Оцените презентацию по шкале от 1 до 5 баллов
Дата добавления:16 марта 2019
Категория:Информатика
Содержит:10 слайд(ов)
Поделись с друзьями:
Скачать презентацию
Смотреть советы по подготовке презентации